데이터 분석/데이터 분석 방법

[감성 분석(1)] 한국어 형태소 분석

Family in August 2023. 2. 22. 16:16
반응형

한국어 형태소 분석을 위해서는 KoNLPy 라이브러리를 사용할 수 있습니다.

KoNLPy는 파이썬에서 한국어 형태소 분석을 위한 대표적인 라이브러리 중 하나입니다.
KoNLPy를 사용하면 형태소 분석, 구문 분석, 개체명 인식 등의 작업을 수행할 수 있습니다.
다음은 KoNLPy를 사용하여 한국어 형태소 분석을 수행하는 예시 코드입니다.

python

from konlpy.tag import Okt

okt = Okt()

text = "한국어 형태소 분석을 해보자"
morphs = okt.morphs(text)
print(morphs)

pos = okt.pos(text)
print(pos)

nouns = okt.nouns(text)
print(nouns)


위 코드에서는 Okt 클래스를 사용하여 한국어 형태소 분석을 수행하고 있습니다.
morphs() 메서드는 문장을 형태소 단위로 분리한 결과를 반환하며, pos() 메서드는 문장을 형태소 단위로 분리한 후 각 형태소에 대해 품사를 부착한 결과를 반환합니다.
nouns() 메서드는 문장에서 명사만 추출한 결과를 반환합니다.

위 코드를 실행하면 다음과 같은 결과가 출력됩니다.


['한국어', '형태소', '분석', '을', '해보자']
[('한국어', 'Noun'), ('형태소', 'Noun'), ('분석', 'Noun'), ('을', 'Josa'), ('해보자', 'Verb')]
['한국어', '형태소', '분석']

위 결과에서 morphs() 메서드의 결과는 각 형태소가 리스트의 원소로 저장된 형태로 출력되고, pos() 메서드의 결과는 각 형태소와 해당 형태소의 품사가 튜플의 형태로 저장된 리스트로 출력됩니다.
nouns() 메서드의 결과는 문장에서 추출된 명사만 리스트의 형태로 출력됩니다.

Okt 외에도 Kkma 클래스를 사용할 수 있습니다.

from konlpy.tag import Kkma

kkma = Kkma()

text = "한국어를 분석하는 코드를 만들고 있습니다."
nouns = kkma.nouns(text)

print(nouns)


위 코드는 KoNLPy의 Kkma 모듈을 사용하여 주어진 텍스트에서 명사를 추출하는 예시입니다.



반응형