반응형
한국어 형태소 분석을 위해서는 KoNLPy 라이브러리를 사용할 수 있습니다.
KoNLPy는 파이썬에서 한국어 형태소 분석을 위한 대표적인 라이브러리 중 하나입니다.
KoNLPy를 사용하면 형태소 분석, 구문 분석, 개체명 인식 등의 작업을 수행할 수 있습니다.
다음은 KoNLPy를 사용하여 한국어 형태소 분석을 수행하는 예시 코드입니다.
python
from konlpy.tag import Okt
okt = Okt()
text = "한국어 형태소 분석을 해보자"
morphs = okt.morphs(text)
print(morphs)
pos = okt.pos(text)
print(pos)
nouns = okt.nouns(text)
print(nouns)
위 코드에서는 Okt 클래스를 사용하여 한국어 형태소 분석을 수행하고 있습니다.
morphs() 메서드는 문장을 형태소 단위로 분리한 결과를 반환하며, pos() 메서드는 문장을 형태소 단위로 분리한 후 각 형태소에 대해 품사를 부착한 결과를 반환합니다.
nouns() 메서드는 문장에서 명사만 추출한 결과를 반환합니다.
위 코드를 실행하면 다음과 같은 결과가 출력됩니다.
['한국어', '형태소', '분석', '을', '해보자']
[('한국어', 'Noun'), ('형태소', 'Noun'), ('분석', 'Noun'), ('을', 'Josa'), ('해보자', 'Verb')]
['한국어', '형태소', '분석']
위 결과에서 morphs() 메서드의 결과는 각 형태소가 리스트의 원소로 저장된 형태로 출력되고, pos() 메서드의 결과는 각 형태소와 해당 형태소의 품사가 튜플의 형태로 저장된 리스트로 출력됩니다.
nouns() 메서드의 결과는 문장에서 추출된 명사만 리스트의 형태로 출력됩니다.
Okt 외에도 Kkma 클래스를 사용할 수 있습니다.
from konlpy.tag import Kkma
kkma = Kkma()
text = "한국어를 분석하는 코드를 만들고 있습니다."
nouns = kkma.nouns(text)
print(nouns)
위 코드는 KoNLPy의 Kkma 모듈을 사용하여 주어진 텍스트에서 명사를 추출하는 예시입니다.
반응형
'데이터 분석 > 데이터 분석 방법' 카테고리의 다른 글
데이터를 활용한 상품 추천 (0) | 2023.02.23 |
---|---|
[감성 분석(4)] 한국어 감성사전을 활용한 문장 감성점수 평가(샘플 코드) (0) | 2023.02.23 |
[감성 분석(3)] 머신러닝 자연어 처리 한국어 감성분석 방법(샘플 코드) (1) | 2023.02.23 |
[감성 분석(2)] 형태소 분석기를 활용한 감성분석 기법(샘플코드 포함) (0) | 2023.02.23 |
문장에서 키워드 단어 추출 방법(머신러닝 전처리) (0) | 2023.02.22 |