우분투에 Mecab(은전한닢) 형태소 분석기를 설치하는 방법입니다.
Mecab 메카브 간략 설명
Mecab를 간단히 설명하면
- Mecab은 C++로 만든 일본어 형태소분석기입니다.
- Mecab-ko는 Mecab를 고쳐서 만든 한국어형태소분기이며 “은전한닢”라고 부릅니다.
예전 포스트가 있니 참고하세요.
MeCab 형태소 분석기, 형태소분석기란 무엇인가? 워드세그멘터와 형태소분석기
설치방법
Mecab-Ko는 Mecab 코어 모듈과 Mecab-ko-dic을 먼저 설치해야 하는데 번거롭습니다.
konlpy에 있는 간략 스크립트를 쓰면 쉽게 설치가능합니다.
sudo apt-get install curl git
$ bash <(curl -s https://raw.githubusercontent.com/konlpy/konlpy/master/scripts/mecab.sh)
Mecab만으로는 형태소분석을 테스트하거나 활용하기 어려우니 Python 모듈도 설치해줍니다.
# python3.10은 아직 문제가 있으니 안전하게 조금 오래된 버전으로 간다.
# python3.10 -m pip install mecab-python3
python3.8 -m pip install mecab-python3
파이썬을 실행해서 테스트 해봅니다.
mecab = Mecab()
' '.join(mecab.morphs("무궁화꽃이피었습니다."))
# '무궁화 꽃 이 피 었 습니다 .'