우분투에 Mecab(은전한닢) 형태소 분석기를 설치하는 방법입니다.
Mecab 메카브 간략 설명
Mecab를 간단히 설명하면
- Mecab은 C++로 만든 일본어 형태소분석기입니다.
- Mecab-ko는 Mecab를 고쳐서 만든 한국어형태소분기이며 “은전한닢”라고 부릅니다.
예전 포스트가 있니 참고하세요.
MeCab 형태소 분석기, 형태소분석기란 무엇인가? 워드세그멘터와 형태소분석기
설치방법
Mecab-Ko는 Mecab 코어 모듈과 Mecab-ko-dic을 먼저 설치해야 하는데 번거롭습니다.
konlpy에 있는 간략 스크립트를 쓰면 쉽게 설치가능합니다.
1 2 3 4 |
sudo apt-get install curl git $ bash <(curl -s https://raw.githubusercontent.com/konlpy/konlpy/master/scripts/mecab.sh) |
Mecab만으로는 형태소분석을 테스트하거나 활용하기 어려우니 Python 모듈도 설치해줍니다.
1 2 3 4 5 |
# python3.10은 아직 문제가 있으니 안전하게 조금 오래된 버전으로 간다. # python3.10 -m pip install mecab-python3 python3.8 -m pip install mecab-python3 |
파이썬을 실행해서 테스트 해봅니다.
1 2 3 4 5 |
mecab = Mecab() ' '.join(mecab.morphs("무궁화꽃이피었습니다.")) # '무궁화 꽃 이 피 었 습니다 .' |