MeCab和NEologd的安装方法(CentOS6/CentOS7)

MeCab是用于进行词素分析的库。
NEologd是一个针对从网络上获取的新词进行更新的MeCab系统词典,每周都会更新。
使用这两个工具可以进行与最新单词相对应的词素分析!

Group.png

安装确认环境

・桜VPS的CentOS6
・AWSEc2的CentOS7

安装 MeCab

官方网站
http://taku910.github.io/mecab/

下载的事物

スクリーンショット 2016-11-25 4.13.40.png

在服务器上安装两个。

-mecab-0.996.tar.gz 和 mecab-ipadic-2.7.0-20070801.tar.gz 是需要解壓縮的兩個下載檔案。
如果使用命令行進行解壓縮,可以使用以下命令進行解壓縮。

tar xvzf mecab-0.996.tar.gz
tar xvzf mecab-ipadic-2.7.0-20070801.tar.gz
mecab-0.996フォルダ
mecab-ipadic-2.7.0-20070801フォルダ

 

安装mecab-0.996

cd /usr/local/src/mecab-0.996
sudo ./configure 
sudo make -j4
sudo make install

安装 mecab-ipadic-2.7.0-20070801。

cd /usr/local/src/mecab-ipadic-2.7.0-20070801
sudo ./configure 
sudo make -j4
sudo make install

糟糕!

请尝试使用下面的命令进行确认!

mecab -v
mecab of 0.996

执行测试

echo "ピコ太郎さんはカナブンに角をつけてカブトムシとして売るバイトをしている" | mecab
ピコ   名詞,固有名詞,一般,*,*,*,ピコ,ピコ,ピコ
太郎  名詞,固有名詞,人名,名,*,*,太郎,タロウ,タロー
さん  名詞,接尾,人名,*,*,*,さん,サン,サン
は 助詞,係助詞,*,*,*,*,は,ハ,ワ
カナブン    名詞,一般,*,*,*,*,カナブン,カナブン,カナブン
に 助詞,格助詞,一般,*,*,*,に,ニ,ニ
角 名詞,一般,*,*,*,*,角,カク,カク
を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
つけ  動詞,自立,*,*,一段,連用形,つける,ツケ,ツケ
て 助詞,接続助詞,*,*,*,*,て,テ,テ
カブトムシ 名詞,一般,*,*,*,*,カブトムシ,カブトムシ,カブトムシ
として   助詞,格助詞,連語,*,*,*,として,トシテ,トシテ
売る  動詞,自立,*,*,五段・ラ行,基本形,売る,ウル,ウル
バイト   名詞,一般,*,*,*,*,バイト,バイト,バイト
を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
し 動詞,自立,*,*,サ変・スル,連用形,する,シ,シ
て 助詞,接続助詞,*,*,*,*,て,テ,テ
いる  動詞,非自立,*,*,一段,基本形,いる,イル,イル
EOS

安装 NEologd

neologd-logo-September2016.png

GitHub公式网址https://github.com/neologd/mecab-ipadic-neologd/blob/master/README.ja.md

sudo rpm -ivh http://packages.groonga.org/centos/groonga-release-1.1.0-1.noarch.rpm
sudo yum install mecab mecab-devel mecab-ipadic git make curl xz

下载NEologd

cd /usr/local/src/
git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git
cd mecab-ipadic-neologd

安装Neologd

./bin/install-mecab-ipadic-neologd -n

如果发生以下错误,则表示内存不足:在抛出’std::bad_alloc’实例之后调用。
请参考此官方参考文献中的“如果可用内存空间不足”部分,取消安装某些数据。
https://github.com/neologd/mecab-ipadic-neologd/blob/master/README.ja.md

查找密码

echo mecab-config --dicdir"/mecab-ipadic-neologd"

 

/usr/local/lib/mecab/dic/mecab-ipadic-neologd

执行测试

如果在执行时添加了获取的路径后面的-d,它将引用neologd。

echo "ピコ太郎さんはカナブンに角をつけてカブトムシとして売るバ イトをしている" | mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd
ピコ太郎   名詞,固有名詞,人名,一般,,,ピコ太郎,ピコタロウ,ピコタロー
さん  名詞,接尾,人名,,,,さん,サン,サン
は 助詞,係助詞,,,,,は,ハ,ワ
カナブン    名詞,一般,,,,,カナブン,カナブン,カナブン
に 助詞,格助詞,一般,,,,に,ニ,ニ
角 名詞,一般,,,,,角,カク,カク
を 助詞,格助詞,一般,,,,を,ヲ,ヲ
つけ  動詞,自立,,,一段,連用形,つける,ツケ,ツケ
て 助詞,接続助詞,,,,,て,テ,テ
カブトムシ 名詞,一般,,,,,カブトムシ,カブトムシ,カブトムシ
として   助詞,格助詞,連語,,,,として,トシテ,トシテ
売る  動詞,自立,,,五段・ラ行,基本形,売る,ウル,ウル
バイト   名詞,一般,,,,,バイト,バイト,バイト
を 助詞,格助詞,一般,,,,を,ヲ,ヲ
し 動詞,自立,,,サ変・スル,連用形,する,シ,シ
て 助詞,接続助詞,,,,,て,テ,テ
いる  動詞,非自立,,*,一段,基本形,いる,イル,イル
EOS

可能会一起使用的链接。

在CentOS6.7上安装Python3+OpenCV3(+ffmpeg)
链接:http://qiita.com/sarumonera/items/ab661b378f5a47c1f282

广告
将在 10 秒后关闭
bannerAds