MeCab和NEologd的安装方法(CentOS6/CentOS7)
MeCab是用于进行词素分析的库。
NEologd是一个针对从网络上获取的新词进行更新的MeCab系统词典,每周都会更新。
使用这两个工具可以进行与最新单词相对应的词素分析!
安装确认环境
・桜VPS的CentOS6
・AWSEc2的CentOS7
安装 MeCab
官方网站
http://taku910.github.io/mecab/
下载的事物
在服务器上安装两个。
-mecab-0.996.tar.gz 和 mecab-ipadic-2.7.0-20070801.tar.gz 是需要解壓縮的兩個下載檔案。
如果使用命令行進行解壓縮,可以使用以下命令進行解壓縮。
tar xvzf mecab-0.996.tar.gz
tar xvzf mecab-ipadic-2.7.0-20070801.tar.gz
mecab-0.996フォルダ
mecab-ipadic-2.7.0-20070801フォルダ
安装mecab-0.996
cd /usr/local/src/mecab-0.996
sudo ./configure
sudo make -j4
sudo make install
安装 mecab-ipadic-2.7.0-20070801。
cd /usr/local/src/mecab-ipadic-2.7.0-20070801
sudo ./configure
sudo make -j4
sudo make install
糟糕!
请尝试使用下面的命令进行确认!
mecab -v
mecab of 0.996
执行测试
echo "ピコ太郎さんはカナブンに角をつけてカブトムシとして売るバイトをしている" | mecab
ピコ 名詞,固有名詞,一般,*,*,*,ピコ,ピコ,ピコ
太郎 名詞,固有名詞,人名,名,*,*,太郎,タロウ,タロー
さん 名詞,接尾,人名,*,*,*,さん,サン,サン
は 助詞,係助詞,*,*,*,*,は,ハ,ワ
カナブン 名詞,一般,*,*,*,*,カナブン,カナブン,カナブン
に 助詞,格助詞,一般,*,*,*,に,ニ,ニ
角 名詞,一般,*,*,*,*,角,カク,カク
を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
つけ 動詞,自立,*,*,一段,連用形,つける,ツケ,ツケ
て 助詞,接続助詞,*,*,*,*,て,テ,テ
カブトムシ 名詞,一般,*,*,*,*,カブトムシ,カブトムシ,カブトムシ
として 助詞,格助詞,連語,*,*,*,として,トシテ,トシテ
売る 動詞,自立,*,*,五段・ラ行,基本形,売る,ウル,ウル
バイト 名詞,一般,*,*,*,*,バイト,バイト,バイト
を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
し 動詞,自立,*,*,サ変・スル,連用形,する,シ,シ
て 助詞,接続助詞,*,*,*,*,て,テ,テ
いる 動詞,非自立,*,*,一段,基本形,いる,イル,イル
EOS
安装 NEologd
GitHub公式网址https://github.com/neologd/mecab-ipadic-neologd/blob/master/README.ja.md
sudo rpm -ivh http://packages.groonga.org/centos/groonga-release-1.1.0-1.noarch.rpm
sudo yum install mecab mecab-devel mecab-ipadic git make curl xz
下载NEologd
cd /usr/local/src/
git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git
cd mecab-ipadic-neologd
安装Neologd
./bin/install-mecab-ipadic-neologd -n
如果发生以下错误,则表示内存不足:在抛出’std::bad_alloc’实例之后调用。
请参考此官方参考文献中的“如果可用内存空间不足”部分,取消安装某些数据。
https://github.com/neologd/mecab-ipadic-neologd/blob/master/README.ja.md
查找密码
echo mecab-config --dicdir"/mecab-ipadic-neologd"
/usr/local/lib/mecab/dic/mecab-ipadic-neologd
执行测试
如果在执行时添加了获取的路径后面的-d,它将引用neologd。
echo "ピコ太郎さんはカナブンに角をつけてカブトムシとして売るバ イトをしている" | mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd
ピコ太郎 名詞,固有名詞,人名,一般,,,ピコ太郎,ピコタロウ,ピコタロー
さん 名詞,接尾,人名,,,,さん,サン,サン
は 助詞,係助詞,,,,,は,ハ,ワ
カナブン 名詞,一般,,,,,カナブン,カナブン,カナブン
に 助詞,格助詞,一般,,,,に,ニ,ニ
角 名詞,一般,,,,,角,カク,カク
を 助詞,格助詞,一般,,,,を,ヲ,ヲ
つけ 動詞,自立,,,一段,連用形,つける,ツケ,ツケ
て 助詞,接続助詞,,,,,て,テ,テ
カブトムシ 名詞,一般,,,,,カブトムシ,カブトムシ,カブトムシ
として 助詞,格助詞,連語,,,,として,トシテ,トシテ
売る 動詞,自立,,,五段・ラ行,基本形,売る,ウル,ウル
バイト 名詞,一般,,,,,バイト,バイト,バイト
を 助詞,格助詞,一般,,,,を,ヲ,ヲ
し 動詞,自立,,,サ変・スル,連用形,する,シ,シ
て 助詞,接続助詞,,,,,て,テ,テ
いる 動詞,非自立,,*,一段,基本形,いる,イル,イル
EOS
可能会一起使用的链接。
在CentOS6.7上安装Python3+OpenCV3(+ffmpeg)
链接:http://qiita.com/sarumonera/items/ab661b378f5a47c1f282