読者です 読者をやめる 読者になる 読者になる

tanihito’s blog

IT・Web・英語・筋トレなど、興味のあることについてつらつらと書いてきます。

zc.buildoutでMeCabを簡単インストール

プログラミング

最近はpythonの環境設定をbuildoutでやってしまうのが流行りみたいですね。そこで、私がよく使う形態素解析エンジンMeCabのインストールをコマンド一発でできるようにしてみました。

まずはbuildout用のディレクトリfooを作成します。

$ mkdir foo
$ cd foo
$ wget "http://svn.zope.org/*checkout*/zc.buildout/trunk/bootstrap/bootstrap.py"
$ python bootstrap.py init --distribute

次にfoo/buildout.cfgを作成し、以下の内容を張り付けます。

あとは

$ bin/buildout

とするだけで、MeCabIPA辞書・pythonバインディングのインストールが完了します。これらは全てローカルにインストールされるので、環境を汚す心配もありません。便利!

MeCabを使うときにはbin/pyからpythonを起動します。

$ bin/py
>>> import MeCab
>>> t = MeCab.Tagger()
>>> print t.parse(r"太郎はこの本を二郎を見た女性に渡した。")
太郎	名詞,固有名詞,人名,名,*,*,太郎,タロウ,タロー
は	助詞,係助詞,*,*,*,*,は,ハ,ワ
この	連体詞,*,*,*,*,*,この,コノ,コノ
本	名詞,一般,*,*,*,*,本,ホン,ホン
を	助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
二	名詞,数,*,*,*,*,二,ニ,ニ
郎	名詞,一般,*,*,*,*,郎,ロウ,ロー
を	助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
見	動詞,自立,*,*,一段,連用形,見る,ミ,ミ
た	助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
女性	名詞,一般,*,*,*,*,女性,ジョセイ,ジョセイ
に	助詞,格助詞,一般,*,*,*,に,ニ,ニ
渡し	動詞,自立,*,*,五段・サ行,連用形,渡す,ワタシ,ワタシ
た	助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
。	記号,句点,*,*,*,*,。,。,。
EOS

追記

Ubuntu上でMeCabPythonで使いたいだけなら

$ sudo aptitude install mecab mecab-ipadic-utf8 python-mecab

でOKです。