zc.buildoutでMeCabを簡単インストール
最近はpythonの環境設定をbuildoutでやってしまうのが流行りみたいですね。そこで、私がよく使う形態素解析エンジンMeCabのインストールをコマンド一発でできるようにしてみました。
まずはbuildout用のディレクトリfooを作成します。
$ mkdir foo $ cd foo $ wget "http://svn.zope.org/*checkout*/zc.buildout/trunk/bootstrap/bootstrap.py" $ python bootstrap.py init --distribute
次にfoo/buildout.cfgを作成し、以下の内容を張り付けます。
あとは
$ bin/buildout
とするだけで、MeCab・IPA辞書・pythonバインディングのインストールが完了します。これらは全てローカルにインストールされるので、環境を汚す心配もありません。便利!
MeCabを使うときにはbin/pyからpythonを起動します。
$ bin/py >>> import MeCab >>> t = MeCab.Tagger() >>> print t.parse(r"太郎はこの本を二郎を見た女性に渡した。") 太郎 名詞,固有名詞,人名,名,*,*,太郎,タロウ,タロー は 助詞,係助詞,*,*,*,*,は,ハ,ワ この 連体詞,*,*,*,*,*,この,コノ,コノ 本 名詞,一般,*,*,*,*,本,ホン,ホン を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ 二 名詞,数,*,*,*,*,二,ニ,ニ 郎 名詞,一般,*,*,*,*,郎,ロウ,ロー を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ 見 動詞,自立,*,*,一段,連用形,見る,ミ,ミ た 助動詞,*,*,*,特殊・タ,基本形,た,タ,タ 女性 名詞,一般,*,*,*,*,女性,ジョセイ,ジョセイ に 助詞,格助詞,一般,*,*,*,に,ニ,ニ 渡し 動詞,自立,*,*,五段・サ行,連用形,渡す,ワタシ,ワタシ た 助動詞,*,*,*,特殊・タ,基本形,た,タ,タ 。 記号,句点,*,*,*,*,。,。,。 EOS