tanihito’s blog

デジタル・新規事業開発・健康など、興味のあることについてつらつらと書いてきます。

2010-11-22から1日間の記事一覧

単語出現頻度をSVMlight形式の学習データに変換する

文書分類などを行なう場合にはSVMlightやLIBSVMなどのライブラリを使います。 その場合素性名を数値にする必要があるので、 変換する関数converter.pyを作ってみました。 (Classiasという素性に任意の文字列が使えるライブラリもあります) 素性を数値に変…