tanihito’s blog

デジタル・新規事業開発・健康など、興味のあることについてつらつらと書いてきます。

2010-12-01から1ヶ月間の記事一覧

対応のあるt検定

提案手法とベースラインが有意差があるかを調べるためには、対応のあるt検定を行なう必要があります。そこで練習のためにハンバーガー統計学にようこそ!に出ていた例をPythonで実装してみました。8人の女子高生が2種類のハンバーガーを食べて、下表の得点を…

はてなダイアリーでソースコードに色をつける

ソースコード貼り付けるときに色つけたいなー、と思ったら簡単できた。 ソースコードを色付けして記述する(シンタックス・ハイライト) - はてなダイアリーのヘルプ >|python| # -*- coding: utf-8 -*- for i in xrange(10): print i, "hello, world!" ||<…

PrefixSpan-relで取得した未知語をMeCabの辞書に登録する

モチベーション ある文章中にどのような単語がよく出現するか調べることは、基本的な分析手法の1つです。1文節のみを対象とする場合は形態素に分けて頻度を数えればいいですし、2文節以上でも既知語ならば簡単に取得できます。しかし、複数の単語からなる…