2007-09-01から1ヶ月間の記事一覧

家族で近江八幡に行ってきました.琵琶湖涼しい.近江牛(゚д゚)ウマー thx!>id:Boris

PLSI使いこなせないなぁ.ベイズ統計とかTEMからちゃんと理解しないとだめか.いい教科書はないものか...

未来のノートPC

これ欲しい. Anti-destruction device for laptop - YouTube

なかなか消化できなくてムズムズする. http://chasen.org/~daiti-m/paper/topic2006.pdf

べいずのていり

このベイズの定理の説明いいな〜.やっと覚えられそう. http://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q1012112940 ベイズの定理 P(B|A) = (P(A|B) / P(A)) * P(B) 事前確率と尤度を「仮定」して,それに基づいて事後確率を求める. 参考:ベイズの…

Float xx out of range

LDAのmodel.betaをto_fしながら読んでると"Float xx out of range"なwarningが大量に出る. irbでやってみるとこんな感じ. "1.6327561e-315".to_f (irb):34: warning: Float 1.6327561e-315 out of range => 1.63275608151574e-316 Floatの有効桁数が足りてな…

MHP2ndでランス

久しぶりにMHP2ndをやった.ランス3人突進メインとか面白すぎる.普通に上位クエも問題なくクリアできて驚いた.ドドブラは突進で飛び掛りをスルーできたり,ショウグンは突進で通り抜けておけば斬らることもなく,ダウンしたらもう掘り放題. そんなこんなで気づ…

同じデータをPLSIにかけてみた

PLSIだとたいていのトピックの関連語の上位に「する,いる,日,ない,から,ある,なる,人,こと」等の一般的な単語が出てきてしまう.上と同条件でPLSIにかけてトピック0〜2を見るとこんな感じ. topic 0: する,いる,ない,日,ある,なる,から,年,的,氏,時,市,や,一,…

LDAおもすれー

毎日新聞91年分のデータを語数10000,話題数100でLDAにかけた.ただし語は自立語の基本形のみ. 確認のため,各トピックkについてmodel.betaから取ってきたP(w|k)らしきものの順に単語wを出してみた.32個目のトピックはこんな感じ. topic 32: 県,市,町,郡,同,千…

WMPでVP6でエンコードされたFLVを再生

WMP + FLVSplitter + ffdshowでVP6のFLVを再生したら映像が出なかった. FLVSplitter 1.0.0.1がVP6に対応してないらしい. http://www.rarewares.org/others.php#flash-video-decにあるVP2.zipから取ってきたFLVSplitter.axを使ったらOKだった. 参考:http://ww…

plsi segmentation fault

'91年の毎日新聞のデータにおける出現頻度トップ10000語を対象語にして,段落x対象語の共起行列をつくった. 対象語を3語未満しか含まない段落は省くと,48万段落x10000語の行列になる. これを訓練データにplsiをかけるとメモリ不足(?)でsegmentation fault. ht…

word-vectorをPLSIで圧縮する際のdとwの解釈

d:対象語,w:素性語,dとwが共起した回数を訓練データにして,dを固定したときのP(z|d)の分布が対象語dのトピックを表している d:文書,w:対象語,d中にwが出現した回数を訓練データにして,wを固定した時のP(z|w)の分布が対象語wのトピックを表している 現在は1で…

plsiの疑問

zの個数の個数に関わらず,plsiで圧縮したword-vectorを使うとクラスタリング結果がひどく悪化する. スムージングのしすぎかと思って,試しにplsiの吐いたmodel.pwzを使って元の次元に戻してやると,plsiをかける前のクラスタリング結果とほぼ同じになってしま…

awk

計算結果の行だけ取ってきて平均を求めたりするのにawkのワンライナーがすごく便利.こんな感じです. % gawk '/purity / { print $1, $2; sum += $2;} END { print sum / 10; }' file purity 0.575324675324675 purity 0.820816864295125 (中略) purity 0.758…

アクエリオン完走

アクエリオン26話まで一気に見てしまった.ロボットものはガンダムしか見たことが無かった私ですが,かなり楽しめました.9月22日に公開の映画版も観たくなってきました.

アクエリオン

13話まで見た。主題歌から入って、試しに見てみたら・・・このノリ大好きだ。

お手伝い

7日・8日と学内で言語処理関係の会議の準備・マイク持ち・後片付け等々のお手伝い。 会議と行っても、前で担当の方が順番にプレゼン、という学会みたいな雰囲気。 発表者の方が理系・文系で半々くらいなので、珍しい話も聞けてよかった。

Firefox + nicovideo

http://kirono.blog98.fc2.com/blog-entry-68.html# 検索バーにニコニコ動画を追加する。 http://civic.xrea.jp/2006/06/30/quick-search/ クイックサーチに登録する場合はURL欄に"http://www.nicovideo.jp/search/%s"。おまけ Ctrl-k で検索バーにフォーカ…

AutoPagerizeいいね

次のページをバックグラウンドで読み込みつつ、現在のページに継ぎ足してくれるGreaseMonkeyスクリプト。 しかし、この日記で使うと、エントリが延々と挿入されていって、いつまでもメニューにたどり着けない・・・。

Icewind Daleのポートレート描いてる人

http://www.justinsweet.com/index.html

中間審査おわり

脂汗かいた後のシャワーは気持ちいいね!

さらさらそば茶

http://www.itoen.co.jp/news/2006/082301.html 今日近くのドラッグストアに行ったら、これの500mlが98円で売ってたので思わず3本買いだめ。 で、この日記を書こうとしてググったら、どうやら8月20日から「さらさらおいしいそば茶」にリニューアル…

10のUNIX小技

putty+screenでコマンドが長すぎて複数行になる場合にちゃんとwrappingしてくれなくて困ってました。 \でエスケープできるらしい。 http://www.geekpage.jp/blog/?id=2007/1/11