2007-09-12から1日間の記事一覧

word-vectorをPLSIで圧縮する際のdとwの解釈

d:対象語,w:素性語,dとwが共起した回数を訓練データにして,dを固定したときのP(z|d)の分布が対象語dのトピックを表している d:文書,w:対象語,d中にwが出現した回数を訓練データにして,wを固定した時のP(z|w)の分布が対象語wのトピックを表している 現在は1で…