Abnormally Distributed

統計解析担当のライフサイエンス研究者 -> データサイエンティスト@コンサル

2020-05-01から1ヶ月間の記事一覧

LDAによるトピックモデル ②gensimによる実装

前回の記事ではLDAの概要や関連手法、確率モデルについて書いた。 今回はPythonのgensimというライブラリを用いて、LDAを実践してみる。 その前に、前回触れていなかったトピックモデルの評価方法について説明する。 評価指標 LDAは教師なしモデルであり、精…

LDAによるトピックモデル ①概要と確率モデル

トピックモデルはテキストデータの潜在的意味の解析に用いられる統計モデルの総称である。 ここでは一番有名なモデルである、Latent Dirichlet Allocation (LDA)について説明する。 LDAとは 文書データをLDAで処理することで、文書のトピックの分類や、トピ…