Abnormally Distributed

統計解析担当のライフサイエンス研究者 -> データサイエンティスト@コンサル

2020-01-01から1年間の記事一覧

Coursera:AI for Medicine Specializationの受講記録②

AI for Medicine Specializationの2つ目のコースも受講完了したのでレビューしてみる。 Course2. AI for Medical Prognosis Prognosisは日本語だと「予後」であり、病気の今後の見通しといった意味になる。予後を予測することで、病気のリスクが分かり、予防…

Coursera:AI for Medicine Specializationの受講記録

CourseraでAI for Medicine Specializationを受講してみた。Andrew Ng先生で有名なdeeplearning.aiが提供している。 構成としては、AI for Medical Diagnosis. AI for Medical Prognosis, AI for Medical Treatmentの3つのコースからなり、受講目安時間はそ…

LDAによるトピックモデル ②gensimによる実装

前回の記事ではLDAの概要や関連手法、確率モデルについて書いた。 今回はPythonのgensimというライブラリを用いて、LDAを実践してみる。 その前に、前回触れていなかったトピックモデルの評価方法について説明する。 評価指標 LDAは教師なしモデルであり、精…

LDAによるトピックモデル ①概要と確率モデル

トピックモデルはテキストデータの潜在的意味の解析に用いられる統計モデルの総称である。 ここでは一番有名なモデルである、Latent Dirichlet Allocation (LDA)について説明する。 LDAとは 文書データをLDAで処理することで、文書のトピックの分類や、トピ…

Optunaの概要

仕事でOptunaを使う機会があったので、論文を軽く読んでまとめてみる。 arxiv.org Optunaとは OptunaはPFNが開発したハイパーパラメータのチューニングツールであり、近年、勾配ブースティングやニューラルネットワークのチューニングによく使われている。 …

説明変数のある時系列予測(状態空間モデル)

概要 時系列データは実務で取り扱う機会が多い。その際、予測対象の時系列データ(目的変数)と似たような変動をする他の時系列データ(説明変数)を手がかりに予測したい場合がある。 説明変数を用いて目的変数を予測する最も単純な方法として、線形回帰が…