本大会におけるワークショップの登壇者およびタイトルが決定しました。
「CasualConcではじめるトピックモデリング入門」
登壇者:
- 今尾 康裕(大阪大学)
- 藤田 郁(九州大学)
概要:
トピックモデルは、共起情報を元にコーパス内の語を分類し、意味的なつながり持つ単語群にまとめる統計手法です。事前の学習データや辞書を必要とせず、「意味」にアプローチできる点が大きな特徴であり、他のテクストマイニング手法とは大きく異なっています。言語や文学の研究でも幅広く応用されていますが、実際に使用、分析するにはTerminalやコマンドプロンプトといったCUIアプリケーションを利用する必要があります。また、図式化や解釈を行うためには、出力結果にさらに複数の処理を施さねばならず、実行方法や出力の扱い、解釈に戸惑うこともあるかもしれません。
本ワークショップでは、トピックモデル分析の基本的な概念と前処理について解説をしたのち、macOS用GUIコーパス分析アプリであるCasualConcのトピックモデル分析機能を利用して、ハンズオン形式で操作方法を紹介し、出力結果の読み取りやグラフの解釈などについて提案します。