本大会におけるシンポジウムの登壇者、タイトル、および概要が決定しました。

「生成AI時代のコーパス研究」
(Corpus Studies in the Age of Generative AI)

各講師の発表タイトル(登壇順):

  • 水本 篤(関西大学) 水本 篤 発表タイトル:「生成AIを英語コーパス研究で利用するときに知っておくべきこと」

  • 宮川 創(筑波大学) 水本 篤 発表タイトル:「古代末期の修道院文献の間テクスト性ネットワーク:大規模言語モデルによる探知と分析」

  • Laurence Anthony(早稲田大学) 水本 篤 発表タイトル:「生成AIとコーパス言語学の融合:クラウド/ローカル型モデルの活用に向けて」

概要
本シンポジウムでは、生成AI時代のコーパス研究 (Corpus Studies in the Age of Generative AI) と題し、3名の発表者がそれぞれの行ってきた生成AIを使用したコーパス研究やツール開発の紹介を行う。

第1発表者の水本は、生成AIと英語コーパスを活用した研究を近年進めている。本発表では、研究やツール開発を通じて明らかになった、英語コーパス研究における生成AI活用時の注意点を紹介する。特に、文脈やニュアンスの解釈、一貫性に課題があるため、専門家による確認と解釈が不可欠であることを実例とともに示す。

第2発表者の宮川は、コプト語で書かれた古代末期の修道院文献を対象に、Claudeおよび自身が開発したTHOTH AIを用いて、聖書や教父文献からの隠れた引用や引喩などを自動検出する手法を開発した。LLMの文脈理解能力により、従来困難であった大規模な引用ネットワークの抽出と修道院間の知識伝播パターンの可視化が可能となった。発表では、実例を示すとともに、低資源言語(コプト語)の課題について議論し、計算言語学と文献学を融合させた新手法を提案する。

第3発表者のアントニは、大規模言語モデル(LLM)と従来のコーパス分析手法がそれぞれ持つ固有の強みと課題に注目する。現在のLLMは質的な解釈に優れている一方で、定量的な分析には限界がある。これに対し、従来のコーパス手法は定量分析に適しているが、得られた結果の質的・主観的な解釈は依然として人間に依存している。本発表では、こうした特徴をふまえ、AntConcコーパス分析ツールに新たに追加されたAIプラットフォームの活用事例を紹介する。このプラットフォームの大きな特徴は、大手クラウドベースの高性能LLMに加え、教育現場などで扱う機密性の高い個人データに対応するための小規模なローカルLLMも選択できる点にある。この新たなフレームワークは、AIとコーパスを統合した言語研究および教育の新たな可能性を切り開くものである。