2021 年 61 巻 8 号 p. 715-721
本稿では,質的データの解析手法として,自然言語処理技術として発展を続けている構造的トピックモデル(Structural Topic Model:STM)を紹介する.自然言語とは人間が互いにコミュニケーションを取るための自然発生的な言語である.この自然言語をコンピュータに処理させる技術を自然言語処理という.この自然言語処理の技術の1つとしてSTMがある.STMとは,Latent Dirichlet Allocation(LDA)を用いて,トピックとしてまとめられる潜在変数に基づいて観測された単語を生成する統計的なアプローチである.STMを用いることにより,入力した文書の「意味」のまとまりをつかむことができる.実践例として,夏目漱石の『こころ』を題材にSTMを実施した結果,『こころ』で語られる時勢の遷移による価値観の変化とこの変化がもたらす「わからなさ」を浮き彫りにする結果が示された.扱うテキストの前処理など,実用上の課題はあるものの,STMの今後の臨床研究への活用が期待される.