計量国語学
Online ISSN : 2433-0302
Print ISSN : 0453-4611
招待論文B
文末語の使用率に基づいた筆者識別
探索的多変量解析の実施と分析結果に対するスコアリングによる検討
財津 亘金 明哲
著者情報
ジャーナル オープンアクセス

2018 年 31 巻 6 号 p. 417-425

詳細
抄録
100名のブログを対象に,句点前の語(文末語)の使用率に基づく,ブログ筆者の識別を試みた.1名の疑問テキスト(筆者不明を想定),1名の対照テキスト(筆者が既知を想定),全く別人の4名の無関係テキスト内の文末語の使用率に着目して,①主成分分析,②多次元尺度法,③対応分析,④階層的クラスター分析を実施し,それらの分析結果に対して得点を付与し,得点を合算することで分析結果を統合した.実験条件として,疑問・対照テキストの筆者が同一人である筆者組合せ条件「同一人」と両テキストの筆者が異なる筆者組合せ条件「別人」を設定し,上記同様の分析を両条件(各100名)で行い,その200名の得点分布を条件間で比較検討した.その結果によると,文末語の使用率のみで,筆者を識別することが可能な上に,非自立語の使用率や品詞のbigramに次いで,筆者の識別力を有していることが示唆された.
著者関連情報
© 計量国語学会

この記事はクリエイティブ・コモンズ [表示 - 非営利 - 改変禁止 4.0 国際]ライセンスの下に提供されています。
https://creativecommons.org/licenses/by-nc-nd/4.0/deed.ja
前の記事 次の記事
feedback
Top