情報知識学会誌
Online ISSN : 1881-7661
Print ISSN : 0917-1436
ISSN-L : 0917-1436
研究論文
ランダムフォレストによる著者の性別推定 -犯罪者プロファイリング実現に向けた検討-
財津 亘金 明哲
著者情報
ジャーナル フリー

2017 年 27 巻 3 号 p. 261-274

詳細
抄録

 犯人の早期検挙を目的とした捜査支援手法である犯罪者プロファイリングは,犯罪現場の状況などを統計的もしくは心理学的に分析し,犯人の性別や年齢層,職業などの犯人像を推定するものであるが,印字された文書や電子メールなどしか存在しない事件においては犯罪現場自体がないため,有効な手段が従来はなかった.本研究は,文章情報を基に,犯人像を推定する手法の開発の嚆矢として,まずブログを対象に,ランダムフォレストによる著者の性別推定を試みた.その結果によると,性別推定には,漢字や平仮名,片仮名,名詞の使用率,品詞(動詞・形容詞・助詞・感動詞)や接続助詞「し」,助動詞「なかっ」,読点,文字(代名詞「私」「僕」,小書き文字「っ」「ゃ」) の使用頻度が有効で,1個抜き交差確認法による検証の結果,最高で正解率86.0% (適合率:男性84.6%,女性87.5%) を得た.なお,サポートベクターマシンを用いた検証も合わせて実施したが,正解率は最高で 75.0%(適合率:男性69.2%,女性85.7%)と相対的に低い精度を示した.

著者関連情報
© 2017 情報知識学会
前の記事 次の記事
feedback
Top