近年,テキストから抽出する文体的特徴の変化から筆者の感情や思想,精神状態などの変化を検討する研究が進んでいる.本稿では,脳の大患を経験した宇野浩二という作家の文体変化の時期を計量的アプローチにより分析することを目的とする.宇野浩二は日本の有名な作家であり,1927年に精神病にかかり,約6年間執筆活動を停止していた.1933年に文壇に復帰した宇野浩二の作風は著しく変化したと言われている.しかし,入院する前に発表された「日曜日」は,病後の作品と類似した特徴を示し,宇野浩二の文体は病気休養以前に既に変化し始めていた可能性が示唆されている.本稿では,宇野浩二が入院する直前に発表された作品を分析対象とし,判別分析法を用いて分析を行った.その結果,宇野浩二の文体は入院する前から既に変化し始めていたことがわかった.
犯人の早期検挙を目的とした捜査支援手法である犯罪者プロファイリングは,犯罪現場の状況などを統計的もしくは心理学的に分析し,犯人の性別や年齢層,職業などの犯人像を推定するものであるが,印字された文書や電子メールなどしか存在しない事件においては犯罪現場自体がないため,有効な手段が従来はなかった.本研究は,文章情報を基に,犯人像を推定する手法の開発の嚆矢として,まずブログを対象に,ランダムフォレストによる著者の性別推定を試みた.その結果によると,性別推定には,漢字や平仮名,片仮名,名詞の使用率,品詞(動詞・形容詞・助詞・感動詞)や接続助詞「し」,助動詞「なかっ」,読点,文字(代名詞「私」「僕」,小書き文字「っ」「ゃ」) の使用頻度が有効で,1個抜き交差確認法による検証の結果,最高で正解率86.0% (適合率:男性84.6%,女性87.5%) を得た.なお,サポートベクターマシンを用いた検証も合わせて実施したが,正解率は最高で 75.0%(適合率:男性69.2%,女性85.7%)と相対的に低い精度を示した.