デジタル・ヒューマニティーズ
Online ISSN : 2189-7867
論文
単語分散表現による日本語和語動詞の書き分けの研究
髙橋 雄太相田 太一小木曽 智信
著者情報
ジャーナル オープンアクセス HTML

2025 年 4 巻 1 号 p. 1-11

詳細
抄録

本研究は,日本語の和語動詞の表記間の距離を自然言語処理の手法により計測し,書き分けの実態を分析して記述したものである.コーパスの用例の前後文脈における共起頻度をもとに単語分散表現を算出して,各表記間の距離ならびにその近傍語との間の距離を計測した.分析の結果,〈泣く〉と〈鳴く〉など表記間距離が遠く,各表記を特徴づける近傍語がそれぞれ得られた語と,〈分かる〉と〈判る〉など表記間距離の近く,近傍語から表記の特徴を説明しがたい語が見られ,実測的に表記の書き分けの実態を記述した.また,平成期と昭和前期の異なる時代の表記間の距離も計測し,時代間で表記の用いられ方が変わることを実証した.

著者関連情報

この記事はクリエイティブ・コモンズ [表示 4.0 国際]ライセンスの下に提供されています。
https://creativecommons.org/licenses/by/4.0/deed.ja
次の記事
feedback
Top