情報の科学と技術
Online ISSN : 2189-8278
Print ISSN : 0913-3801
ISSN-L : 0913-3801
金属工学における漢字の表記形態と生起確率
山村 良彦新谷 泰男
著者情報
ジャーナル フリー

1990 年 40 巻 2 号 p. 123-128

詳細
抄録

コンピュータ処理技術の発展した今日においても科学技術情報の適切な利用には統制された用語集ともいえるシソーラスは避けられないツールとされている。著者らはシソーラスにおけるがごとき人間の知的介入をできるだけ避け,コンピュータによる機械的な文字列切り出しによって検索語抽出の可能性を見いだすための検討を加えた。そこでJICST・MTを用い表記構成を明かにする目的から表記形態別に文字列を切り出した。これら漢字,ひらがな,カタカナなどの文字列ごとの出現数と出現率,そして異なり文字列などを整理した。この結果,金属工学の領域では漢字文字列が全文字数の半数近くを占めるばかりでなく比較的短い文字列によって構成されていた。さらには漢字文字列が果して短い文字列によって構成されているか否かについて検証する目的から生起確率を求めた。この漢字文字列はコンピュータにより機械的に切り出したにも拘らず推測値と実測値とは近い値を示し短い文列によって構成されていることが立証されたものと考えられる。

著者関連情報
前の記事 次の記事
feedback
Top