コンピュータ処理技術の発展した今日においても科学技術情報の適切な利用には統制された用語集ともいえるシソーラスは避けられないツールとされている。著者らはシソーラスにおけるがごとき人間の知的介入をできるだけ避け,コンピュータによる機械的な文字列切り出しによって検索語抽出の可能性を見いだすための検討を加えた。そこでJICST・MTを用い表記構成を明かにする目的から表記形態別に文字列を切り出した。これら漢字,ひらがな,カタカナなどの文字列ごとの出現数と出現率,そして異なり文字列などを整理した。この結果,金属工学の領域では漢字文字列が全文字数の半数近くを占めるばかりでなく比較的短い文字列によって構成されていた。さらには漢字文字列が果して短い文字列によって構成されているか否かについて検証する目的から生起確率を求めた。この漢字文字列はコンピュータにより機械的に切り出したにも拘らず推測値と実測値とは近い値を示し短い文列によって構成されていることが立証されたものと考えられる。