抄録
科学技術論文から必要とする情報をコンピュータにより検索しようとするとき記述用語と検索語との整合性を求めるのは極めて困難なことである。この検索語となる漢字文字列も前報によれば1字〜3字といった短い文字列によって構成されていることが生起確率からも予想された。本報では漢字文字列の実態が短い文字列の結び付きによって構成されているか否かについてコンピュータによる切り出し処理によって確かめた。すなわち表記文字列より1字少ない文字列がどれだけ介入しているかをコンピュータによって切り出した。また表記文字列を1字〜3字文字列の形態で切り出し介入の状況を明らかにした。その結果4字,5字といった比較的短い漢字文字列であっても1字から3字の漢字文字列が介入することによって構成されている。とくに2字の漢字文字列が文字列構成の支配的因子として機能していた。