1985 年 2 巻 3 号 p. 3_518-3_528
日本語テキストファイルを扱うプログラムを書く上で最初に問題になるのは16ビットコードの日本語文字と従来からある8ビットの英数字とが自由に混在しているところにある.文字列に関するかなり複雑な操作も簡単に記述できるSNOBOL4に日本語テキスト処理機能を付加することで,日本語文字と英数字とが混在しているテキストの高度な手続きを簡単に記述できるようにした.主記憶内での英数字の表現を16ビットに正規化することによって,文字列処理の複雑なアルゴリズムを含む既存のSNOBOL4処理系の主要部分は全く変更せずに機能追加を実現できた.開発は日本語テキスト処理機能を設計し,とにかく動くものを実現する第1段階と次にその処理性能を改善する第2段階とからなる.最後に,既存ソフトウェアを手直しすることによって日本語テキスト処理機能を比較的容易に実現できた理由について考察する.