情報管理
Online ISSN : 1347-1597
Print ISSN : 0021-7298
ISSN-L : 0021-7298
電子行政における文字環境の整備
平本 健二
著者情報
ジャーナル フリー HTML

2015 年 57 巻 11 号 p. 799-808

詳細
著者抄録

日本において情報交換の基盤になるのが,文字情報交換の仕組みである。文字情報基盤は,個人の氏名を正確かつ使いやすく実装する仕組みとして政府が整備してきており,フォントや画数などの文字情報等を,誰でも無料で利用できるように提供している。ツールへの実装,自治体への導入も進み始めており,多くの自治体では,従来もっていた外字の同定作業も実施している。国際標準への対応を進めるとともに,単に文字数を増やすのではなく,JISを活用した日常での簡易な活用方法を提案する等,今後の日本の社会の基盤となる仕組みといえる。本稿では,現在の取り組みとその将来展望について解説を行う。

1. これまでの経緯

コンピューターで個人の氏名等を表記する場合,氏名に使われている約6万文字のすべてを表現することが難しく,長年,個人や組織において外字という関係者のみで共有できる特殊な文字を使うことが多かった。そのため,氏名が■で表記されたり空白になるなど正確な表記や情報交換ができなかった。コンピューターの外字問題は,長年,すべてのシステム関係者を悩ませてきた。個人としての氏名のアイデンティティーを確保しつつ,行政や日常での使いやすさを実現することは難しく,特に,行政システムの担当者にとっては,公的文書の文字をどうしたらよいか非常に悩ましい問題であった。そのため,文字情報を扱うための基盤やルールの整備が求められ,行政情報化推進基本計画(改定)(1997(平成9)年12月20日閣議決定)1)において「情報システムにおいて使用している外字について,JIS第3水準及び第4水準の制定を待ってその解消を図るとともに,この場合においても残る可能性のある外字について,交換のルールを策定する」と計画した。その後,e-Japan戦略II(2003(平成15)年7月2日IT戦略本部決定)2)において,「行政システム間をはじめ,民・官でのデジタル情報の自由な交換・共有のため,現在外字として利用されている文字について,2003年度中に公開用文字情報データベースの試験的運用を開始し,2005年度までに当該データベースを構築し,これを元に国際整合性も勘案した文字コード規格を整備する」と具体策が示された。それを受け,経済産業省,内閣官房,総務省,法務省,文化庁が5府省連携で汎用電子情報交換環境整備プログラムにおいて,戸籍文字,住民基本台帳文字の同定作業を行い,文字情報基盤作りを進めてきた。

一方,2008年に経済産業省で政府,自治体のCIOが集まる行政CIOフォーラムという研究会が行われていたが,ここで提起された課題の1つが外字の問題であった。そこで,2009年3月に汎用電子情報交換環境整備プログラムが終了することを受け,その成果を生かすプロジェクトが開始された。さらに,行政CIOフォーラムの提言を受け,2009年に国民との意見交換のサイトである「アイディアボックス」を設置したが,この議論でも「外字問題の解決」を求める声が数多く寄せられ,参加者の投票により15位の課題に位置づけられた。

また,CIO補佐官等連絡会議情報技術ワーキングで2008年3月に「漢字・外字利用を考慮したシステム調達」として次の3点が提言された。

・新たな外字を作らない

・既存の文字セットを利用する

・汎用電子情報交換環境整備プログラムの成果の公開を関連部門に要請し,活用を検討する

翌年度以降は議論の詳細化に伴い,文字関係府省のCIO補佐官が参加し議論を深めていった。

このように,あらゆる場所で外字問題解決に向けて声があがっていた。

また,この検討を開始する時点で,マイナンバーの検討がすでに始まっていた。マイナンバーを導入することで,氏名情報を交換する場面も想定されたため,難しい課題であったが着手する必要があった。

2. 文字情報基盤とは

文字情報基盤とは,情報処理推進機構(Information-technology Promotion Agency,以下,IPA)が推進するフォントと文字情報を含んだ,文字情報に関する総合的な基盤である。汎用電子情報交換環境整備プログラムの成果を受け,ステークホルダー(利害関係者)との調整を経て,2010年8月より経済産業省で文字情報基盤の整備事業が開始された。2010年度は経済産業省が主体となり,内閣官房,総務省,経済産業省,法務省,文化庁が委員として参加するとともに,情報処理や印刷の業界団体,文字専門家,標準化団体が委員会を構成し,文字を活用する関連府省がオブザーバーとして参加し,2011年3月に文字情報基盤事業を推進する方針が整理された。2011年4月以降は,現在運営を行うIPAに引き継がれるとともに,政府全体で推進していくために,内閣官房情報通信技術(IT)担当室,経済産業省,IPAの3者による推進体制となった。

その後,「電子行政推進に関する基本方針」(2011年8月3日高度情報通信ネットワーク社会推進戦略本部決定)3)において,文字情報基盤の活用は,「行政情報の適正な管理や行政機関間の効率的な情報連携を実現するため,行政機関が利用できるフォントや文字情報等の文字情報基盤を活用し,文字コードやいわゆる外字等に係る問題の解決を図っていくこととし,氏名等の正確性と社会全体での利便性・効率性を考慮した仕組みを検討していく」と記述され,国の基本方針として位置づけられた。

さらに,2013年6月には,日本のITを強力に推進するため新しいIT戦略である「世界最先端IT国家創造宣言」4)が閣議決定され,「文字の標準化・共通化に関しては,今後整備する情報システムにおいては,国際標準に適合した文字情報基盤を活用することを原則とする」と,政府の方針として原則化された。

戦略に基づき,「電子行政分野におけるオープンな利用環境整備に向けたアクションプラン」5)が2014年4月25日に各府省情報化統括責任者(CIO)連絡会議で決定され,文字情報基盤の導入は,用語共通化,各種コード共通化とともにインターオペラビリティー(相互運用性)の基盤として推進されている。このアクションプランは,地方公共団体にも文字情報基盤の活用を推奨している。

総務省の自治行政局もこれに対応し,2014(平成26)年3月に公表した「電子自治体の取組みを加速するための10の指針」6)において,「国の動向も参考とし,文字環境の整理を行う」と記述したうえで,参考資料で文字情報基盤を解説している。

文字情報基盤の目的は,行政機関として情報処理をするために必要となる文字を交換,処理,活用するための基盤を整備することであった。具体的には,以下のものを目指して開始した。

・戸籍,住民票に必要な文字が対象

・主要サイズの明朝体のみを整備

・文字の美しさは公用文として必要十分なレベル

・無料での提供

ここでは登記の文字については含まれていないが,その理由は以下のとおりである。

・追加は後からもできるので,まずは氏名文字にスコープを絞るべきである

・登記の文字は現在も追加可能であり上限が決定できない

・CIO補佐官等連絡会議情報技術ワーキングの外字サブワーキンググループでも,登記を含まない方向で議論が進められていた

また,変体仮名も対象外としていた。その理由は,変体仮名は曲線が基調であり同定の基準がないことと,戸籍統一文字や住民基本台帳ネットワークシステム統一文字の変体仮名の権利関係が難しく,基準の文字が作りにくいためである。1948年以降は氏名文字として新たに使用することができなくなっており,戸籍統一文字や住民基本台帳ネットワークシステム統一文字では変体仮名の標準字形をもっているため,行政手続き時に正式文字で困ることは少なかったことも整備しなかった理由である。しかし,本格導入するにあたり,変体仮名がない課題を指摘されたため,2014年度中に変体仮名の整備を行うこととした。

結果として,明朝体の拡大縮小表示・印刷が可能なフォントが無料で誰でも利用可能となった。国民すべてが読み書きできる常用漢字,一般のパソコンやビジネスで利用するJIS漢字を含むのはもちろんのこと,戸籍統一文字と住民基本台帳ネットワークシステム統一文字のすべてを包含して,約6万文字を収納している。これにより,公的文書に対する要望は,ほぼ満たすことが可能である。その関係を1に示す。住民基本台帳ネットワークシステム統一文字は戸籍統一文字に準拠することとなっているが,自治体の運用に合わせて一部拡張している。それらの拡張部分も2のように文字情報基盤では区別して扱えるようになっている。また,国際標準であるUnicode注1)に対応しており,一般的なコンピューターで使用が可能である。2012年10月には,これまでUnicodeに対応せずに残されていた約1,800文字の符号化提案が国際標準化団体(ISO)注2)に受理され,これをもって,国際規格への新規提案はすべて完了した。受理されたこの提案を受けてのISO側での作業と,IPAによる異体字識別番号(Ideographic Variation Sequence / Selector: IVS)の登録等の作業が残されているが,約6万文字すべてを国際標準規格に基づいて使用できるようになるまでの大きな困難はなくなった。この国際標準との関係の整理を3に示す。また,Unicode提案が正式な規格となるまでの暫定運用案もテクニカルスタディーとして公表している。異体字識別番号(IVS)とは,渡辺の「辺」のように,多くの字体をもつ場合の表現方法であり,文字情報基盤では,このIVSを採用している。IVSを使うことにより,さまざまな文字を自動的に切り替えて使用したり,検索を効率的に行ったりすることが可能になる(4)。

行政の実務で必要とされる約6万文字の人名漢字等を収録したIPAmj明朝フォントとMJ文字情報一覧表注3)は,2011年5月のベータ版を経て,10月に1次リリースしたあと,自治体の現場への適用実証実験を進めるとともに,機能拡張,バージョンアップ,国際標準化作業,導入支援ツール提供等を実施しており,2015年1月現在IPAmj明朝フォントはVer.003.01,MJ文字情報一覧表はVer.004.01を提供している(http://ossipedia.ipa.go.jp/ipamjfont/)。

図1 文字体系間の関係 出所:経済産業省
図2 各文字の例
図3 文字とコードとの関係 出所:IPA
図4 異体字セレクタ

3. 文字情報基盤の活用

文字情報基盤は,そのままシステムの文字として活用することも可能だが,さまざまな活用の仕方が可能である。活用イメージを5に示す。

第1にインデックスとしての活用がある。すでにもっている外字の字形同定作業の基準として活用(5A)したり,組織内外の複数システムの外字を一覧化して連携の基準として活用(5B)したりすることが考えられる。

第2の使い方として,補足情報の伝達や文字図形としての活用がある。他の行政機関との情報交換時に「1行目の先頭の文字は**ですよ」と補足情報として活用(5C)することや,既存の外字になかったときに追加の外字として活用(5D)したり,印刷に活用したりすることが可能である。

このようにフォントと文字一覧表は非常に便利に使えるのであるが,導入者がまずやるべきことは,業務の目的に応じて文字の使用範囲を決めることである。文字情報基盤では約6万文字を提供しているものの,この文字すべてを使えばよいわけではない。文字を使うときに,「正確に氏名文字を確認するための業務か」「手続き等で正確な表記でなくても名前が確認できればよい業務か」を検討する必要がある。たとえば,施設予約の管理に利用できる文字を制限したりするのは行政効率を高めるうえで重要なことである。電子申請で受け付ける文字を,JIS第2水準までに絞っているポリシーも見かけるが,現在のように,市販のパソコンでJIS第4水準まで対応していることも踏まえて検討を行っていく必要がある注4)。現在,文字情報基盤ができたからといって,JIS第4水準で運用している業務の利用可能文字を,JISの範囲外にまで増やす必要性はまったくない。あくまでも業務ニーズを見極めていくことが重要である。

また,外字作成や文字の同定問題を避けるために,宛名をカタカナ表記にする等の取り組みが行われてきている。文字情報基盤導入を機に全体としてのポリシーの見直しも行ったほうがよい。システムで対応できない人に対してシステム対象外として,手書きで宛名対応等を行っている自治体もある。正確性を確保しつつ,全体の利便性と効率を考えていく必要がある。

また,民間企業も文字情報基盤を活用することが可能である。企業による届け出や代行申請,また,行政手続きや印刷のアウトソーシングで行政と同じ文字を使うことが必要となるためであり,利用範囲を特に限定していない。

これらの導入や活用を推進するために,IPAでは,『文字情報基盤導入ガイド』(http://mojikiban.ipa.go.jp/contents/2014/03/guide.1.0.pdf)を整備し,導入検討者を支援している。2014年度中には,正規の氏名漢字と施設利用券のような日常的に使う氏名漢字の対応関係を示す文字の縮退マップ(6)を整備する予定であり,目的に応じて漢字を使い分けることが容易な環境の整備もできることとなる。

図5 活用イメージ
図6 文字の縮退マップ

4. 着々と進む普及

フォントや文字情報等のダウンロード数も着実に伸び,札幌市や川口市等の自治体での導入事例も増えてきている。また,2011年度に総務省が各自治体に呼び掛け,1,386自治体が参加して,自治体のもっている外字の同定作業が行われた(7)。総文字数1,166,536文字を文字情報基盤に同定し,ほとんどの文字が同定された注5)。同結果を細かく見ていくと,文字情報基盤の対象外である変体仮名や記号等を除いた,同定できない漢字は4%程度(52,294文字)である。さらにここから,ドット数が粗いなど分類不可能な,33,759文字(字としての識別が困難であったことから字種数は不明)を除く18,535文字が,実質的に同定できなかった文字といえる。しかし,このうち,法務省の誤字俗字・正字一覧表で誤字とされる文字に相当する文字が5,692文字,中国の簡体字に相当する文字が11,214文字であり,これらはいずれも正字への対応関係が明確に定義されている。これらをさらに除くと,同定できなかった文字は実質1,629文字(字種としては299字種)ということになる。詳細な同定結果を,1に示す。

文字情報基盤で整備した文字で,自治体業務はほぼ十分に賄えるといってよいだろう。

同じ調査結果について,「37,000種類以上の文字が同定できず,これらを文字情報基盤に追加して10万文字にする必要がある」との民間での分析7)があるが,この分析は政策の方向性と違い,実態を正しく踏まえていない。

本事業の進展を受け,現在までに,日立公共システムエンジニアリング(株),富士ゼロックスシステムサービス(株)等の先行的に取り組む企業から,文字情報基盤に対応する行政機関向け製品が発表されている。また,(株)ジャストシステム,日本マイクロソフト(株),アップルジャパン社等からはIVS技術に対応し,IPAmj明朝フォントに登録された多様な異体字を一般のPC上で扱えるワープロ等のオフィスソフトが市販されている。これらを用いることにより,一般家庭やオフィスでも豊富な人名漢字を扱えるようになった。OpenOffice等のオープンソース系のオフィスソフトウェアでも異体字への対応化の検討が進められている。

また,IPAでは,2012(平成24)年7月高度情報通信ネットワーク社会推進戦略(IT総合戦略本部)による「電子行政オープンデータ戦略」の決定を受け,文字の異体字関係,読み仮名,政策的位置づけ等,文字に関する各種情報をオープンデータとして提供するためのデータベースの設計を行っている。

さらに2012年度に,IPAでは自治体現場で文字情報基盤を活用する実証実験を実施した。文字情報基盤の活用には,IPAが無償で提供するIPAmj明朝フォントを活用する場合と,フォント自体は自治体等がそれまで使っていたものをそのまま用い,システムの連携のためのコード変換にIPAの提供するMJ文字情報一覧表を活用する場合との2つの方向性があると前述したが,実際の実験を通じてその有効性の確認が行われた。

図7 総務省による文字の同定
表1 文字の同定結果

5. 今後に向けて

いまや生活にコンピューターは欠かせないものとなっている。自分がコンピューターを使わなかったとしても,氏名はシステムで処理され,場合によっては印字されている。そうした中,行政機関の文字活用において文字情報基盤を無視しては考えられなくなってきている。マイナンバー関連業務においてもさまざまな場面で文字を使うことが想定されるが,文字情報基盤は,戸籍システムや住民管理システムと自治体内の各システムの連携,企業との連携,府省との連携等すべての場面で活用できる唯一の基盤である(8)。

文字情報基盤により,文字関連コストの削減だけでなく,ベンダーロックインの回避など,今後,さまざまな効果が見込まれている。

文字情報基盤の経済効果は,システム面からの試算で年間32億円のコスト削減と試算されていたが,民間の試算7)においても,文字問題の解決を図らないと年間30億円の無駄が発生するとされている。文字情報基盤は,今後の社会システムの最適化に欠かせないインフラということができる。

ベンダーロックインやベンダーの文字情報基盤に対する消極的な姿勢が,現在の文字情報基盤普及の最大のネックである。文字により他社への乗り換えに障壁を作っている既得権益をもつ企業にとっては,オープンな構造を目指す文字情報基盤は大きな脅威である。導入が難しくないにもかかわらず,対応できないとベンダーに導入を断られたという話をよく聞く。また,いまだに外字は作って増やせばよいと考えているベンダーがおり,むしろ,外字作成機能を売りの機能として紹介している。国の政策の推進,自治体のニーズの高まりをつなぐものとして,取り組みの遅れているベンダーには早急な対応を期待したい。

今後は多くの府省や自治体で導入が見込まれることから,活用事例の蓄積などに力を入れていきたい。

図8 社会基盤としての文字情報基盤

本文の注
注1)  公的国際標準としては,ISO/IEC 10646。本項では,区別することなくUnicodeと記載する。

注2)  ISO/IEC JTC1/SC2

注3)  クリエイティブ・コモンズ・ライセンス2.1「表示、継承」により無償公開されている。

注4)  常用漢字のうち4文字と,表外漢字(法令,公用文書,新聞,雑誌,放送等,一般の社会生活において用いられる常用漢字以外の漢字として文化庁から示された文字)のうち42文字は第3・第4水準漢字であることも配慮する必要がある。

注5)  http://www.soumu.go.jp/main_sosiki/jichi_gyousei/c-gyousei/lg-cloud/02kiban07_03000021.html

参考文献
 
© 2015 Japan Science and Technology Agency
feedback
Top