知能と情報
Online ISSN : 1881-7203
Print ISSN : 1347-7986
ISSN-L : 1347-7986
18 巻, 5 号
選択された号の論文の24件中1~24を表示しています
目次
巻頭言
特集:テキストの可視化と要約
解説
特集論文 : テキストの可視化と要約
原著論文
  • 岡部 貴博, 吉川 大弘, 古橋 武
    2006 年 18 巻 5 号 p. 689-700
    発行日: 2006年
    公開日: 2007/04/20
    ジャーナル フリー
    現在, 多くの病院では, 医療従事者が勤務中に遭遇したヒヤリとしたこと, ハッとしたことをレポート形式で報告する制度が採用されている. このレポートはインシデントレポートと呼ばれており, 事故の種類や発生場所などのメタデータと, 大部分は自由記述の文章で記されている. インシデントレポートには, ヒューマンエラーを起こしやすい状況や, 病院のシステムの改善点, 事故の要因などの様々な重要な情報を含んでいることが多いため, インシデントレポートを解析することは医療事故を防止するための対策を発見するのに有用である. しかしこれまでは, 定量化しやすいメタデータ部分を用いて, 事故の発生件数の推移や, 業務別の報告件数の割合を分析したり, 病棟や部署での報告件数を比較するだけにとどまっている. そのため, 事例の大まかな傾向をつかむことはできても, 各事例の中に含まれている重要な情報の解析はできていない. 一方で近年, 自由記述の文章から有益な情報を抽出する, テキストマイニングに関する研究が盛んに行われている. 本論文では, メタデータと語句の共起情報を利用したテキストマイニング手法を提案し, インシデントレポート解析への適用を行う. 提案手法は, メタデータを最上位とする階層構造で表現されたキーワードグラフを作成する. また, 解析者が能動的に解析したい項目を掘り下げていけるという特徴を持つ. 実際のインシデントレポートを対象とした評価実験により, 提案手法の有用性を検証する.
  • 村田 剛志, 齋藤 皓太
    2006 年 18 巻 5 号 p. 701-710
    発行日: 2006年
    公開日: 2007/04/20
    ジャーナル フリー
    ログデータからWebユーザの関心を抽出し視覚化することは, Web利用マイニングにおける挑戦的な研究テーマである. Webサイトや検索キーワードを頂点とし, 時間順序を辺とすると, ユーザのWeb閲覧行動はグラフとして表現できる. 我々はこれをサイト・キーワードグラフと呼ぶ. 本論文ではWebログデータから生成されるサイト・キーワードグラフからユーザの関心サイト集合の部分グラフを抽出する手法について述べる. 人手による分析を容易にするために, 抽出された部分グラフの視覚化も行う. 本手法において, 元のサイト・キーワードグラフの約30パーセント程度の頂点数の部分グラフを抽出することに成功している. PageRankランキングアルゴリズム上位の頂点数を用いて, 抽出された部分グラフの評価も行っている.
  • 高間 康史, 山田 隆志
    2006 年 18 巻 5 号 p. 711-720
    発行日: 2006年
    公開日: 2007/04/20
    ジャーナル フリー
    動向情報の要約と可視化に関するワークショップ (MuST) から配布されているタグ付きコーパス中の地震記事を対象として, 地震に関する動向情報を抽出・可視化するインタラクティブ地震動向情報可視化システムを提案する. ガソリン価格や株価の変動など, 多くの話題が時間的動向情報に主に関心があるのに対し, 本稿で対象とする地震では震源の位置や震度の広がりなど, 空間的動向情報も重要となる. 提案システムでは, 空間的動向情報は日本地図を用いた可視化表現, 時間的動向情報は折れ線グラフや棒グラフなどにより表現する. また, 時間的・空間的要素が組み合わさった地震特有の動向情報として群発地震も対象とし, 日本地図と棒グラフの組み合わせにより表示する手法を提案する. さらに, 提案システムでは日本地図上でのマウスクリックなど, 直感的な操作により可視化表現が得られるインタラクティブ性も提供する. 実際に構築したシステムに基づき, タグ付きコーパスからの動向情報抽出精度, 既存の地震データベース検索システムとの機能比較の観点から提案システムの有効性について検証すると同時に, 新聞記事からの地震動向情報抽出の利点についても考察する.
  • 松下 光範, 加藤 恒昭
    2006 年 18 巻 5 号 p. 721-734
    発行日: 2006年
    公開日: 2007/04/20
    ジャーナル フリー
    動向情報テキストを視覚情報として要約することを目的として, そこに含まれる情報をグラフとして描画する方式を提案する. 一般に動向情報テキストにはグラフ描画に充分な量の情報が明示されている訳ではないため, 従来の情報抽出技術を直接適用したのでは, 時間間隔も不均質で疎らな情報しか抽出できず適切な描画が行えない. 本稿では, この問題を解決するために, 明示的かつ定量的な数値情報 (e.g., “15ドル”) に加えて (1) テキスト中で暗示されている情報を抽出するための比較表現 (e.g., “30%の増加”) と背景知識の利用, (2) 定性的なグラフ概形情報を抽出するための定性表現 (e.g., “安定” や “緩やかな増加”) の利用, を提案する. 小規模な実験により (1) によって明示的な情報と同数以上の情報が抽出できること, (2) によって得られたグラフ概形を組み合わせた可視化表現はユーザの理解を高めるものであることを確認した.
ショートノート
  • 今岡 裕貴, 桝井 文人, 河合 敦夫, 井須 尚紀
    2006 年 18 巻 5 号 p. 735-744
    発行日: 2006年
    公開日: 2007/04/20
    ジャーナル フリー
    本論文では, 新聞記事における相対表現の調査および動向情報抽出のための相対表現の利用効果について議論する. 相対表現とは, 『12%増』『昨年』『第一位』のように, 動向に関連した数量表現や時間表現において数値の相対的差異や数値変動を示す表現である. 相対表現の処理が可能となれば, テキストからの動向情報抽出はより効率的に行える. 我々は, 新聞記事中に出現する相対表現を調査し, 相対表現の役割と出現傾向について分析した. そして, 動向情報把握のために必要な基本情報の抽出規則を構築した. 抽出規則がどの程度動向情報抽出に有効であるかを検証するために実験を行った. その結果, F値で0.8以上の性能が得られ, 相対表現を利用した動向情報抽出の可能性を確認することができた.
  • 北垣 郁雄, 有本 章
    2006 年 18 巻 5 号 p. 745-751
    発行日: 2006年
    公開日: 2007/04/20
    ジャーナル フリー
    大学における教育, 研究, マネジメントなどの実践例や考察をコンテンツとしてWeb掲載したオンライン閲覧システムがある. FDやSDの一環として, 利用することが可能である. そのシステムが多量のコンテンツを蓄積するに至ったとき, 閲覧者は, 多くのコンテンツのリストの中から所望のものを検索することになろう. その際, 各コンテンツの記載内容の特徴が図的に表現されていると都合がよい. 本研究は, 大学改革にかかるコンテンツがとりあげようとする観点を視覚的に表現しようとするものであり, 教育, 研究, 社会, マネジメントという大学の機能を三角錐の頂点に割り当てている. すなわち, 三角錐によるそのコンテンツの特徴付けを図るものであり, 視覚化表現法の提案である. また, 実験によってその表現のしやすさの評価を行う.
  • 宮本 雅人, 酒井 浩之, 増山 繁
    2006 年 18 巻 5 号 p. 752-760
    発行日: 2006年
    公開日: 2007/04/20
    ジャーナル フリー
    研究のプレゼンテーションでは, 限られた時間の中で, 聴衆に研究成果をよく理解してもらうために, プレゼンテーションスライドの作成が必要不可欠である. しかし, スライドの作成には多くの時間と手間を要する. そのため, 多くの研究者がスライド作成の効率化を望んでいる. 本研究では, 研究者の負担軽減を目的として, 論文LATEX原稿からスライドを自動生成する手法を提案する. 本手法では, LATEXファイルの解析, スライドへの内容の割り当て, 接続詞を利用した箇条書き生成を行なう. LATEXファイルの解析では, スライド生成に必要な情報は残し, 不要な情報の削除を行なう. LATEXファイルの定型的な構造を利用すれば, 必要な情報を特定することが可能である. スライド割り当てにおいては, 論文中での名詞の出現頻度, エントロピー, idf 値に基づいて名詞の重要度を計算する. その重要度に基づいて, 各セクションに対して, スライド枚数の割り当て, 重要文の抽出を行なう. 接続詞を利用した箇条書き生成においては, 並列関係を表す接続詞を利用する. なぜなら, 並列関係を表す接続詞を含む文には, その文と対になる文が存在する場合が多いからである. 評価の結果, 本手法は論文に忠実なスライド生成に有効であることがわかった.
報告
書評
用語解説
学生部会ΔNGLE
一般論文
原著論文
  • 西原 陽子, 赤井 れい子, 砂山 渡, 橘 啓八郎
    2006 年 18 巻 5 号 p. 766-776
    発行日: 2006年
    公開日: 2007/04/20
    ジャーナル フリー
    近年あらゆる創造活動において膨大な情報が扱われるようになってきた. 全ての情報が人の創造活動に役立つわけではないため, 人は全ての情報の中から創造活動に使えるものを見極める必要がある. だが優先順位のない多くの情報に対して積極的に考えることは人には難しい. 人は自らの嗜好により順位付けがされた情報に対しては積極的に思考するのではないかと著者らは考えた. 本稿では積極的思考支援のためのキーワード選好インタフェースを提案する. 提案インタフェースを通じてユーザ嗜好の指標の順序に基づくキーワード順序をユーザが作成する. キーワード順序が記されたリストをインタフェースが提示することによってユーザの思考支援を図るものである. 実験結果からユーザの嗜好を反映したキーワード順序のリストが得られること, リストの提示により積極的な思考を支援できることを確認した.
  • 中岡 伊織, 谷 久壹朗, 星野 孝総, 亀井 且有
    2006 年 18 巻 5 号 p. 777-786
    発行日: 2006年
    公開日: 2007/04/20
    ジャーナル フリー
    近年, 長引く不況により倒産する企業が増加している. したがって, 倒産を事前に精度良く予測することは, 融資・取引する企業や投資家においては重要な問題となっている. この倒産予測において, AltmanのZ-scoreに代表される従来手法では, 判別分析を用いているため, 現存企業数と倒産企業数が異なっている場合には精度が低くなるという問題がある. また, それらは一般的な経営指標を採用しているため, 近年起きている黒字倒産のような場合には, 倒産予測は難しい.
    本研究では, そのような状況にも適用可能な, キャッシュ・フロー計算書のデータを採用した倒産予測システムの構築を行う. まず, 不必要な指標を削除するため, 因子分析を用いてキャッシュ・フロー計算書の指標を絞り込む. 次に, 個々の企業経営指標を評価するのではなく企業間の相互関連を考慮して経営指標を評価するため, 自己組織化マップ (SOM) を用い, 倒産予測を行う. さらに, 予測誤差を倒産企業平均や全企業平均との誤差と比較することにより予測精度を検証する. 最後に, AltmanのZ-scoreなどの従来手法と比較することにより, 提案手法の有用性を示す.
  • 岡本 渉, 田野 俊一, 井上 敦司, 藤岡 亮介
    2006 年 18 巻 5 号 p. 787-798
    発行日: 2006年
    公開日: 2007/04/20
    ジャーナル フリー
    本論文において, 我々はファジィ量限定詞と真理値限定詞を含む自然言語命題において, 特にfalseで真理値限定された命題に対する推論解を求め, さらにその対称性について論ずる. 本報においては, 入力命題がQA are F is falseで推論結果がQ'A are mF is falseの場合と, 入力命題がQA are F is falseで推論結果がQ' (mA) are F is falseの場合 (Q, Q' : ファジィ量限定詞, A : ファジィ主語, F : ファジィ述語, m : 修飾詞), 推論解であるファジイ量限定詞Q'を求めた. 我々は, さらにファジイ量限定詞がmost, fewの場合及び修飾詞がvery, more or lessの場合における推論解の対称性につき論じ, 考察を加えた.
  • 小澤 順, 内藤 栄一, コストブ ブラホ
    2006 年 18 巻 5 号 p. 799-808
    発行日: 2006年
    公開日: 2007/04/20
    ジャーナル フリー
    協調フィルタリングによる情報推薦の手法においては, 類似ユーザの検出と, 検出された類似ユーザから推薦するアイテムの決定, との2つのステップから構成されている. 本論文では, ユーザにアイテムが選択された日時情報を考慮した協調フィルタリングの手法を提案する. 提案手法では, 所定の期間におけるユーザ間の類似度により, 嗜好の類似したユーザを検出する. さらに, 推薦するアイテムの決定においても, 類似したユーザの所定の期間に選択されたアイテムから求める. これらの期間の長さを変更することにより, 協調フィルタリングの推薦性能への影響を実験的に検証する. 本実験では, 11ヶ月の間に約25万人のユーザによってダウンロードされた携帯電話向けの着信メロディの履歴を用いる. 類似ユーザの選択における期間, 推薦アイテムの決定における期間の各長さを変更することにより, 推薦結果の再現率を用いて推薦性能への影響を評価する. 本実験の結果, 類似ユーザ選択においては, 期間の長さの再現率への影響は少ないが, 推薦アイテムの決定においては, 期間の長さが影響することがわかった.
学会から
会告
feedback
Top