自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
20 巻, 3 号
選択された号の論文の9件中1~9を表示しています
巻頭言
論文
  • 原 祐輔
    2013 年 20 巻 3 号 p. 315-334
    発行日: 2013/06/14
    公開日: 2013/09/14
    ジャーナル フリー
    本論文では東日本大震災発生時に首都圏で引き起こされた帰宅困難者問題の発生要因や通勤者の帰宅意思決定行動に対して,Twitter における各ユーザーの発言内容をもとにその要因を明らかにする.まず,発言データから行動データを抽出することを目的として,Twitter の発言内容から,各ユーザーの帰宅行動をサポートベクターマシンを用いて識別する.次に,ジオタグデータを用いて職場・自宅間距離等を作成するとともに,ツイートデータを用いて外的要因や心理的説明要因を作成する.当日の帰宅意思決定行動をこれらの要因を用いて離散選択モデルによりモデル化する.このモデル化によるシナリオシミュレーションを行った結果,避難所施設・一時滞在場所の有無が待機・宿泊行動を促進すること,地震発生後の家族間の安否確認の可否が徒歩帰宅行動に影響を与える可能性が示された.以上より,今後の災害時における帰宅困難者問題への対策を考察する.
  • 平野 真理子, 小早川 健
    2013 年 20 巻 3 号 p. 335-365
    発行日: 2013/06/14
    公開日: 2013/09/14
    ジャーナル フリー
    東日本大震災ビッグデータワークショップにおいて提供された,震災当日を含めた 1 週間分のツイートのうち,震災対応の初動期間にあたる震災後 72 時間を含む 4 日分のツイッターを解析した.ツイートのクラスタリングによって得られる全体の俯瞰を行ってから目的に応じた分類項目を設定し,その項目に即したツイートを抜き出す抽出器を作成した.一連の作業をよく行うためには,分類項目を設定するために用いられるクラスタリングの性能向上が重要な要素となっている.本研究では,古典的な類義語処理手法である特異値分解をクラスタリングに適用する際に,良く知られている次元圧縮に留まらず,特異値の大きさを特徴量の重みづけの大きさとして活用する手法を提案する.また,クラスタリング結果を人手で修正する作業の容易度を測るための新たな指標を提案し,人手による実作業の効率と比較する実験を行った.その結果,クラスタリングについては,主に作業効率の観点から,特異値による重みづけの有効性と提案する作業指標の妥当性が確認された.分類問題であるターゲットデータ抽出については,学習過程にそもそも重みづけの機構が備わっているにもかかわらず,検出率の向上に若干の効果が見られた.
  • 後藤 淳, 大竹 清敬, Stijn De Saeger, 橋本 力, Julien Kloetzer, 川田 拓也, 鳥澤 健太郎
    2013 年 20 巻 3 号 p. 367-404
    発行日: 2013/06/14
    公開日: 2013/09/14
    ジャーナル フリー
    本論文では,地震や津波などの災害時に個人からソーシャルメディア上に発信される大量の書き込みから,救援者や被災者が欲している情報を自動的に取得する情報分析システムについて報告する.このシステムでは,質問応答技術により,災害時の被災地の状況や救援状況を俯瞰的に把握し,被災地からの想定外も含めた情報を取得することを目的としている.システムで利用している質問応答処理では構文パターンの含意に基づき質問文を拡張し,ソーシャルメディアへの書き込みに対して地名・場所名を補完することにより,幅広い質問に対応する.さらに,本システムを拡張することにより,被災地からの重要な情報提供が必ずしも救援者へ届かない問題に対応できることについて述べる.NPO や自治体などの救援者が状況把握のための質問を予め登録しておけば,救援を望む被災者が Twitter や BBS 等へ書き込んだ時点で,情報を求める側と提供する側の双方に自動的に通知できる.これにより救援者と被災者の双方向のコミュニケーションが担保され,救援活動がより効率的になると期待される.本システムの質問応答性能を我々が用意した 300 問のテストセットのうち回答が対象データに含まれる 192 問を用いて評価したところ 1 質問あたり平均 605.8 個の回答が得られ,再現率は 0.519,適合率は 0.608 であった.
  • 相田 慎, 新堂 安孝, 内山 将夫
    2013 年 20 巻 3 号 p. 405-422
    発行日: 2013/06/14
    公開日: 2013/09/14
    ジャーナル フリー
    東日本大震災初期,Twitter に寄せられた膨大なツィートには,緊急性の高い救助要請候補が多数含まれていたものの,他の震災関連ツィートや「善意のリツィート」によって,通報されるべき情報が埋もれてしまった.この様な状況を解消するために,筆者らは 2011 年 3 月 16 日,Twitter 上の救助要請情報をテキストフィルタリングで抽出し,類似文を一つにまとめ一覧表示する Webサイトを開発・公開した.本論文では,本サイト技術のみならず,通報支援活動プロジェクト #99japan との具体的な連携・活用事例についても詳述する.なお #99japan は,救助状況の進捗・完了報告を重視する Twitter を用いた活動であると共に,発災 2 時間後に 2 ちゃんねる臨時地震板ボランティアらによって立ち上げられたスレッドに由来する.
  • 大和田 裕亮, 水野 淳太, 岡崎 直観, 乾 健太郎, 石塚 満
    2013 年 20 巻 3 号 p. 423-459
    発行日: 2013/06/14
    公開日: 2013/09/14
    ジャーナル フリー
    東日本大震災では安否確認や被災者支援のためにTwitterが活躍したが,一方で多種多様な情報が流通し,混乱を招いた.我々は,情報の信憑性や重要性を評価するには,ツイート空間の論述的な構造を解析・可視化し,情報の「裏」を取ることが大切だと考えている.本稿では,ツイートの返信および非公式リツイート(以下,両者をまとめて返信と略す)に着目し,ツイート間の論述的な関係を認識する手法を提案する.具体的には,返信ツイートによって,投稿者の「同意」「反論」「疑問」などの態度が表明されると考え,これらの態度を推定する分類器を教師有り学習で構築する.評価実験では,返信ツイートで表明される態度の推定性能を報告する.さらに,本手法が直接的に返信関係のないツイート間の論述的な関係の推定にも応用できることを示し,ツイート間の含意関係認識に基づくアプローチとの比較を行う.
  • 鍋島 啓太, 渡邉 研斗, 水野 淳太, 岡崎 直観, 乾 健太郎
    2013 年 20 巻 3 号 p. 461-484
    発行日: 2013/06/14
    公開日: 2013/09/14
    ジャーナル フリー
    東日本大震災では,「コスモ石油の爆発で有害物質の雨が降る」などの誤情報の拡散が問題となった.本研究の目的は,東本日大震災後 1 週間の全ツイートから誤情報を網羅的に抽出し,誤情報の拡散と訂正の過程を分析することである.本稿では,誤情報を訂正する表現(以下,訂正パターン)に着目し,誤情報を認識する手法を提案する.具体的には,訂正パターンを人手で整備し,訂正パターンにマッチするツイートを抽出する.次に,収集したツイートを内容の類似性に基づいてクラスタリングし,最後に,その中から誤情報を過不足なく説明する1文を選択する.実験では,誤情報を人手でまとめたウェブサイトを正解データとして,評価を行った.また,誤情報とその訂正情報の拡散状況を,時系列で可視化するシステムを構築した.本システムにより,誤情報の出現・普及,訂正情報の出現・普及の過程を分析できる.
  • 宮部 真衣, 田中 弥生, 西畑 祥, 灘本 明代, 荒牧 英治
    2013 年 20 巻 3 号 p. 485-511
    発行日: 2013/06/14
    公開日: 2013/09/14
    ジャーナル フリー
    マイクロブログの普及により,ユーザは様々な情報を瞬時に取得することができるようになった.一方,マイクロブログでは流言も拡散されやすい.流言は適切な情報共有を阻害し,場合によっては深刻な問題を引き起こす恐れがある.これまで,マイクロブログ上の流言拡散に関する分析は多かったが,ある流言がどのような影響を引き起こすかについての考察はない.本論文では,東日本大震災直後の Twitter を材料とし,どのような流言が深刻な影響を与えるかを,有害性と有用性という観点からの主観評価および修辞ユニット分析により分析した.その結果,震災時の流言テキストの多くは行動を促す内容や,状況の報告,予測であること,また,情報受信者の行動に影響を与えうる表現を含む情報は,震災時に高い有用性と有害性を持つ可能性があることを明らかにした.
技術資料
  • 奥村 貴史, 金谷 泰宏
    2013 年 20 巻 3 号 p. 513-524
    発行日: 2013/06/14
    公開日: 2013/09/14
    ジャーナル フリー
    災害は被災地住民の健康に多大な影響を及ぼし,その対応に際し保健医療分野に膨大な文書を生じる.そこで,災害時の保健医療活動を支援するため,自然言語処理による各種文書の効率的処理が期待されている.本稿では,保健医療の観点から,そうした情報の特性を被災者,被災者集団,支援者のそれぞれについて整理したうえで,自然言語処理が有効と考えられる諸課題を列挙する.そのうえで,2011 年に発生した東日本大震災において筆者らが関わった日本栄養士会支援活動報告,石巻圏合同救護チーム災害カルテ,医療や公衆衛生系メーリングリスト情報の 3 つの事例を紹介し,「健康危機管理」に自然言語処理が果たしうる貢献について検討する.これらの事例に示されるように,災害時には保健医療に関わる膨大なテキストが発生するものの,保健医療分野の専門家は大量の自由記載文を効率的に処理する手段を有していない.今後,東日本大震災において生じたデータを活用し,保健医療情報における大量の自由記載文を効率的に処理する備えを行っておくことが望ましい.
feedback
Top