自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
24 巻, 1 号
選択された号の論文の7件中1~7を表示しています
巻頭言
論文
  • 下岡 和也, 徳久 良子, 吉村 貴克, 星野 博之, 渡部 生聖
    2017 年 24 巻 1 号 p. 3-47
    発行日: 2017/02/15
    公開日: 2017/05/15
    ジャーナル フリー

    高齢者の認知症や孤独感の軽減に貢献できる対話ロボット開発のため,回想法に基づく傾聴を行う音声対話システムの開発を行った.本システムは,ユーザ発話の音声認識結果に基づき,相槌をうったり,ユーザ発話を繰り返したり,ユーザ発話中の述語の不足格を尋ねたりする応答を生成する.さらに,感情推定結果に基づき,ユーザ発話に対して共感する応答を生成する.本システムの特徴は,音声認識結果に誤りが含まれることを前提とし,音声認識信頼度を考慮して応答を生成する点である.110 名の一般被験者に対する評価実験の結果,「印象深い旅行」を話題とした場合で,45.5% の被験者が 2 分以上対話を継続できた.また,システムの応答を主観的に評価した結果,約 77% のユーザ発話に対して対話を破綻させることなく応答生成ができた.さらに,被験者へのアンケートの結果,特に高齢の被験者から肯定的な主観評価結果が得られた.

  • 藤田 早苗, 服部 正嗣, 小林 哲生, 奥村 優子, 青山 一生
    2017 年 24 巻 1 号 p. 49-73
    発行日: 2017/02/15
    公開日: 2017/05/15
    ジャーナル フリー

    本稿では,子どもに「内容」と「読みやすさ」がぴったりな絵本を見つけるためのシステム「ぴたりえ」を提案する.本システムは,親や保育士,司書など,子どもに絵本を選ぶ大人が利用することを想定している.絵本を読むことは,子どもの言語発達と情操教育の両面で効果が期待できる.しかし,難しさも内容も様々な絵本が数多くある中で,子ども 1 人 1 人にとってぴったりな絵本を選ぶのは容易なことではない.そこで,ぴたりえでは,ひらがなの多い絵本のテキストを高精度に解析できる形態素解析や,文字の少ない絵本に対しても精度の高いテキストの難易度推定技術などの言語処理技術により,子どもにぴったりな絵本を探す絵本検索システムを実現する.本稿では,こうした言語処理技術を中心にぴたりえの要素技術を紹介し,各技術の精度が高いことを示す.また,システム全体としても,アンケート評価の結果,ぴたりえで選んだ絵本は「読みやすさ」も「内容」も,5 段階評価で平均値が 4.44~4.54 と高い評価が得られたことを示す.

  • 小川 泰弘, 外山 勝彦
    2017 年 24 巻 1 号 p. 75-93
    発行日: 2017/02/15
    公開日: 2017/05/15
    ジャーナル フリー

    計算機による対訳表現抽出を可視化することにより,対訳辞書の構築や翻訳を支援するツール Bilingual KWIC を開発した.本ツールは,入力されたキーワードに対する対訳表現を自動的に推定し,それらを含む原言語文と対象言語文をそれぞれ KWIC 形式で表示することにより,ユーザの翻訳作業などを支援する.技術的には,形態素解析などを利用せずに文字列情報だけから対訳を抽出するため,どのような言語対にも適用可能であり,さらには単語以外の表現に対しても対訳を表示することが可能である.また対訳表現を KWIC 形式で表示することにより,システムの抽出誤りに対する修正を容易にするだけでなく,派生表現の獲得や複数の対訳表現の比較も可能としている.本稿では,Bilingual KWIC の特徴と開発経緯について述べる.

  • 関 喜史, 福島 良典, 吉田 宏司, 松尾 豊
    2017 年 24 巻 1 号 p. 95-115
    発行日: 2017/02/15
    公開日: 2017/05/15
    ジャーナル フリー

    推薦システムのユーザ体験を高めるために重要な指標の 1 つが多様性 (Diversity) である.多様性は推薦システムが提示するリスト内には様々なコンテンツが含まれるべきという考え方であり,過去の研究では多様性が含まれるリストの方がユーザに好まれるとされている.しかし実際のサービス上で推薦システムを検証したという報告は少なく,サービス上で多様性がユーザにどのような影響を与えるのかは明らかになっていない.本研究では実際にサービスとして提供されているウェブページ推薦システムを分析し,その推薦システムに多様性を導入して比較を行った事例について報告する.まず多様性が導入されていない推薦システムのユーザ行動を分析し,結果としてリストの中位以降に表示するウェブページに課題があることを明らかにした.その上で多様性を導入し,多様性のない既存システムとサービス上でのユーザ行動を比較した.結果として継続率やサービス利用日数が有意に改善していることを示し,従来研究で示されていた多様性を含む推薦リストの方がユーザに好まれるということを実サービス上で示した.そして利用日数が増えるに従ってリスト全体のクリック数が改善していくこと,特にリスト下部のクリック率が多様性のない手法では下がっていくのに対して,多様性のある手法では向上していくことを示した.

  • 牧野 拓哉, 野呂 智哉, 岩倉 友哉
    2017 年 24 巻 1 号 p. 117-134
    発行日: 2017/02/15
    公開日: 2017/05/15
    ジャーナル フリー

    本論文では,ユーザからの自然文による問い合わせを対応する Frequently Asked Question (FAQ) に分類する文書分類器を用いた FAQ 検索手法を提案する.本文書分類器は,問い合わせ中の単語を手掛かりに,対応する FAQ を判別する.しかし,FAQ の多くは冗長性がないため,FAQ を学習データとして文書分類器を作成する方法では,ユーザからの多様な問い合わせに対応するのが難しい.そこで,この問題に対処するために,蓄積されたユーザからの問い合わせ履歴から学習データを自動生成し,文書分類器を作成する.さらに,FAQ および文書分類用に自動生成した学習データを用いて,通常使われる表層的な手がかりに加えて,本文書分類器の出力を考慮するランキングモデルを学習する.ある企業のコールセンターの 4,738 件の FAQ および問い合わせ履歴 54 万件を用いて本手法を評価した.その結果,提案手法が,pseudo-relevance feedback および,統計的機械翻訳のアライメント手法を用いて得られる語彙知識によるクエリ拡張手法と比較し,高いランキング性能を示した.

技術資料
  • 高橋 和子, 多喜 弘文, 田辺 俊介, 李 偉
    2017 年 24 巻 1 号 p. 135-170
    発行日: 2017/02/15
    公開日: 2017/05/15
    ジャーナル フリー

    社会学では,職業や産業は性別や年齢などと同様に重要な変数であるとの認識から,正確を期するために,自由回答で収集したデータを研究者自身によりコードに変換することが多い.これは職業・産業コーディングとよばれるが,大規模調査の場合,膨大な労力と時間がかかる上に,結果における一貫性の問題も存在する.そこで,ルールベース手法と機械学習 (SVM) を適用したコーディング自動化システムを開発した.本システムは,国内・国際標準の職業・産業コードを第 3 位まで予測し,第 1 位の予測コードには,自動コーディング後に人手によるチェックが必要か否かの目安となる3段階の確信度も付与する.現在,本システムは,東京大学社会科学研究所附属社会調査・データアーカイブ研究センター (CSRDA) から Web による利用サービスが試行提供されており,研究目的であれば,だれもが指定された形式の入力ファイルをアップロードして,希望するコードに変換された結果ファイルをダウンロードすることができるようになっている.

feedback
Top