知能と情報
Online ISSN : 1881-7203
Print ISSN : 1347-7986
ISSN-L : 1347-7986
最新号
選択された号の論文の10件中1~10を表示しています
目次
会  告
特集:政治・経済とコトバ
原著論文
  • 掛谷 英紀, 大南 勝
    原稿種別: 原著論文
    2019 年 31 巻 2 号 p. 617-625
    発行日: 2019/04/15
    公開日: 2019/04/15
    ジャーナル オープンアクセス

    本論文では,国会会議録を機械学習することで,短命に終わる議員・大臣の発言の特徴を分析する.短命議員については,マスコミ報道の追い風に乗って大量当選したいわゆる「チルドレン議員」を対象に,一期で終わってしまった人物と,その後議員を続けることができた人物の間に,国会質問でどのような違いが見られるかを分析する.短命大臣については,大臣就任後舌禍や不祥事によって辞任した人物と,長期間大臣を務め上げた人物の間に,国会答弁でどのような違いが見られるかを分析する.機械学習には最大エントロピー法による学習と,判別分析の考え方を応用して特徴抽出を行うナイーブ・ベイズ法による学習をそれぞれ実装し,その分類性能を比較する.分析の結果,短命議員の質問には,尊敬語・謙譲語などの丁寧な表現が少ないこと,損得勘定に関する表現の使用が多いことが分かった.また,短命大臣の答弁には,国会の場にふさわしくない砕けた表現が多用されるほか,高い理想や自身の頑張りを主張する発言が多い傾向が見出された.

  • 坂地 泰紀, 和泉 潔, 松島 裕康, 川瀬 和哉, 林 寛
    原稿種別: 原著論文
    2019 年 31 巻 2 号 p. 626-635
    発行日: 2019/04/15
    公開日: 2019/04/15
    ジャーナル オープンアクセス

    本論文では,地方銀行が業務利用のために蓄積しているテキストを用いて,その地域の景況感を示すインデックスを生成する手法を提案する. 銀行内には業務で扱っている様々なテキストデータがある. 我々は,その中でも接触履歴に着目した. 接触履歴は,行員が顧客と何かしらのやり取りを行った際に記録されるデータであり,様々なことが記述されている. そのような接触履歴を解析すれば,その地域の景況感が分かるのではないかと,我々は考えた. そこで,本研究では,接触履歴から地域景況インデックスを生成した. まず,景況インデックス作成に最適なモデルを景気ウォッチャー調査と接触履歴を用いて検討した. その後,そのモデルを用いて景況インデックスを作成し,既存の指標と比較することで,性能を評価し,高い性能を示した.

  • 北島 良三, 酒井 浩之, 上村 龍太郎
    原稿種別: 原著論文
    2019 年 31 巻 2 号 p. 636-644
    発行日: 2019/04/15
    公開日: 2019/04/15
    ジャーナル オープンアクセス

    本論文は企業トップによるメッセージが企業パフォーマンスに与える影響について調査したものである.トップメッセージは主に社外向けメッセージであるが,今後の目標,これまでの総括,経営理念などが含まれているため,企業活動がトップメッセージに記載された内容から逸脱することは考えにくく,収益性に影響を及ぼすメッセージであると考えられる.トップメッセージは各企業のWebページで公開されているが数が多いため,Webクローリングを用いた自動収集を行った.収益性とトップページの関係調査は長期的に行う必要があるため,収集自動化は継続的な研究を容易にする.本研究では自動取得されたトップメッセージから62社分を対象に解析を実施し収益性との関係を調査した.解決すべき課題により今後精査が必要であるが,解析の結果,グループ企業についての言及が収益性に影響を与えている可能性があること を得た.

  • 桧森 拓真, 木村 泰知, 坂地 泰紀, 荒木 健治
    原稿種別: 原著論文
    2019 年 31 巻 2 号 p. 645-652
    発行日: 2019/04/15
    公開日: 2019/04/15
    ジャーナル オープンアクセス

    本研究では,地方議会会議録に含まれるテキストの発言箇所を自動で推定する.実験のデータセットは,平成23年4月から平成27年3月までの4年間の4つの自治体の議会会議録であり,青森県,東京都,大阪府,福岡県の会議録に対して,人手で発言文と発言以外の文にアノテーションを行った.「4年間のデータを利用した発言文の推定実験」では,学習データと評価データに「同一自治体のデータ」を利用した実験,および,「異なる自治体のデータ」を利用した実験を行なった.実験の結果,SVMの平均正解率が最も高く,それぞれ,0.985,0.951となった.また,少量の学習データによる「1年間のデータを利用した推定実験」では,LSTMとSVMの比較を行った.比較実験の結果,LSTMの平均正解率が0.926となりSVMの平均正解率よりも6.1ポイント上回る結果となった.

  • 酒井 浩之, 松下 和暉, 北島 良三
    原稿種別: 原著論文
    2019 年 31 巻 2 号 p. 653-661
    発行日: 2019/04/15
    公開日: 2019/04/15
    ジャーナル オープンアクセス

    本研究では,決算短信から業績要因を含む文(例えば「半導体製造装置の受注が好調でした。」)を抽出する手法を提案する.決算短信からの業績要因文の抽出は既提案手法が存在するが[1],既提案手法は精度はよいが再現率が50%程度であり,多くの業績要因文を抽出することができないという問題があった.そこで,本研究では既提案手法によって抽出された業績要因文をより精度よく絞り込むことで学習データを自動生成し,その学習データによる深層学習を用いて既提案手法よりも多くの業績要因文を抽出する.評価の結果,既提案手法に比べて精度を大きく落とすことなく,高い再現率を達成することができた.

  • 内田 ゆず, 高丸 圭一, 乙武 北斗, 木村 泰知
    原稿種別: 原著論文
    2019 年 31 巻 2 号 p. 662-671
    発行日: 2019/04/15
    公開日: 2019/04/15
    ジャーナル オープンアクセス

    我々は,47都道府県議会本会議を対象として地方議会会議録コーパスを構築した.このコーパスに収録されている発言文には,発言者の氏名・役職・選挙区・生年・性別等の情報が付与されている.したがって,このコーパスを利用すると全国の都道府県議会議員の議会活動の一端を可視化することができる.本論文では,議員の年齢・性別構成を明らかにしたうえで各議員の発言文字数を集計し,議員の属性による発言量の違いを考察する.また,対数尤度比を用いて議員の属性ごとの特徴語を抽出し,議員の属性による発言内容の違いを考察する.その際,政治に関連する用語を抽出する指標として「政治語彙度」を新たに提案する.

一般論文
原著論文
  • 吉川 伸一
    原稿種別: 原著論文
    2019 年 31 巻 2 号 p. 672-689
    発行日: 2019/04/15
    公開日: 2019/04/15
    ジャーナル オープンアクセス

    最近の計算機技術や計測技術の発展・成熟の影響で,多次元データを取り扱う機会が増えている.多次元データ処理を主眼とする研究報告は多く,それらは多次元データの統計的解析の枠組みを構成することを目的としている.多次元データ処理を主眼とする統計的解析の方法論の構築は重要である.本論文では,多次元確率空間から得られるファジィ区間データに基づく近似的ベイズ推定の方法を提案する.ただし,提案する手法はZadehが提唱したファジィ事象の確率概念に基づいている.ファジィ区間データはメンバシップ関数を用いて特徴づけられ,それを直接的に取り扱うと計算上非常に複雑になるという難点がある.しかしながら,本論文で提案しているメンバシップ関数の中心値を代表値として用いる手法であればその問題を解決できる.また,母集団のパラメータに関する事前確率分布が多次元正規分布であり,かつファジィ区間データも多次元正規分布から得られるとき,事後確率分布も近似的に多次元正規分布となることが提案している手法により解析的に示すことができる.さらに,提案手法を具体的に説明するために数値例を行っている.ここでは,台形型メンバシップ関数が左右対称型ではなく,非対称な形状として得られる状況を設定し,提案手法が柔軟に対処できることを示している.その結果,本手法の有用性を示すことができた.

  • 宮島 洋文, 久冨木 大夢, 重井 徳貴, 宮島 廣美
    原稿種別: 原著論文
    2019 年 31 巻 2 号 p. 690-699
    発行日: 2019/04/15
    公開日: 2019/04/15
    ジャーナル オープンアクセス

    ファジィ推論システムの学習に関する多くの研究が行われている. これらの研究 の多くが最急降下法を用いているが, パラメータの初期値設定により, 学習後 のモデルの精度やルール数が影響をうけることが指摘されている. これを改善 するための多くの方法が提案されているが, 必ずしも満足できるシステム構成 とはなっていない. ベクトル量子化を使って, パラメータの初期値を設定する 方法は, 少ないルール数で高い精度を実現する方法の一つとして知られている. 一方で, この方法の問題点としては, 後件部の重みパラメータの初期値設定を 行う効率的な方法が知られていないことである. それゆえ, 前件部パラメータ と後件部パラメータの初期値を設定する方法を最急降下法に取り入れることで, この学習法の能力改善が期待できる. 本論文では, あらかじめ学習用の入出力 データを用いて, ベクトル量子化により入力空間の分割とその空間での重み設 定を行い, これらをパラメータの初期値として用いるファジィ推論システムの 学習法を提案し, その有効性を示す.

feedback
Top