人工知能学会全国大会論文集
Online ISSN : 2758-7347
第35回 (2021)
選択された号の論文の514件中201~250を表示しています
  • 宮本 賢良, 渡邊 紀文, 武藤 佳恭
    セッションID: 2J1-GS-8a-02
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    人の協調行動には,相手に合わせる受動的な行動戦略だけでなく,自らが先に行動する能動的な行動戦略がある.人のように戦略を使い分け,コミュニケーションを取るロボットを実現するためには,このような行動戦略を獲得させる必要があるが,それらの戦略を切り替えるためのメタ戦略をどのように獲得すべきかは明らかになっていない. 本研究では,エージェントの戦略の変化によって人の行動が変化するのかについての行動実験を行う.グリッド状の空間で受動的に道を譲る・能動的に道を譲らせる複数の戦略を取るエージェントとすれ違う実験を行い,被験者が選択する行動と,強化学習によって獲得したエージェントの行動を比較する.実験結果より,人は対向するエージェントの行動から,その戦略の変化を読み取っていることが示された.

  • 植田 有咲, ALY Magassouba, 平川 翼, 山下 隆義, 藤吉 弘亘, 杉浦 孔明
    セッションID: 2J1-GS-8a-03
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    高齢者や障害者を支える人手不足の解決策として家庭用ロボットは有望視されている. 家庭用ロボットにとって物体配置タスクは基本的動作であるので, 高い精度および安全性が望まれる. 衝突は環境内の物体同士の運動量に大きく依存しているため, 予測することは難しい. そこで, 本論文では物体配置タスクでの衝突に関するphysical reasoning手法, Transformer PonNetを提案する. Transformer PonNetは衝突可能性を予測し, 衝突に関連する部分の可視化を行う. 既存手法と異なり, 正確な大きさが分からない物体に対しても適応可能である. また, 単純なself-attention機構よりも複雑な特徴量間の関係を扱うことができるTransformer Perception Branchを提案する. 家庭用ロボットを用いてシミュレーション, 実機データセットを構築し, 実機データセットで82.5%という精度を得た.

  • 原田 悠斗, 長井 隆行, 堀井 隆斗, 青木 達哉
    セッションID: 2J1-GS-8a-04
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    近年,ロボット産業は,人間の生活空間で活躍するロボットの開発に分野を拡大しつつある.中でも物体を扱うロボットは、物体を認識し,位置・姿勢を厳密に把握しなければならない.しかし,見る角度によっては姿勢が一意に決定しにくい物体や,姿勢推定器の訓練データに無い姿勢で設置された物体に対して,姿勢を推定すると大きな誤差が生じる.一方で,物体に対して適切なカメラの位置で推定を行うことで正確な位置・姿勢を推定する事が可能である.そこで本研究では,推定誤差が少ないと見込まれる物体に対するカメラの位置関係を探索し,より正確な6次元姿勢を推定することを目指す.提案手法では.姿勢推定の結果から観測した物体と状況を仮想空間に投影する.そして仮想空間内において複数の視点で物体の姿勢推定を行い,推定誤差の少ない観測点を推論し,実世界で移動する.移動後の推定結果の正確性を定量化することで,仮想空間を更新しながら反復的に探索を行う.シミュレーション環境で実験を行い,提案手法の有効性を示す.

  • 田嶋 沙和子, 小山 宗三, 栗原 聡
    セッションID: 2J1-GS-8a-05
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    現在,日本では少子高齢化が急速に進んでおり,製造業における労働力不足が続くことが懸念されている.この課題を解決するために,人と同じ空間で働くことができる協働ロボットが導入されている.円滑に共同作業を行うためには,ロボットが人の行動や意図を推測し,人に合わせて行動を取る必要がある.しかし,現在の協働ロボットは人とインタラクションしながら作業を行うことは難しい.本論文では,他者が介入した場合にも柔軟に自分の行動を決定する行動選択ネットワークを提案する.提案手法では,Agent Network Architecture(以下ANA)を拡張し,他者の内部状態の推測と自分の行動のプランニングの両方を可能にした. 実験は積み木タスクで行い,他者の介入の仕方によって,自分の行動系列がどのように変化するか検証した.結果は,他者が協力的なときは他者の意図に合わせた行動,他者が邪魔をするときには挽回する行動,他者が何もしないときには自分だけでゴールを達成する行動を取ることが確認された.いずれの場合も臨機応変に自分が実行すべき行動を選択し,最終的にゴールを達成することが出来た.

  • 長野 匡隼, 中村 友昭, 長井 隆行, 持橋 大地, 小林 一郎, 高野 渉
    セッションID: 2J3-GS-8b-01
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    本稿では,時系列の画像データを教師なしで分節化する手法を提案する. 人は知覚した高次元の時系列情報を意味を持つ単語や単位動作に分節・分類することで認識している.ロボットが単語や動作を柔軟に学習するためにも,このような教師なしで分節・分類する能力は重要であると考えられる.そこでこれまでに,深層生成モデルと統計モデルを組み合わせたHierarchical Dirichlet Processes-Variational Autoencoder-Gaussian Process-Hidden Semi-Markov Model (HVGH)により,教師なしで高次元の時系列データの特徴抽出と,単位系列への分節・分類を可能とした.HVGHは,VAEにより高次元データを分節化に適した低次元の潜在変数へと圧縮し,その遷移をガウス過程を用いて表現することで,高次元の複雑な時系列データの分節化を可能とする.本稿では,HVGHを拡張することにより,時系列の画像情報の分節・分類が可能な手法を提案する.実験では,3次元迷路のエージェント視点の動画像データを用いて,提案手法による分節・分類の推定精度が既存手法より高いことを示す.

  • 平川 拓実, 長野 匡隼, 中村 友昭
    セッションID: 2J3-GS-8b-02
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    人間の幼児は明示的な正解を与えなくとも音声信号のような二重の構造を持つ時系列データから音素や単語を学習することができる.音声信号に限らず人間の動作等でも多重の構造を持つ時系列データは存在し,そのような構造の学習は,人間の言語や動作を自律的に学習可能なロボットの実現のために重要であるといえる. これまで,多重分節構造を学習するための手法として,音声信号を教師なしで音素や単語に分割,分類(分節化)するNonparametric Bayesian Double Articulation Analyzer(NPB-DAA)が提案されてきた.しかし,この手法は二階層の統計モデルであるため,二重以上の構造を持つ時系列データを扱うことができなかった. そこで本稿では多重分節構造を持つ時系列データの構造を教師なしで学習可能な統計モデルを提案する.また,音声データを用いた予備実験の結果について紹介する.

  • 篠田 一聡, 竹澤 祐貴, 鈴木 雅大, 岩澤 有祐, 松尾 豊
    セッションID: 2J3-GS-8b-03
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    Instruction Followingとは自然言語で記述された指示を視覚的環境での行動の系列に変換するタスクである. 近年,物体との相互作用を必要とする指示に従う研究を促進するためにInteractive Instruction Followingタスクが提案された. このタスクにおける既存モデルは多様な物体や言語指示に対して頑健ではないことが本研究によって明らかになった. これは実応用において深刻な問題につながる可能性がある. 本研究ではニューラルな特徴抽出が画像や言語における小さな摂動に対してかなり敏感であることが原因だと想定した. そこで本研究ではNeuro-Symbolic手法の導入によってこの問題の解決を目指す. 具体的には物体検知と意味解析を行うモジュールの導入によって記号表現上での推論を可能にする. 本研究ではALFREDデータセットでの実験によって,提案手法は物体との相互作用を必要とするサブタスクにおいて成功率を大幅に向上することを示した.

  • 谷口 彰, 村上 太亮, 谷口 忠大
    セッションID: 2J3-GS-8b-04
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    幼児は語彙獲得において、音声間に含まれる音韻の統計的な手がかりを用いて音素や単語を獲得できることが知られている。またその際、同時に環境中に存在する事物との共起性を活用していることが指摘されている。本研究では、音韻情報と物体情報の共起性を活用した教師なし音素・単語発見手法を提案する。提案手法は、音韻特徴から二重分節解析を行うNonparametric Bayesian Double Articulation Analyzer (NPB-DAA)と物体から得られるマルチモーダル情報の物体カテゴリ分類手法であるMultimodal Latent Dirichlet Allocation (MLDA) を統合したものである。実験では、物体に関連した単語の発見における共起情報を用いた場合の影響を評価する。

  • 青嶋 雄大, 松原 崇, 谷口 隆晴
    セッションID: 2J3-GS-8b-05
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    物理シミュレーションを行う際には, エネルギー保存則などの物理法則を満たすことが重要である. 近年の研究では, ニューラルネットワークを用いて物理法則を満たして数値積分を行う手法が提案されてきた. これらの手法では, 学習の際に位置のデータと正準運動量や速度のデータが必要である. しかしながら, 速度は計測する際には計測誤差が出やすいため, 正確な値を得るのは困難であるという問題がある. 本研究では, 離散時間でのラグランジュ系において, 位置のデータのみからニューラルネットワークを学習して, エネルギー保存則を満たしながら数値積分を行う手法を提案する. 提案手法により, 速度の計測誤差の影響を受けずに, ニューラルネットワークを用いて数値積分を行えるようになる. 数値実験により, 提案手法がエネルギーを保存した数値積分を行えることを示した.

  • 竹澤 祐貴, 篠田 一聡, 鈴木 雅大, 岩澤 有祐, 松尾 豊
    セッションID: 2J4-GS-8c-01
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    Instruction Followingは,人々が生活する空間でロボットを操作するための重要な課題の一つであり,近年様々な研究が行われているが,家事のような複雑なタスクを達成することは未だ困難である.一般に,タスクは複数のスキルによって構成されていると考えられるため,この構成性を表現できるタスク表現を得ることができれば,複雑なタスクも達成できることが期待できる.このようなタスク表現を得るために,近年埋め込みベクトル上で演算できるようにタスクを表現するCompositional Plan Vector (CPV)が提案され,CPVを用いることで多くのスキルが必要となるタスクに対しても汎化できることが示された.本研究では,CPVをInstruction Followingに適用するためにさらに発展させる.具体的には,タスク全体の表現から,過去の行動から予測した既に達成されたタスクの表現を引くことができるように学習することを提案する.現実に近いシュミレータ上での実験によって,提案手法を用いることでタスクの構成性を学習することができ,タスク達成率が向上することを示した.

  • 内部 英治
    セッションID: 2J4-GS-8c-02
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    強化学習は環境のモデルを陽に推定し学習に利用するモデルベース法と,実際または仮想的に得られた状態行動遷移対から学習するモデルフリー法に大別できる.我々はこれまでに性質の異なる複数のモデルフリー強化学習器とモデルベース強化学習器を並列に学習させつつ,性能に応じて学習器を動的に切り替える手法を提案し,単純なアルゴリズムが複雑なアルゴリズムの学習に貢献することを示した.しかし各学習器が意思決定に要する計算時間を考慮していなかったため、制御周期の短い単純なモデルフリー強化学習器を用いる利点を十分に示すことができなかった. そこで本研究では各学習器の制御周期の違いを考慮した非同期並列強化学習法を提案する.主要な貢献は各学習器で収集した経験を保存するバッファの分離と,制御周期の違いを吸収する経験再生バッファの変換である.提案手法をベンチマーク課題であるMuJoCoに適用し制御周期を考慮しない場合と比較した.学習の初期段階では制御周期の短いモデルベース法,学習中期では複雑なモデルベース法,学習後期ではモデルフリー法が選択される結果が得られた.

  • 西村 卓真, 長野 匡隼, 中村 友昭
    セッションID: 2J4-GS-8c-03
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    人は,養育者などから発せられる単語と物体を結びつけて,物の名前を学習している.その際に,養育者が注意している物体を特定する能力である共同注意が,語意の学習を効率化している.ロボットにおいても,共同注意を用いて様々な環境で柔軟に語意を学習する能力は重要であると考えられる.そこで本稿では,複数の物体が存在する環境下で,ロボットが共同注意を用いて教示者が注目している物体を特定し,その物体情報と教示発話から語意を学習する手法を提案する.提案手法では,Region Proposal Networkを用いて物体を複数検出し,その中から共同注意と特徴の共起性に基づいて教示対象物体を1つ選択する.Multimodal LDAにより,教示発話と選択された物体を結びつけることで語意を学習する.実験では,複数の物体が存在する環境下において,提案手法により教示対象物体を特定し語意の学習が可能であることを示した.

  • 古川 和磨, 谷口 彰, 萩原 良信, 谷口 忠大
    セッションID: 2J4-GS-8c-04
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    記号創発システムをモデル化するためのマルチエージェントマルチモーダルカテゴリ形成は,以前の研究で提案された.しかし,このモデルは記号,すなわち単語を物体カテゴリを表す潜在変数の事前確率分布とみなしており,記号を観測情報,すなわちグラフィカルモデルのリーフノードとみなしていた既存のマルチモーダルカテゴリ形成のモデルとの互換性が無かった.本研究では,以前のモデルにおける記号に対応する変数のtail-to-tail接続をhead-to-head接続に修正することで,新しいモデルを提案する.実験では,以前に提案したモデルと今回提案したモデルを比較した.実験の結果より,修正したモデルの性能は,元のモデルと同等であることが示された.

  • 近藤 生也, 岩澤 有祐, 松尾 豊
    セッションID: 2J4-GS-8c-05
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    エージェントが得る観測が時間やエージェントの行動に従ってどのように発展するかを記述する世界モデルは,プランニングやサンプル効率の向上,未知のタスクへの高速な適応などの上で重要である.特に近年は機械学習・深層学習を中心としたデータの関係を学習する技術により,真のモデルが未知のような複雑な環境でもモデルを利用するアプローチに関する研究が進んでいる.しかし,世界に関する知識が未完成な中で世界モデルを構築するためのデータをどのように獲得すればよいのかについての議論はあまり行われていない.本研究では,スキルの概念を世界モデルの学習に組み合わせることの有効性について調査する.具体的には,まず世界を探索するようなスキルを教師なし+真の環境とのインタラクションなしで獲得した上で,学習されたスキルに基づいた探索方策により収集されたデータを利用する方法を提案した.評価には代表的な物理シミュレータであるMuJoCoを利用し,ランダムに探索する従来手法と比べてエキスパート起動をより正確に予測する世界モデルが獲得できることを確認した.

  • Rina KOMATSU, Tad GONSALVES
    セッションID: 2N1-IS-2a-01
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    This study deals with photographic face to conditional artistic face illustrations in the form of portrait, anime and emaki following the content of conditional input. Different from cityscape to segmentation task, face to illustration translation task requires large texture changing especially translation to anime face which includes characteristic edges and shapes. Related works try mapping between domains with a large number of varying features. However, incorporating more modules for adopting geometric change level translation learning and reusing Generators for keeping cycle consistency exorbitantly increases the computational cost of model training. Our study aims to establish conditional translation model which has the potential to learn diverse and large feature mappings using only a small number of training parameters. We developed Multi-CartoonGAN employing central biasing normalization as conditional input and adaptive layer instance normalization to make translation learning robust. As can be seen from our translation learning and test demonstration, our model greatly reduces the computational cost of parameter training and performs conditional translation even when the target domain has features quite different from the real-world face.

  • Naoki NONAKA, Jun SEITA
    セッションID: 2N1-IS-2a-02
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    In the medical field, it is quite expensive to obtain labeled data that are essential to train deep neural networks (DNNs). One way to tackle this issue is to apply data augmentation, a technique to improve classification accuracy by increasing diversity of data through random but realistic transformations. Data augmentation have shown promising results in visual domain, however, transformations applied to image data cannot be directly applied to ECG data. Here we propose RandECG, a data augmentation method tailored for electrocardiogram (ECG) data classification with deep neural networks (DNNs). We explored various transformation methods and selected suitable transformations for ECG. We tested efficacy of RandECG on two different datasets, and found that the classification accuracy of atrial fibrillation can be improved up to 3.51%, without changing an architecture of DNNs.

  • Masanori HIRANO, Kiyoshi IZUMI, Hiroki SAKAJI
    セッションID: 2N1-IS-2a-03
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    This paper proposes a new model to reverse engineer and predict traders' behaviors for financial market. In this model, we used an architecture based on the transformer and residual block, and a loss function based on Kullback-Leibler divergence. In addition, we established a new evaluation metric, and consequently, succeeded in constructing a model that outperforms conventional methods and has an efficient architecture. In the future, we will build a model with higher performance and versatility. Moreover, we will introduce this model to financial simulations.

  • Jenq-Haur WANG, Hsin-Wen LIU
    セッションID: 2N1-IS-2a-04
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    Stock markets are usually affected by many factors which makes it very challenging to predict. Since there’s more information available, such as stock prices, company revenues, news reports, and technical indicators, it is common to predict stock trends using machine learning and deep learning models. In this paper, we combine news content with stock prices using fusion models for stock trend prediction. First, we utilize Long Short-Term Memory (LSTM) to learn sequential information from stock prices. Then, we combine Hybrid Attention Networks (HAN) to discover the relative importance of words from news reports to improve stock trend prediction. The experimental results show that the best macro-F1 score of 79.0 % can be achieved when we combine news content and stock prices. As compared to individual models, the performance improvement of up to 40% can be obtained. This shows the potential of our proposed approach.

  • Jiun-yi TSAI, Jia-Ying SHIH
    セッションID: 2N1-IS-2a-05
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    In this paper, we explored factors that tend to increase the number of enterovirus infections. We use government open data and data-mining techniques such as linear regression, random forest, support vector machine, and gradient boosting implemented by the XGBoost package to predict the enterovirus epidemic in Taipei and Taoyuan next week. The R-squared (also known as the coefficient of determination) of the best performing predictive model is about 0.9, showing that we can effectively predict the enterovirus epidemic through machine learning models.

  • Shihori TANABE, Ryuichi ONO, Horacio CABRAL, Sabina QUADER, Ed PERKINS ...
    セッションID: 2N3-IS-2b-01
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    Molecular networks affect the responsiveness of diseases to therapeutics. (1) The objective of the study is to identify the molecular networks related to therapeutic responsiveness in diseases. Epithelial-mesenchymal transition (EMT) and cancer stem cells (CSCs) are involved in drug resistance in cancer, and share some molecular characteristics. To reveal the molecular networks responsible for cancer malignancy, gene expression and molecular networks in diffuse-type gastric cancer (GC), which is resistant to anti-cancer drugs, and intestinal-type GC were analyzed. Since the involvement of RNA viral network was identified in GC, the molecules and causal networks in RNA viral networks, as well as in diffuse- and intestinal-type GC were explored. CSC-related networks included glioblastoma multiforme signaling pathway. (2) Outline of the conclusions of the results: Using AI methods, we generated the candidate models including Elastic-Net Classifier (L2 / Binomial Deviance) (Cross Validation score LogLoss 0.3839, AUC 0.9037) and eXtreme Gradient Boosted Trees Classifier (Cross Validation score LogLoss 0.2647, AUC 0.9565) that can distinguish the differences between diffuse- and intestinal-type GC using molecular network data. The alteration in molecular networks may affect the therapeutic responsiveness.

  • Takato Yasuno YASUNO, Hiroaki SUGAWARA, Junichiro FUJII, Ryuto YOSHIDA
    セッションID: 2N3-IS-2b-02
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    In 2021, Japan recorded more than three times as much snowfall as usual, so road user maybe come across dangerous situation. The poor visibility caused by snow triggers traffic accidents. At the night time zone, the temperature drops and the road surface tends to freeze. CCTV images on the road surface have the advantage that we enable to monitor the status of major points at the same time. Road managers are required to make decisions on road closures and snow removal work owing to the road surface conditions even at night. In parallel, they would provide road users to alert for hazardous road surfaces. This paper propose a method to automate a snow hazard indicator that the road surface region is generated from the night snow image using the Conditional GAN, pix2pix. In addition, the road surface and the snow covered ROI are predicted using the semantic segmentation DeepLabv3+ with a backbone MobileNet, and the snow hazard indicator to automatically compute how much the night road surface is covered with snow. We demonstrate several results applied to the cold and snow region in the winter of Japan January 19 to 21 2021, and mention the usefulness of high similarity between snowy night-to-day fake output and real snowy day image for night snow visibility.

  • Jianming HUANG, Zhongxi FANG, Hiroyuki KASAI
    セッションID: 2N3-IS-2b-03
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    For graph classification tasks, graph kernels based on the R-convolution framework are effective tools which aims to decompose graphs into substructures. However, the current R-convolution framework has a weak point that its aggregating strategy of substructure similarities is too simple, which is based on unweighted summation and multiplication of substructure similarities. This means that it may have less robustness. In our works, we tend to combine the Bag of Feature (BoF) model and the Adjacent Point Pattern to form a more effective framework for graph key feature extraction, which also supports large datasets.

  • Taisei NARAHA, Kouta AKOMOTO, Ikuko Eguchi YAIRI
    セッションID: 2N3-IS-2b-04
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    As deep learning research develops and models become larger and more complex, there are increasing concerns to deep learning about its' low ability of explanations to humans and it's blackbox characteristics. Model visualization research of DL has been attracting attention for a decade for a solution of this concern. VR interaction research between humans and models is a practical mean of the model visualization research which has great potential but is still in the early stages. The purpose of our study is to propose new methods for VR technology to contribute to the development of deep learning models by investigating and implementing the visualization technology of deep learning and VR research projects. In this paper, we also report our two experimental results. One is a web survey using a PC application and a demo movie VR goggles application, and the other is an evaluation experiment using VR goggles.

  • Kota ISHIZUKA, Kai KUROGI, Kosuke KAWAKAMI, Daishi IWAI, Kazuhide NAKA ...
    セッションID: 2N3-IS-2b-05
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    The standard way to create text ads is to capture searched keywords and the information on their landing pages (LP). However, this coupling of keywords and an LP increases the number of text ads per LP, which makes impossible to create ad texts for all effective combinations of keywords and LPs due to limitation of human resource. We propose a transformer-based ad text generation model using both keywords and LPs to reduce costs and time generating ad texts. We extract tags and texts in LP’s HTML, such as title, h1, h2, fine-tune a pre-trained encoder-decoder model (initialized by BERT2BERT), and HTML tag embeddings, similar to position embeddings, are passed to an input layer. The experimental results demonstrate that our model generates ad texts with a quality close to human-written ones for fluency, attractiveness, and correctness.

  • Basanta Raj GIRI, Junya MORITA, Thanakit PITAKCHOKCHAI
    セッションID: 2N4-IS-2c-01
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    In the current highly developed information society, having a habit of rumination can be dangerous for mental health. We built a system integrating the ACT-R cognitive model and nudge to prevent rumination during web browsing. Participants were divided based on ACT-R models that they used into two groups: the control group (as Normal: NOR Model) and the test group (as inverted: INV Model). For each group, the task was divided into the mood-induction task (MI) and the main task (MT). Our aim is to detect and analyze the emotional responses of participants to determine how each model affects the participants in the MT. While the participants engaged in the two tasks, we measured and collected the different emotional response data, including physiological arousal (Heart Rate data) and facial expression (eye gaze data) separately, to make a dataset. Using the dataset, the support vector machine (SVM) successfully classified NOR and INV models in the MT, while the SVM model exhibits comparatively less accuracy in classifying the participants engaging the MI task in the two groups. The results simultaneously indicate the success of the INV model to prevent rumination and the effectiveness of using heart rate and eye movement to detect rumination during web browsing.

  • Lieu-Hen CHEN, Yen-Chia CHEN, Yuh-Ming HUANG
    セッションID: 2N4-IS-2c-02
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    Although there are many researches developed for NPR image synthesis using GANs, it is still difficult to create high-quality comic portraits of a real person. Moreover, there are few studies focused on the painting styles of comic artists, though it is the style that make a comic visually unique. And for comic readers, the synthesized comic portraits can be more attractive and meaningful if the portraits are presented in the user-preferred comic styles. Therefore, in this paper, we propose a styled comic portraits synthesis system based on CycleGANs. By integrating Deep Learning and NPR techniques, we aim to transform user’s real pictures into comic portraits with features preserved and defined painting style presented. We first trained a CNN to classify the painting styles of manga artists. Then we trained our GANs with classified and augmented data set, which is generated by mapping comic characters’ 2D texture onto perturbed and deformed 3D facial models. The experiment results shown that the proposed method can successfully create clear and vivid comic portraits, which has a great potential to serve as a useful tool for social network and comic industry.

  • Chia-Hui CHANG, Chen-Yu CHEN, Arden CHIOU
    セッションID: 2N4-IS-2c-03
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    For online music streaming platforms, social network analysis has provided extra information for hit song prediction as social networks become a new channel for the public to express their opinions toward all possible topics. This research exploits social network analysis for hit song prediction via singer popularity and aspect-based sentiment analysis. For each song, we analyze the popularity of the singers and songs on the social network ”PTT”, and apply the aspect-based sentiment analysis (ABSA) to perform sentiment analysis on the singer. These results are combined with platform information to predict the playbacks of popular songs. Experimental results show that adding "singer's popularity" and "target emotion" can reduce the RMSE (Root Mean Square Error) of subsequent on-demand songs.

  • Ting LI, Qiaofei WANG, Xinyang JIANG, Guolin CAO, Gang QIAO
    セッションID: 2N4-IS-2c-04
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    Typing on a touch screen keyboard through an input method is the key user interaction for communication on mobile devices. Due to the limited keyboard size, input errors happen frequently in typing progress which affect the fluency of users’ input experience seriously. In this paper, we proposed an error correction framework based on neural networks for correcting input errors in typing progress and predicting the expected character users would like to type. Detailed features such as the coordinates of the touch points, the context information and the input history are preprocessed and utilized to train this neural classification model. Our experiments show that the proposed model is able to rectify the incorrect touches effectively and enhance both word-level precision and character-level precision to a great extent comparing with existing methods for multiple languages.

  • Kazunori YAWATA, Tamao SUZUKI, Keisuke KIRYU, Ken MOHRI
    セッションID: 2N4-IS-2c-05
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    The recent development of natural language processing technology using deep learning has been remarkable. BERT, developed by Google, and GPT, developed by the OpenAI Foundation, have contributed to this development. In this experiment, we compared the performance of the Japanese BERT model, one of the latest natural language processing technologies, with Word2Vec, one of the conventional methods. We used data from the LiveDoor news corpus for the experiments. We also built a FAQ chatbot and compared the rate of correct answers to questions about news articles asked by users between BERT and Word2Vec. In our experiments, BERT showed superior performance compared to Word2Vec. We were also able to obtain specific insights into the factors that contributed to the performance of BERT, and were able to objectively evaluate the performance of the Japanese BERT model.

  • 玉木 竜二, 農見 俊明, 佐藤 尭彰, 井上 誠一, 貞光 九月, 坂口 誠, 天満 昭子, 中神 啓徳
    セッションID: 2Xin5-01
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    ワクチン開発において,B細胞エピトープ予測と,MHCIIに対するペプチドの結合予測はいずれも重要な予測タスクである.B細胞エピトープを予測することは,抗原に特異的な抗体産生を誘導するワクチンの設計・開発のために有益である.一方,感染の重症度を低減するT細胞を活性化するワクチン開発に対しても,MHCIIに対するペプチドの結合を予測する必要がある.これら予測タスクに対する機械学習を用いた従来手法には,以下の二つの課題がある.一点目は離れたアミノ酸間の複雑な依存関係を捉えていない課題,二点目は学習データが不十分な場合に精度が低いという課題である.これらの課題に対処するために,本稿では大規模タンパク質データベースにより事前学習した,自己注意機構を持つBERTモデルを用いた手法を提案する.実験の結果,提案手法はB細胞エピトープ予測,MHCIIに対するペプチドの結合予測の実験で従来よりも高い性能を達成した.また,生物学的観点からタンパク質の構造と機能に着目し,提案手法から導出された自己注意の可視化と分析を行う.

  • 岩井 俊樹, 勝俣 京子, 杉谷 康雄
    セッションID: 2Xin5-02
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    副甲状腺機能低下症は,副甲状腺ホルモンの血中濃度が低下することにより,主として低カルシウム血症と高リン血症を呈する疾患である。本邦における患者数は約3万人程度と報告される希少疾病の一つであり根治療法は存在しない。カルシウム低下を原因として重度になると全身発作等の多岐の症状をもたらすため、活性型ビタミンD製剤やカルシウム剤を服用し血液中のカルシウム濃度を維持することが必要となる。これらのことから、副甲状腺機能低下症に対する治療の効果や有害事象を予測することの医療上の意義が高い。 本研究では実診療から得られた医療データを用いて、標準療法である活性型ビタミンD製剤を投与した症例に対して薬剤のベネフィットおよびリスクの発生予測をすることを目的とした。 医療データとしては日本最大級の診療データベースの一つであり一部の患者では臨床検査値を保持しているMDVデータを利用した。初めて活性型ビタミンD製剤処方のデータが入力された時点での年齢・性別・入院の有無・臨床検査値などを説明変数としたランダムフォレストによる予測を行うことで、得られた結果をもとに、実臨床で得られるデータからの予測可能性について検討した。

  • 岡田 法大, 杉谷 康雄
    セッションID: 2Xin5-03
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    近年、医療分野では行政や学会等が主導して大規模なデータベースの構築が進められており、疫学研究や医薬品の安全対策における利用が期待されている。その中でも診療報酬に関するデータは、医療記録や対象者の網羅性や構造化の観点でデータベース化が進んでおり、これらのデータを利用した患者のクラスタリングや予後を予測する研究がすすめられている。本研究では、その一環として、COVID-19肺炎患者に対して実際に使用された治療薬の使用状況の類似性や関係分析を目的として、薬剤と治療行為をノード、患者内での併用関係をエッジとしたネットワーク構造を利用したデータマイニング方法を提案する。患者の入院期間や死亡割合などを踏まえて、得られたコミュニティの評価を行い、薬剤の使用状況によるコミュニティ分類を可視化することにより、本手法が実際に行われた治療の全体像把握に繋がることを示す。本手法は、多様な病態を示す疾患や、承認されている薬剤が複数存在する疾患に対しても応用できる可能性がある。

  • 白石 哲也
    セッションID: 2Xin5-04
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    2020年春の新型コロナウイルス感染症(COVID-19)流行期においては、PCR検査資源が乏しい状態であり、検査基準を厳しくする必要性があった。PCR陽性患者の血液検査では、白血球数(WBC)、CRP、リンパ球数(Lym)、血小板数(PLT)に一定の傾向を示すことが知られていたが、カットオフ値は見いだされていなかった。 カットオフ値を求める目的で、PCR検査と血液検査を同時に行った患者328例を用いて、統計解析および教師あり機械学習(ニューラルネットワークおよび勾配ブースティング木のアンサンブル学習)による解析を行った。統計的検定により有意差を認めた27個の説明変数による教師あり機械学習では、AUC 83.6%(感度63.2%、特異度94.1%)であった。予測に高く貢献した因子は、①同居者、②咳嗽、③PLT、④味覚異常、であった。カットオフ値はWBC 5200以下、Lym 1000以下、PLT 20万以下、CRP 10以下にて判別が良好であった。 環境因子および臨床症状に上記カットオフ値による血液データポイントを加えることで、医師に対してPCR検査の実施判断の補助情報を提供することが出来た。

  • 塚田 啓介, 杉谷 康雄
    セッションID: 2Xin5-05
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    近年、日常診療から得られた医療データの整備、利用が進んできており、患者の転帰予測など、機械学習モデルを活用した研究が行われている。転帰予測を実臨床で活用するためには、時系列データを用いて、未来の患者状態の悪化を事前に検知することが求められる。しかし、実際の治療行為や検査記録は時系列方向に散発的に得られるため、古典的な時系列モデルを適用することは難しい。また各時点では、一部の変数のみデータが得られることがほとんどであるため、各時点での患者の状態をクラスタリングなどで解釈しようすると、データ欠損の影響が大きくなってしまう。そこで本研究では、時系列を連続的に扱いながら、観測された変数の情報を参照できる、Neural ODEsをベースとした深層学習モデルを用いて、患者状態をモニタリングする手法を提案する。集中治療室で収集されたパブリックな医療データセットであるMIMIC-IIIを用いて、集中治療室入室からの臨床検査値を予測するモデルを学習した。予測時の潜在変数をクラスタリングし重症度スコアなどと関連付けることで、データが散発的に得られる状況でも、患者状態の経時的な変化が評価できることを示す。

  • 北井 康久, 千吉良 好紀, 齋藤 輝昭, 栗田 尚樹, 石橋 雄一, 鎌倉 稔成
    セッションID: 2Xin5-06
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    近年のAI技術の発展は著しく、多くの成果が実応用へ適用されることが期待されており、工場の外観検査もその一つである。しかし、目視検査のような人間の感覚に依存する官能検査では限度見本の定義が難しく、良品であるか不良品であるかの判断に困る曖昧な見え方をするサンプルが存在している。正解入力も同様に難しく、正解入力の付与を誤った場合にそのサンプルに過学習してしまう懸念がある。 本研究では、目視検査を行う工程の効率化を目的とし、標準品見本・重大不適合品見本という明確な良品・不良品サンプルのみから構成されるデータセットを構築する方法と、そのデータセットを学習したモデルの推論結果から、標準品見本・重大不適合品見本だけでなく、曖昧な見え方をするサンプルも連続的な数値として表現する方法を提案する。評価サンプルとして、はんだ接合部のX線断層画像データセットを使用した結果、正解入力の所要時間の削減と、曖昧な見え方をするサンプルが機械学習の推論スコアに従って連続的に変化していることを確認した。

  • 新川 栄二, 永塚 光一, 村田 祐樹, 小野 多美子, 細田 正恵, 木下 聖子, 渥美 雅保
    セッションID: 2Xin5-07
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    医薬データ等の増加に伴って創薬分野における機械学習を用いた研究が盛んに行われている.特にタンパク質と薬剤のインタラクションを予測することやインタラクション部位を解析することは新薬開発において有用である.本研究では,タンパク質に付いている糖鎖に着目し,薬剤と糖タンパク質のインタラクション予測において,薬剤情報,アミノ酸配列情報,糖鎖情報の3つの組み合わせを入力とする相互アテンションニューラルネットワークを構築した.提案モデルは,入力として受け取った情報からそれぞれのエンコーダーを介して特徴ベクトルを抽出し,それらを連結したのちにインタラクションの有無の判別を行う.モデルの構造は糖鎖が糖タンパク質と薬剤の反応を仲介するプロセスを表現しており,糖鎖と薬剤のアテンションをとったのちに薬剤とアミノ酸配列のアテンションをとる.予測の過程で得られた2つのアテンションを解析することにより,インタラクションにおける糖タンパク質と薬剤の関係を糖鎖と薬剤,薬剤とアミノ酸配列という2つの側面から分析する.

  • 手塚 有佳里, 橋詰 薫, 坂井 貞興
    セッションID: 2Xin5-08
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    臨床研究結果が適切な時期に適切な医学雑誌に掲載され、広く医療現場に伝達されることは重要であるが、医学雑誌の投稿先を選定するための客観的な指標はない。そこで機械学習により、臨床研究の特徴に基づき最適な論文投稿先の予測モデルを生成することを目的とした。過去に公表されている194の肺がん領域の臨床研究について、その特徴と論文が掲載された医学雑誌の情報をデータベース化した。説明変数として研究デザイン、研究規模等26項目のデータを設定した。被説明変数となる医学雑誌の情報としてインパクトファクター(IF)およびIFに基づく論文ランク(A/B/C/D)を設定した。機械学習プラットフォームであるDataRobotを用いて臨床研究の特徴から医学雑誌のIFもしくは論文ランクを予測するモデルを生成した。これにより臨床研究の特徴に基づき、投稿先として適した医学雑誌のIFや論文ランクの予測が可能となった。今回は肺がん領域での取り組みであるため、他の疾患領域でもモデルの生成が可能か検証する必要がある。また、研究のインパクトを決定する要因は経時的に変化すると考えられるため引き続き予測モデルの検証も必要と考えられた。

  • 大知 正直, 城 真範, 森 純一郎, 坂田 一郎
    セッションID: 2Xin5-09
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    投資に値する研究を見出すためには,有望な研究を早期に見極めることが重要である. また,学術文献のデジタル出版の増加や研究の細分化が進む中で,将来の研究動向を自動的に予測する技術の開発が必要とされている. これまでの科学研究のインパクトを予測する研究は,指標ごとに特別に設計された特徴量を用いて行ってきた. 一方で最近のディープラーニング技術の進展は,異なる個別のモデルを統合し,より汎用的なモデルの構築を容易にしている. しかし,ディープラーニング技術を用いて科学研究のインパクト指標を予測する可能性について十分に検討されていないという課題がある. そこで本稿では,科学研究のインパクト指標の代表的指標の1つである論文出版後の被引用数とそれに対応する学術文献情報を分散表現として抽出し,高いインパクトを持つ論文の特定可能性について分析を行った. 分析結果は,学術文献の持つ言語情報とネットワーク情報を用いた分散表現において異なることを示した. 本稿の成果は,多様な科学研究のインパクトを早期に予測するより汎用的なモデル開発や科学技術の動向予測に向けた基礎的な分析となる可能性がある.

  • 大東 虎之介, 吉田 光男, 梅村 恭司
    セッションID: 2Xin5-10
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    学会での議論を活発にするためにチャットシステムが利用されている。特に、発表のビデオを予め提出しておくタイプの場合、著者が発表中にチャットに参加できる。本発表では、この状況で質問を積極的に引き出す方法を考案することを目的とする。この目的のために、疑問とそれに対する回答という形を整えたチャットシステムを作成した。さらに、質問に必ず反応するボットとしてQAシステムを用いた。その結果、質問に対しては何らかの反応があることを担保するものを作成できた。

  • 柳瀬 翔, 野口 靖浩, 小暮 悟, 山下 浩一, 小西 達裕
    セッションID: 2Xin5-11
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    一般に,大学教育の現場におけるレポートの評価では,教師が学生のレポートに対してフィードバックを与えることで,学生にレポートを改善させることや,次に提出するレポートの質を向上させる活動を行っている.この活動において教師は,レポート中の文章の論理構造から,論証の流れの曖昧さがあることや,主張に対する根拠が不足していること,どの主張を支持するのか曖昧な根拠の文があることなどを指摘する.しかし1人の教師が担当する学生は多く,フィードバックの準備をするコストは大きなものになり,学生のレポート提出に対して,迅速にフィードバックを行うことが難しい. 本研究では,学生の提出レポートの段落を対象に,その論理構造を可視化するシステムを提案する.教師は可視化した論理構造を用いることで,その論理構造図を元にフィードバックを作成することができるため,効率的にフィードバックを行うことができる.本稿では,論理構造を可視化するための文タイプの分類と文間の関係分類のアルゴリズム,及び試作したシステムを報告する.

  • 田中 就一郎
    セッションID: 2Xin5-12
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    昨今,日本では「GIGAスクール構想」が推進されている.「GIGAスクール構想」は,全教室の無線LAN環境を整備し,生徒に1人1台のタブレット端末を導入することを目的としている.教育現場でのこういったタブレット端末の普及に伴い,スクリーンコンテンツ(SC)の符号化ツールが通信帯域幅を縮小し,同時接続数を増やすことが期待されている.SCC はスクリーンコンテンツ(SC) 向け圧縮手法を利用することにより,より高い符号化効率を実現した.一方でSCC はSCに特化した符号化演算であるため,自然画像(CC) を符号化した際には冗長な演算が発生してしまう.本論文では,機械学習を用いてSCとCCを分類する画像分類モデルを提案する.動画をエンコードする前にこのモデルを使用することにより,本論文で提案するアルゴリズムは高い精度で符号化ツールを選択し,符号化の冗長性を大幅に減らすことができる。

  • 木許 滉祐, 曽我 真人
    セッションID: 2Xin5-13
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    一般的に,人は対象物を認識し,行動選択した後,その行動を実行する.そして,対象物の状態が変化することで,認知サイクルが繰り返される.この認識,判断,行動のサイクルの繰り返しを経験と呼ぶことができる.経験を伴う記憶はエピソード記憶と呼ばれ,単なる意味記憶よりも記憶に残りやすいとされている.しかし,学校で教科書を読んで学習するものは認識のみであり,認知サイクルを経ないため経験を伴わない.そこで本研究では,学習者が一人で経験を伴う学習ができる学習支援環境を単語学習を題材として提案する.学習者の認知サイクルを学習プロセスに組み込むため,学習者がVR空間内のオブジェクトを認識した後,オブジェクトの状態を変化させるためにディスプレイ上のどの単語に触れればよいかを判断する.学習者が選択した単語に触れると、その単語の意味に応じてオブジェクトの状態が変化する。そして、このような認知サイクルを学習に取り入れたVRを用いた単語学習システムを開発し、評価した。その結果,オブジェクトの状態の変化は認知サイクルを経て単語の意味の理解を深めるものとして,また学習における楽しさの付加として有用であった.

  • 佐藤 美沙, 大瀧 洋子, 十河 泰弘, 柳井 孝介
    セッションID: 2Xin5-14
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    業務において,論文や業務文書等の大量のテキストから読み解いた複数の知識をつなぎ合わせて推論を行う場面が存在する。そのようなとき,特にその業務に慣れていない担当者は事前知識がないため,関係のありそうな文献を検索し,読解,再検索,読解,という作業を何度も繰り返す必要があり,非効率である。本発表では,この作業を支援する推論補助ツールを提案する。本ツールは,自然言語処理技術によって論文や業務文書等の大量のテキストから事前に関係知識を抽出・収集した事前知識DBを備える。ユーザは,ツール上で検討対象の仮説を定義し,その仮説に沿った関係知識をDBから次々に呼び出すことにより,大量の知識を活かした推論を容易に行うことができる。本発表では,手法の詳細とその有効性を報告する。

  • 飯沼 直己, 國吉 房貴, 小澤 順, 三輪 誠
    セッションID: 2Xin5-15
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    論文テキストに自然言語で記載された材料特性値を抽出するタスクは材料研究者の中で注目されているが,材料の論文に記載される特性値は本文ではなく,グラフで示されることが多いため,自然言語処理だけでは抽出しきれない特性値が多く存在する.そこで本研究では,グラフからの特性値抽出のために,特性値グラフ画像を温度,時間などの様々な特性条件に基づいたクラスに分類し,データセットを構築した.データセットは,収集した大規模な材料分野の論文誌データからグラフ画像を抽出し,大規模かつ短時間でデータセットを作成可能なクラウドソーシングを活用し,特性値グラフ分類用データセットを構築した.さらに,構築したデータセットを用いて深層学習モデルを学習し,その性能を評価する実験を実施した.結果,深層学習モデルによる特性値グラフ分類における我々のデータセットの有用性を確認した.

  • 牧野 晃平, 國吉 房貴, 小澤 順, 三輪 誠
    セッションID: 2Xin5-16
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    無機材料分野では,論文中の合成物(目的材料)に着目し,その物理的性質を分析するため,論文から目的材料を抽出する研究が行われている.一方で,従来の固有表現抽出では,論文で主張する対象の合成物を抽出できているのかという疑問が存在する.そこで我々は,論文に対して,その論文の主張する合成物である目的材料のみに限定してラベル付けをしたコーパスを作成し,そのコーパスに対して,従来の固有表現抽出タスクにおいて高い性能を示している深層学習モデルを適用し,その抽出性能を評価した.その結果,深層学習モデルによる目的材料の抽出において,一般的に固有表現抽出タスクで報告されている抽出性能よりも低い抽出結果が得られた.我々は,この原因を,従来の固有表現抽出タスクの設定が論文からの合成物抽出タスクに適していないためだと考察し,従来のタスク設定の問題点と改善策について述べる.

  • 植松 文徳, 森下 茂幸, 中道 智寛, 相原 啓人, 佐川 隆亮
    セッションID: 2Xin5-17
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    走査型透過電子顕微鏡(STEM)での高分解能観察においては,像のボケを引き起こすレンズの収差を補正する必要がある.収差を補正する上では,まず収差の値を正しく計測することが重要であり,簡便な計測手法としてロンキグラムを用いた収差計測法を開発してきた.しかし,ロンキグラムを用いた従来法では,コマ収差が大きい場合に条件によっては計測精度が著しく低下するため計測パラメーターの事前調整が必要であり,収差の計測・補正を自動化する上で課題となっていた.そこで本研究ではパラメーターの設定が不要で高精度な計測を実現することを目的とし,ロンキグラムからコマ収差を計測する回帰モデルを機械学習で構築した.ロンキグラムに現れる縞の位置と形状を利用して収差を推定するため,畳み込みニューラルネットワークを用いたモデル構造とした.この回帰モデルをSTEMに組み込むことで,コマ収差を自動で精度良く測定および補正することが可能となった.

  • 中島 彬, 曽我 真人
    セッションID: 2Xin5-18
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    現在,世の中には天体に関するコンテンツは多く存在する.しかし,そこで実現されている機能は星座単位などで紹介するものが多く,一つ一つの星に関する情報まで紹介しているものはあまりない.先行研究においても,音声読み上げの手法を用いて情報を表現しているが,星の色や明るさまでは提示していない.そこで,本研究では星の色・明るさを音高・音量と対応させることで表現し,迅速に情報を得ることができるシステムを構築した.評価実験では,本システムと音声読み上げシステムを用いてもらいながら問題を解いてもらい,それぞれのシステムの情報を把握するまでの速さと正確性を検証した. 実験の結果,本システムの有意性を統計的に示すことはできなかったが,音と星の情報を対応付ける手法について一定の評価を得ることができた.しかし,複数の星の相対的比較においては高い評価を得ることができたが,単体の星の情報の対応付けの把握の点では課題が多く見つかった.

  • 棚瀬 旺和, 本田 理恵
    セッションID: 2Xin5-19
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    近年では地球温暖化による地球環境への影響が問題になっており植物活動にも影響を及ぼしていると考えられる。一方、地球観測衛星によって取得された高解像度の画像やマルチスペクトル画像が得られるようになり、特にマルチスペクトル画像から得られる植物の活動度を表す植生指標を用いることで、ある地点の植物活動の季節変動やその長期変動を知ることができ、機械学習や統計学習の手法と組み合わせることでグローバルな環境の変化検知や身近な農林業への活用が期待できる。我々は、衛星画像から作成されたノイズや欠落の多い時空間データをロジスティック関数として統計学的な手法で安定的にモデリングする手法を開発して分散フレームワークHadoop上に実装し、NASAの地球観測衛星Terra・Aquaに搭載されたMODISセンサから作成された植生指標データに適用して、その効果を確認している。本研究では、さらに高解像度画像の教師あり学習による分類などを組み合わせて、局所的な変動や長期間の変動検知の精度を向上させることを試み、その効果を四国地方のデータを用いて検証する。

  • 吉田 将大, 長谷川 佳乃, 舘野 啓
    セッションID: 2Xin5-20
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    近年、機械学習による生成モデルのコンテンツ制作への応用が注目され始めている。一般的に生成モデルは、生成物の「本物らしさ」を目的関数におく。しかし、多くの商業コンテンツ(映画・音楽・ゲーム等)は、より多くのユーザもしくは特定のターゲットユーザ層に評価されるように作成されるため、生成物が単に本物らしいだけでは実用性は低い。既存研究では、ユーザによるコンテンツの評価データを用いて、狙ったユーザ群の嗜好に合わせたコンテンツメタデータの生成モデルが提案されている。一方で、例えばクリエータが特定のジャンルの映画を作ろうと思っていても、既存手法では生成内容を制御できないという問題がある。本研究では、このモデルを発展させ、任意のメタデータを入力とすることよって生成内容の制御が可能なモデルを提案する。実験では、映画データベースInternet Movie Databaseを用いて映画ジャンルを入力として俳優候補を生成した。結果はアンケート調査で評価し、提案モデルの有効性を確認した。

  • 打越 元信, 市川 幸史, 青野 有華, 浦田 隆史
    セッションID: 2Xin5-21
    発行日: 2021年
    公開日: 2021/06/14
    会議録・要旨集 フリー

    異常検知において、既知の異常以外のデータは正常データとして学習されることが多く、訓練データに見落とされた異常が含まれている場合、モデルは精度劣化の悪影響を受けることがあります。特に既知の異常が少数の場合、見落とされた異常を自動で効率的に抽出することは困難です。既知の少数異常を使用して訓練データに含まれる見落とされた異常を抽出するために、全体データに対して既知の異常がより小さなクラスターに分離されるように特徴量を選択する強化学習モデルを提案します。実験では、既知の異常と見落とされた異常の多くが小さなクラスターに分離され、そのクラスターを全体データから除いてモデルを学習させることで、モデルのパフォーマンスが向上することが示唆されます。また、選択された特徴によって、既存の異常へ解釈性が付与されることが期待できます。

feedback
Top