人工知能学会全国大会論文集
Online ISSN : 2758-7347
第37回 (2023)
選択された号の論文の942件中501~550を表示しています
  • Yoji YAMASHITA, Yukako ITO, Haluka NUMATA, Nagisa MASUDA, Ikuko YAIRI
    セッションID: 2U4-IS-2c-04
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    The ability to continuously monitor cognitive workload associated with different tasks is crucial for understanding and evaluating user engagement. Electroencephalogram (EEG) is identified as one of the most promising indexes for measuring workload due to its high temporal resolution. However, EEG is usually buried under various noises and often requires preprocessing to obtain clean data for analysis. The purpose of this study is to propose a deep learning model suitable for estimating cognitive workload from raw EEG signals without using any preprocessing techniques. Specifically, the dataset consisted of EEG from two cognitive tasks, and the workload was calculated from Auditory Steady State Response (ASSR) which was used as input label. Comparing the performance of a 1D CNN and 1D CNN-LSTM model, both models achieved around 91.5% accuracy for the classification task, and the 1D CNN-LSTM model stood out achieving a R-squared of 0.991 for the regression task.

  • Kaiyu SUZUKI, Tomofumi MATSUZAWA
    セッションID: 2U4-IS-2c-05
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    Perceiver is a deep learning model that can be applied to a variety of modalities. It can simultaneously process various forms of input and output, such as images, speech, and natural language using the same architecture. However, Perceiver is computationally more expensive than other models. Therefore, training the model in environments with relatively limited fast parallel computational resources is relatively difficult. In this study, we aimed to reduce the computational cost such that learning can be performed in a short time in environments other than large-scale computing systems. To this end, we first show that a speed-up method proposed for Transformer is also effective for Perceiver. In particular, the gated attention unit proposed for FLASH reduces computational complexity without sacrificing accuracy. The proposed acceleration method can achieve accuracy comparable to that of the original model in a limited computing environment. As an introductory example, we conducted experiments using the ImageNet image recognition task and demonstrated that the proposed method can reduce the training time compared to conventional methods without a significant loss of accuracy. This model can be used to input and output any kind of data quickly in a low-cost computing environment.

  • Nao ENOKI, Yukako ITO, Yusuke YOKOTA, Yasushi NARUSE, Ikuko YAIRI
    セッションID: 2U5-IS-5-01
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    This research had EEG measurement experiment using images and odor stimuli with the aim of establishing method for reading affection and aversion from brain information. In an odorless state, affection is distinguishable by existence of P600. It may be difficult to distinguish between indifference and aversion in an odorless state. N200 appeared more clearly when a bad odor was presented than in an odorless state or when presented with an aroma. This suggests the possibility of distinguishing preferences by looking at N200. It is thought to be possible to discriminate preferences by pattern matching by looking at N400 and P600. When presenting an aroma, only affection can be distinguished by looking at P600. This result is expected to be applied to marketing. In this research, N400 which had not been focused on in previous studies was observed. The possibility that N400 was some kind of reaction related to preference was found.

  • Kousuke ARAI, Yusuke YOKOTA, Yasushi NARUSE, Ikuko YAIRI
    セッションID: 2U5-IS-5-02
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    In recent years, flow experience has been regarded as an important criterion for ideal user experience (UX), and is gaining attention in the design phase of video games. However, flow experience is mainly measured by subjective evaluations such as post-questionnaires, making it difficult to measure in real time. This study aims to investigate the relationship between the cognitive workload obtained by EEG measurement, the user's subjective flow experience score, EEG, and electrocardiogram. This paper conducted an experiment using the Tetris® Effect: Connected, and obtained the flow scores calculated from the ECG data, EEG data, and post-questionnaire, and analyzed them in detail. The results showed that the cognitive workload calculated from FC3 in the extended 10-20 method was likely to be related to the flow experience. It was also suggested that the parasympathetic index might be related to the flow experience under certain conditions.

  • Jun ICHIKAWA, Keisuke FUJII
    セッションID: 2U5-IS-5-03
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    Humans often interact with others to achieve a group goal. Many studies on cognitive science, neuroscience, and sports science have investigated the coordination mechanisms and suggested the importance of role-sharing and adjustment using others' motor information. However, the adjustment process in the nonverbal behavior of a triad is not fully understood due to complex and dynamic interactions. We previously introduced a coordinated drawing task and conducted the behavioral experiment. The triads operated reels to change thread tensions, shared three heterogeneous roles (pulling, relaxing, and adjusting), and moved a pen connected to the three threads to draw an equilateral triangle. The results indicated that the adjusting role was related to high task performance, who helped resiliently without disturbing the pen's smooth movement while avoiding great pen deviation. To supplement these findings, this study formulated the three roles using equations of motion. The multi-agent simulation results showed that the adjusting role might use the degree of pen deviation reflected by others' motor information, such as the operating procedures and forces, and change the tension to draw at least three sides. The contribution of this study is to enhance the fundamental understanding of resilient adjustment required in team sports and haul seines.

  • Donghuo ZENG, Jianming WU, Yanan WANG, Kazunori MATSUMOTO, Gen HATTORI ...
    セッションID: 2U5-IS-5-04
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    Large-scale open-domain dialogue systems such as PLATO-2 have achieved state-of-the-art scores in both English and Chinese. However, little work explores whether such dialogue systems also work well in the Japanese language. In this work, we create a large-scale Japanese dialogue dataset, Dialogue-Graph, which contains 1.656 million dialogue data in a tree structure from News, TV subtitles, and Wikipedia corpus. Then, we train PLATO-2 using Dialogue-Graph to build a large-scale Japanese dialogue system, PLATO-JDS. In addition, to improve the PLATO-JDS in the topic switch issue, we introduce a topic-switch algorithm composed of a topic discriminator to switch to a new topic when user input differs from the previous topic. We evaluate the user experience by using our model with respect to four metrics, namely, coherence, informativeness, engagingness, and humanness. As a result, our proposed PLATO-JDS achieves an average score of 1.500 for the human evaluation with human-bot chat strategy, which is close to the maximum score of 2.000 and suggests the high-quality dialogue generation capability of PLATO-2 in Japanese. Furthermore, our proposed topic-switch algorithm achieves an average score of 1.767 and outperforms PLATO-JDS by 0.267, indicating its effectiveness in improving the user experience of our system.

  • Pinkie ANGGIA, Kaoru SUMI
    セッションID: 2U5-IS-5-05
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    Conversational agents represent an interactive computing tool as the solution to influencing people's opinions. In three settings of camera angles and facial expressions, 37 individuals interacted with virtual agents. Positive facial expressions from virtual agents and a near-distance camera angle successfully influenced participants' opinions of our primarily extroverted participants through empirical evaluations using ANOVA and the Big Five theory. There are undoubtedly various studies that are dispersed across numerous domains that could benefit from interactive agents. As a result, we came to understand the critical need of addressing a solid foundation for requirements to create an agent that aims to persuade people. To advance the field, this paper reveals the current experiment and future discussions for developing persuasive conversational agents.

  • Michel Ezoa Avotchi DJANGORAN, KIKUCHI MASATO, TADACHIKA OZONO
    セッションID: 2U6-IS-1c-01
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    Diabetes, obesity, and high blood pressure are becoming common diseases that the African healthcare system is fighting. These diseases have been linked to a diet that is often either too rich or too poor in certain nutrients. In addition, many Africans want to track their diet to lose weight or stay healthy, but they struggle to find an application or a good dataset with information on the daily dishes and calories that are specific to their cuisine. This paper proposes a new, direct, real-time calorie rating system for daily dishes in West Africa. Our first study was conducted on 11 types of Ivorian daily dishes, using a dataset of 636 images. Our first baseline system groups dishes into calorie classes (high, medium, and low) and use YOLOv5 (You Only Look Once) for dish detection and calorie classification, with a small amount of data. With 88.8 % of accuracy, our model can be used in mobile applications to support the African healthcare system, which suffers from a lack of dieticians.

  • Xun SU, Hiroyuki KASAI
    セッションID: 2U6-IS-1c-02
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    With the increasing application of optimal transport in machine learning, the unbalanced optimal transport (UOT) problem, as a variant of optimal transport, has gained attention for its improved generality. There is an urgent need for fast algorithms that can efficiently handle large penalty parameters. In this paper, we propose to use the Inexact penalty to make the Majorize-Minimization algorithm converge quickly even in UOT with large penalties. By using a dynamic scheme, we can successfully compute better and sparser solutions for the large penalty parameter and approach the computational speed of the well-known Sinkhorn algorithm, which sacrifices accuracy by adding an entropy item.

  • YINGFENG FU, Yusuke TANIMURA, Hidemoto NAKADA
    セッションID: 2U6-IS-1c-03
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    Pre-training has been a significant trend in NLP nowadays. BERT-liked models showed power in solving downstream tasks. Inspired by the masked language model pre-training strategy, context could be learned by recovering the masked musical tokens. In our previous work, we tested the ability of MusicBERT and improved the model structure. The models worked well on the melody extraction task (a token-level classification task). But when facing sequential tasks like composer and emotion classification, our previous models' performance still needs improvement. The possible reason is that, the previous pre-training method cannot learn the general information of the sequence from the context. We proposed the bar-level recovery pre-training task using variational inference to solve this problem. Our proposed method aims to better learn general sequential information from context. In our in-progress work, we compared our method with the previous works.

  • Improving vision transformers performance with adversarial pre-training
    Luiz Henrique MORMILLE, Masayasu ATSUMI
    セッションID: 2U6-IS-1c-04
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    In recent years, the Transformer achieved remarkable results in computer vision related tasks, matching, or even surpassing those of convolutional neural networks. However, to achieve state-of-the-art results, vision transformers rely on large architectures and extensive pre-training on very large datasets. One of the main reasons for this limitation is the fact that vision transformers, whose core is its global self-attention computation, inherently lack inductive biases, with solutions often converging on a local minimum. This work presents a new method to pre-train vision transformers, denoted self-attention misdirection. In this pre-training method, an adversarial U-Net like network pre-processes the input images, altering them with the goal of misdirecting the self-attention computation process in the vision transformer. It uses style representations of image patches to generate inputs that are difficult for self-attention learning, leading the vision transformer to learn representations that generalize better on unseen data.

  • 山田 康輔, 笹野 遼平, 武田 浩一
    セッションID: 3A1-GS-6-01
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    意味フレームを自動構築するためには、フレーム喚起語をその語が喚起するフレームごとにまとめること、およびその項となる語句をフレーム要素ごとにまとめる必要がある。本研究では、後者の項クラスタリングに焦点を当て、深層距離学習を用いた手法を提案する。提案手法では、フレーム情報が付与された一部のデータを用いて、深層距離学習に基づき文脈化単語埋め込みモデルをfine-tuningし、そのモデルから得られる埋め込み表現を利用して、動詞の項となる語句をクラスタリングしている。FrameNetを用いた実験を通し、提案手法が既存手法よりもかなり高い性能を達成することを示す。

  • 成田 百花, 持橋 大地, 小林 一郎
    セッションID: 3A1-GS-6-02
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    本論文では、入力文の統語構造を反映するためにTransformer のエンコーダの自己注意機構に制約を加えた木構造自己注意機構を採用した提案モデルを、従来のF1スコアによる評価手法ではなく、統語構造解析結果の構文エラーを解析することによって評価を行った。エラー解析を行った結果、生成規則に着目して句や節同士の依存関係を捉えることが精度の向上のために必要であることがわかった。また、従来の提案モデルでは、エンコーダのパラメータをランダムに設定していた。そこでさらに精度を向上させるため、BERTのMasked Language Modelingを用いてエンコーダの事前学習を行う追加実験を行ったが、有効な結果を得ることは出来なかった。

  • 船曳 日佳里, KANASHIRO Pereira Lis, 木村 麻友子, 浅原 正幸, 越智 綾子, CHENG Fei, 小林 一郎
    セッションID: 3A1-GS-6-03
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    自然言語の文章を理解する上で、イベントが持っている時間情報の正しい理解は重要である。しかし、イベントの時間情報を意味する直接的な表現は文章内では省略されやすく、時間の理解のためには、自然言語で表現されるイベントのさまざまな時間的側面について常識を持っている必要がある。そこで、我々は日本語での時間的常識を理解する汎用言語モデルの構築を目的とする。本研究では、時間知識に関するマルチタスク学習を行った。タスクは、従来の複数のデータセットの時制、時間幅、時間順序、事実性における分類タスクに加えて、時間的常識に関する英語のデータセットMC-TACOを日本語に翻訳したデータセットを用いた。また、テキストエンコーダは日本語の言語モデルだけでなく、多言語モデルも採用した。実験の結果、補助タスクの組み合わせによって、精度の向上を確認した。

  • 松帆 愛, 彌冨 仁
    セッションID: 3A1-GS-6-04
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    含意関係認識は重要な技術であるが,不適切な教師ラベルがデータセットに多く含まれることが研究上の課題として挙げられる.本報告ではActive Learning (AL)を活用し不適切なラベル付けの検出を行いうActive Cleanを提案する.Actine Cleanは,まず少ない学習データに基づく予測モデルを構築した後,予測の難しい少量のデータを選抜し,これらに手動で正解ラベルを付与して再学習を繰り返すことで性能向上を図るとともに、不適切ラベルを検出する手法である.本研究で扱うJSNLIデータセットのラベルはサンプル調査で1割程度に誤りがあることが示唆された.このデータに対し,Active Cleanで不適切ラベルデータ候補を検出したところ,そのうち過半数が不適切であると推定された.これらの不適切ラベル候補データを学習データから除いて構築された含意関係認識モデルは,ラベルが正しいことが確認できているテストデータに対して平均予測能が7.8%向上した.このことからActive Cleanは,不適切なラベルが多く含まれているデータを特定することに役立ち,より頑健なモデルを構築できる可能性を示した.

  • 畠山 陽喜, 金田 龍平, 河窪 大介, 酒造 正樹, 前田 英作
    セッションID: 3A1-GS-6-05
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    人ロボット共生社会を迎え,円滑なコミュニケーションを実現するための対話処理技術に対する期待が高い. 発話生成は対話履歴と対話ドメインに関する知識を用いて実現される. このとき,あらかじめ用意した知識源から適切に知識を選択しなければならない. そこで本研究では,アクセス,料金などの知識文をそのまま発話に埋め込み可能な定型情報と口コミ,概要などの埋め込み不可能な非定型情報との混在下において,対話履歴から適切な知識を選択する方法について検討を行った. 具体的な事例として旅行代理店における接客対話を取り上げ,対話ロボットコンペティションにて収集した質問事例80件を用いて評価を行い,提案手法の有効性を検証した.

  • 坂地 泰紀, 和泉 潔
    セッションID: 3A5-GS-6-01
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    本論文では,多言語テキストデータから金融の因果関係を表す知識を抽出する方法を提案する.金融分野では,ファンドマネージャや金融アナリストなどが,業務上因果的な知識を必要としている.既存の言語処理技術は人間が認識した因果関係を抽出するのに非常に有効であるが,既存の手法には2つの大きな問題点がある.第一に,多言語での因果関係抽出はこれまで確立されていない.第二に,入れ子の因果関係など,複雑な因果構造を抽出する技術が不十分である.そこで,これらの問題を解決するために,手がかり(becauseやdue toなど)とUniversal Dependenciesに基づいて,入れ子型の因果関係を抽出する手法を提案する.提案する金融因果関係抽出手法を金融分野の多言語テキストデータで評価した結果,提案モデルが既存モデルを上回る性能を持つことが実証された.

  • 田中 寛人, 森 直樹, 岡田 真
    セッションID: 3A5-GS-6-02
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    近年, 機械学習技術の急速な発展に伴い創作物理解への適用が積極的になされている.様々な創作物に関する研究がされている中で,ゲームシナリオにはプレイヤーの選択によってキャラクターのセリフが変わることやキャラクターの感情がモーションとしてシナリオに明記されていることなど,他のストーリーをもつ創作物である小説や漫画にはない特徴がある.これらの特徴から,ゲームシナリオは人工知能によるストーリー理解をはじめとした創作物理解に利用できるデータとして期待できる.本研究では,ゲームシナリオの有用性の確認を目的として,会話内容から地理的状況を識別する実験をした.一般的に限定的な行動しかできない場所では会話の内容や現れる単語が類似するため高い識別精度が得られ,ゲームシナリオデータの地理的状況理解への有用性が確認された.

  • 阿閉 凛, 小川 祐樹, 高 史明, 高野 雅典, 森下 壮一郎
    セッションID: 3A5-GS-6-03
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    ニュースの視聴方法として、インターネットテレビによるLive動画の視聴が広まりつつある。そこでは、視聴者がリアルタイムで自由にコメントを投稿できるチャット機能が存在することがある。このような機能は、視聴者が意見や感想を投稿することで番組を盛り上げたり、コミュニケーションを通じて知識を得るといったポジティブな面が期待される。しかし、チャット欄に投稿されるコメントの流れや雰囲気によって行き過ぎた過度なコメントを助長させてしまうことも懸念される。将来に投稿されるチャットのコメントの流れを予測することができれば、チャット欄が荒れるといった状況を事前に把握し注意を促すといった対策を検討することも可能になると考えられる。本研究では、そのための基礎的な分析として、ABEMAのニュース番組に投稿されるチャットの内容を分析し、ニュース形態やニュースの内容によってどのような違いがみられるかを、投稿されるテキストのポジネガ,感情,Toxic Score の観点から分析する。

  • 田中 大智, 重松 祐匡, 木山 真人, 尼﨑 太樹
    セッションID: 3A5-GS-6-04
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    機械翻訳や要約モデルの運用において,生成された文章が原典に無い誤った内容を述べてしまうことがあり,克服すべき問題の一つとされている.既存の多くの自動評価指標は単語一致を計測することを基準としているため,このような事実の不一致を加味することが困難である.我々は,文の意味的類似性の判断に重きをおいた自動評価指標を提案する.本手法では機械翻訳や要約の評価の際,人間が作成した理想的な参照文と文章生成システムによる候補文を比較し,その文ペアの意味的類似性をスコアとして出力する.このスコアはファインチューニングしたSentenceBERTから得た文ペアの文埋め込みの差を分類器へ入力することで得ている.評価に画像キャプションの出力を利用し,人間の判断との相関値を算出した.提案手法は既存の自動評価指標と比較して比較的高い相関を有していることが確認できた.また,実際の動作例を元に,既存の自動評価指標よりも人間の判断と乖離の少ない挙動であることを示す.

  • 劉 慕璇, 石垣 達也, 上原 由衣, 宮尾 祐介, 高村 大也, 小林 一郎
    セッションID: 3A5-GS-6-05
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    社会的状況の中での言語使用を明確に捉えることで、言語をより正確に分析することが可能になる。分析結果が付与されたコーパスを用いて、その分析結果を識別できるように学習された機械学習モデルは状況を踏まえた自然言語の解釈において精度の高い結果を出すことが可能になると考える。本研究では、注釈ラベルを対象にしたマルチラベル分類を行い、当該コーパスの機械学習モデルへの適用性を検証し、高精度で分類が可能であることを確認した。具体的には、著者らが作成したビジネスメールコーパスを用いて、マルチラベル分類器を適用することによってメール本文の社会的状況の注釈ラベルを推定し、その結果からコーパスの適用性を考察した。

  • 岸川 大航, 荒井 幸代
    セッションID: 3D1-GS-2-01
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    逆強化学習(IRL)は,熟練者の行動を記録した軌跡から,その背後に存在する報酬を推定する手法であり,報酬設計の難しいタスクにおける強化学習による熟練者の模倣や,人間や生物の意図を分析するために用いられる.従来のIRL手法は,熟練者の軌跡が完全に最適であることを仮定しているため,最適ではない動作を含む準最適な軌跡の場合,準最適な報酬が推定されてしまう.準最適な軌跡に対するIRL手法はいくつか存在するが,各軌跡に対して最適性を評価したランキングを利用するアプローチが主流である.しかし,これらの手法は,ランキングデータの正確性に学習性能が大きく影響される問題を抱えている.そこで,準最適な軌跡の分布を,最適な軌跡の分布に外れ値が混入したものであるとみなし,外れ値を無視する性質を有するガンマダイバージェンスを用いたIRL手法を提案する.提案手法は熟練者の軌跡と比較対象のデータを分類するIRL手法に適用することが可能であり,従来用いられてきたクロスエントロピーに基づく手法の一般化とみなすことができる.提案手法を計算機実験によって評価する.

  • 中口 悠輝, 窪田 大
    セッションID: 3D1-GS-2-02
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    模倣学習は強化学習の問題を何らかの教師の情報を参考に解く。典型手法の行動模倣では共変量シフトを生じて長期的な問題に適用できなかったが、インタラクティブ模倣学習は教師モデルからオンラインでフィードバックを得ることでこの課題を解決した。一方、インタラクティブ模倣学習の既存手法では、教師が生徒モデルの最適方策と異なる場合に生徒が最適方策を学習できなかった。本研究ではインタラクティブ模倣学習について整理したレビューを与えるとともに、その課題を解決する新規手法を提案する。

  • 西山 大輝, 福地 一斗, 秋本 洋平, 佐久間 淳
    セッションID: 3D1-GS-2-03
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    多クラス分類モデルの実世界応用では、重要なクラス(一時停止標識など)の誤分類は、他のクラス(駐車禁止など)よりも著しく有害となりうる。そのためモデル全体の精度を維持しつつ、重要なクラスの再現率を向上させることが極めて重要である。交差エントロピー損失に対してクラスごとのペナルティを与える既存手法では、分離性を向上させることはできない。また全クラス間の分離性を改善する手法は、重要なクラスを考慮しないため我々の目的には適さない。そこで我々は特徴空間に対して重要クラスに関して明示的に損失を与える損失関数、クラス考慮型加法的角度マージン(CAMRI)損失を提案する.CAMRIは特徴空間上の重要クラスの特徴と対応する重みベクトルとの角度にペナルティを加えることにより、重要クラスの特徴の分散を小さくすることが期待される。また重要クラスのみにペナルティを集中させることで、他クラスの分離性を犠牲にしない。複数のデータセットに対する実験から、重要クラスの分離性を他クラスより改善するCAMRIが、精度を犠牲にせず特定クラスの再現率を向上させることができることが示され、最大で再現率を9%改善することができた。

  • 若井 雄紀, 竹内 孝, 鹿島 久嗣
    セッションID: 3D1-GS-2-04
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    近年、点群データからその集団動態を推定する分析が盛んに行われている。代表的な例として、GPSデータを用いた行動予測、マルチターゲットトラッキング、気象学分野での密度推定が挙げられる。 点群データを用いた各点の軌跡予測では、各点を複数の時刻にわたって継続的に追跡したデータを取得し、そこから集団動態モデルを復元する手法が一般的である。しかし、観測時の制約やプライバシーの問題により同一の点群を時系列に沿って追跡できない時、この手法を適用することは困難である。 本研究では、この問題に対処するため、単時刻の点群スナップショットから、背後の集団動態を推定することを目的とする。すなわち、複数時刻のデータを用いずに、1時刻における各点の座標情報のみから軌跡を推定する。 提案手法では、時間情報をもたない点群スナップショットからの各点の移動方向の推定を最適輸送問題として、さらに移動速度の滑らかさを正則化項として導入した最適化問題として定式化することで、点群の動態を推定する。 いくつかの典型的なベクトル場を用いた実験の結果、提案手法により単時刻のスナップショットから正解となる軌跡を高精度で予測できることが示された。

  • 松浦 満, 原 聡
    セッションID: 3D5-GS-2-01
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    教師あり学習は一般に大量の教師データを必要とするが、教師ラベルが得られにくい場合はラベル付けのコストが莫大になる問題がある。これはモデルを評価する際にも同様であり、テストデータの効率的なラベル付けが課題となる。Active Testing [Kossen et al., ICML'21]は、テストデータについて能動的にラベルを付与するサンプルを選択することで少量のラベル付けでモデルの性能を評価する方法である。しかし、機械学習の実用では単一の良いモデルが得られることよりも、複数の良いモデルの候補が得られることのほうが一般的である。この場合、候補間で性能比較を行い一番性能の高いモデルを選ぶモデル選択の問題を解く必要がある。そこで本研究では、Active Testingの方法を拡張してテストデータに対して少量のラベル付けでモデル選択を効率的に行う方法を提案する。

  • 佐藤 勇元, 青葉 紗矢香, 益川 良藏, 佐藤 真, 櫨 翔佑, 松井 太我, 石川 桂太, 高木 友博
    セッションID: 3D5-GS-2-02
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    パーソナルスタイリングにおいて、スタイリストは顧客の特徴、利用目的、季節などの様々な状を考慮して、ファッションアイテムを選択する。その際、その選択理由について注意深くコメントし、 推薦するファッションアイテムとともに顧客に送る。 これに対し我々は、アダプタベースのファインチューニングによって言語モデルをマルチモーダル入力に対応させた手法であるMAGMAを利用し、アイテム画像の組み合わせとプロンプトから、コメント案を生成するモデルを構築する。 提案モデルに対して定量・定性評価を行なった結果、MAGMAを利用したモデルが従来手法よりも優れていることを確認した。

  • 井内 航, 梅田 悠哉, 原田 和亮, 柚木 隼人, 向井 皇喜, 吉田 舜, 山崎 俊彦
    セッションID: 3D5-GS-2-03
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    情報技術の発展により、高容量の画像、動画の利用が一般的になった。ただしHDDなど記憶デバイスの容量や通信帯域は有限であり、圧縮の必要性はこれまでも議論されてきた。ルールベースの圧縮に加え近年ではGANなど深層学習ベースの圧縮手法も提案されている。既存のFaR-GANによれば、ある人物の顔画像と表情を表す68点の座標データからその表情を持つ顔画像が再構成でき、高い圧縮率を実現できる。 しかし、このような既存手法では再構成の精度、動画にした際のフレーム間の滑らかさに課題がある。本研究では拡散モデルを再帰的に用いて前のフレームからの再構成を行うことで、拡散モデルベースの顔画像の再構成における人物特定と表情生成のトレードオフを抑えつつ、フレーム間を滑らかに表現する手法を提案する。

  • 東 大介, 鷲尾 隆
    セッションID: 3D5-GS-2-04
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    本研究では対象の事前知識に基づく構造を有する回帰モデルを用いて,対象に関する独立な複数の観測事例からなるデータから,確率的近似を用いてモデルパラメータや目的量の分布 を推定する手法を提案する.これにより,事前知識の下で外挿性に優れ,事前知識に照らし て意味の明確なモデルパラメータや目的量の事後分布の推定を可能とする.具体的には, 対象物理モデルなどを回帰モデルとして用いて,対象に関する観測事例データからモデルパラメータを最大事後確率推定し、ラプラス近似の下でパラメータ事後分布を推定する. さらにこれに基づいて,目的量の事後分布を推定する.本手法を2重振り子などの物理系に 適用し,ガウス過程回帰などより高精度な回帰モデルを得ることを確認した.

  • 渡邉 耕平, 江口 浩二
    セッションID: 3D5-GS-2-05
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    トピックモデルはテキストデータ解析に用いられる手法の一つであり,データの背後にある潜在的なトピックの推定を目的とする.また,知識蒸留は深層学習の分野において,大規模な教師モデルの知識を小規模な生徒モデルに転移するための手段として注目されてきた.対照学習(contrastive learning)は自己教師あり表現学習において最近注目されており,その有効性が報告されている.以上のような背景のもと,本研究ではトピックモデルをニューラルネットワークで実現するニューラルトピックモデルの学習に対照学習の枠組みを利用した知識蒸留を用いることで,従来の知識蒸留では転移できなかった教師モデルの構造的な知識を生徒モデルに転移する問題に着目する.トピックの一貫性を測る評価実験では,対照損失を用いて教師モデルが生成した個々の文書表現における関係性を保持しつつ生徒モデルの潜在表現を学習する提案手法が,先行研究のニューラルトピックモデルの精度を改善することが確認できた.

  • 齊藤 啓太, 田邊 拓実, 秋本 洋平
    セッションID: 3E1-GS-2-01
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    強化学習において評価時の環境パラメータが未知の場合に,環境パラメータについての最悪regretの最小化により,環境の不確実性に対して頑健なエージェントを学習する手法が提案されている.学習時に真のregretが求まることは稀であるため,各環境パラメータに対する最適方策の近似を通してregretを近似する方法がしばしば用いられる.しかし,近似された最適方策を用いてregretを近似する場合,この近似精度が不十分であることに起因して最悪regretを最小化する方策の学習に失敗することがある.本研究では,各環境パラメータについての最適方策の学習精度を向上させることで,より正確なregretの近似を図るアプローチを提案する.数値実験により,提案アプローチを用いることで,regretの近似精度が向上すること,また,最悪regretの最小化の精度が上がることが確認できた.

  • 長澤 春希, 松本 悠太, 長谷川 拓, 西田 京介, 鈴木 潤
    セッションID: 3E1-GS-2-02
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    人間は視覚的な仮説推論能力を持っており,画像中の特定の部分 (注目領域) から,画像だけでは非自明な状況を経験や知識に基づいて、拡張して推論することができる.例えば,お皿いっぱいに食べ物を盛っている人を見れば,たとえその人のことをよく知らなくても「この人はお腹が空いているのだろう」と考えることができる.では,計算機はこのような視覚的な仮説推論を行うことができるのだろうか? 本研究では,視覚的仮説推論について,画像内の物体や行動などの注目領域に対する(i)具体的な手掛かりとなる情報,および(ii)そこから推論できる情報の2つのキャプションが付与されたsherlockデータセットを用いて,非自明な仮説推論を画像からEnd-to-Endに生成できるかをを最先端の画像モデルと文章生成モデルを使用して分析する. その結果として,事前学習済みの言語画像モデルに対し注目領域を理解するように追加学習を施し,これを文章生成モデルと組み合わせることで,ある程度視覚的な仮説推論ができることを報告する.

  • 松野 竜太, 佐久間 啓太, 亀田 義男
    セッションID: 3E1-GS-2-03
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    産業分野において、機械学習技術の実利用が進んでいる現在、予測モデルの継続的な運用技術に関する領域であるMLOpsが注目されている。MLOpsを通した予測モデルの運用では、予測モデルの性能劣化による損害を防ぐために、予測モデルの性能の監視が行われる。しかし、正解ラベルの入手に遅延がある場合には、予測時点での予測性能を直ちに算出することができない。予測性能が算出できるのは正解ラベルの入手後になり、予測性能の監視に遅延を伴うため、予測性能の劣化への対処が遅れてしまう。本研究では、運用データに対する予測モデルの予測性能を、正解ラベルなしで推定する技術を提案する。提案手法は、予測モデルの予測の妥当性を測るために、予測モデルとは別に複数のチェックモデルを作成し、予測モデルとチェックモデルの結果を比較することで予測性能を推定することができる。予測モデルの運用時における性能推定を想定した実データ実験により、従来からの手法に対して提案手法が精度、適合率、再現率、F値を低誤差に推定できることを検証した。

  • 宗近 康平, 原 聡
    セッションID: 3E1-GS-2-04
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    分類モデルが出力する予測の不確実性を適切に調整する手法を較正 (calibration) という。特に深層学習などの高性能なモデルが出力する不確実性は実際のデータと乖離する傾向にあり、較正手法の重要性が高まっている。 較正手法の一種であるDecision Calibration [Zhao et al., NeurIPS'21]は、モデルの予測に基づいてユーザが意思決定を行った際に受ける損失(決定損失)を用いて較正を行う。モデルの出力する不確実性から計算される決定損失の期待値と、実際に意思決定を行った際に生じる真の決定損失の期待値が近づくようにモデルの出力を補正する。 これに対し、本研究では決定損失の分散に着目し、意思決定後に受ける決定損失の期待値および分散の両者を適切に推定できるようにモデルの出力を補正する方法を考案する。提案手法により、ユーザは意思決定を行った際の決定損失の期待値だけでなく、そのばらつきの程度をも適切に見積もることが可能となると期待できる。

  • 谷口 尚平, 鈴木 雅大, 岩澤 有祐, 松尾 豊
    セッションID: 3E5-GS-2-01
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    深層ボルツマンマシンは,生成モデルとして有望だが,その学習が難しく,事前学習が必要とされてきた.本稿では,深層ボルツマンマシンの学習において,不偏マルコフ連鎖法に基づく勾配推定法を提案する.提案法は,勾配推定を安定かつ高速に行うことができるため,事前学習なしでの深層ボルツマンマシンの学習を可能にする.実験では,画像の生成モデルとして深層ボルツマンマシンを提案法を用いて学習し,既存手法と比較してその有効性を検証する.

  • 倉元 俊輝, 鈴木 潤
    セッションID: 3E5-GS-2-02
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    大規模な文章コーパスを用いて学習した言語モデルが開発・公開されており、それらを目的に応じた追加学習用データで微調整学習を実施することで口コミなどの言語データの解析をビジネスに活かす機会が広がっている。しかし、実際のビジネス場面では様々な制約により取得可能な追加学習用データはいつも潤沢という訳ではなく、同時に目標性能を達成するためにどれくらいのデータを収集すべきか、その指針設定も容易ではない。このような課題に対し本稿では自然言語処理の分類問題に絞って、初期に得られた数百~千件の追加学習用データを用いて微調整学習したモデルの分類性能の結果から、追加学習用データ量が増加した場合の分類性能の伸長を予測し、目標性能達成のために必要なデータ量を試算できる手法を提案する。具体的には、事前学習モデルを微調整学習する際、エポック数を増やし学習を重ねていくと、その分類性能は元のデータ量によらず類似した傾向で伸長する。その伸長の近似式を用いることで初期の追加学習用データが限られている場合でも10倍~100倍程度の学習用データを用いてモデルを学習した際に得られる分類性能を推測可能であることを検証する。

  • 高井 佑輔, 鈴木 麗璽, 有田 隆也
    セッションID: 3E5-GS-2-03
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    メタ記憶とはメタ認知の一種であり,自己の記憶のモニタリングやコントロールをする能力である.計算機実験による先行研究[Yamato et al. 2022]では,見本刺激を記憶後に複数の比較刺激から選択する遅延見本合わせ課題において, 自己の記憶を参照してその忘却が進んでいるほど見本合わせを回避する個体の進化に成功した.本研究ではより状況付けられたメタ記憶の進化シナリオとそのメカニズムを明らかにするため, 忘却するエージェントによる採餌行動を対象とする構成的アプローチを試みた.具体的には,初めに与えられる餌の位置情報をもとに移動するが, 位置情報の忘却によって採餌に失敗するよりは採餌を回避した方が良いというタスクを考案し,学習自体も進化するニューロエボリューションを神経修飾と進化計算手法NEATを用いて実装して進化実験を行った.その結果,餌の位置が遠いほど回避を選択する個体の進化に成功した.また,ネットワークの分析により,位置情報に基づいて採取判断を行う構造の一部を参照することによって回避するという高次的な機能,つまりメタ記憶に準じた回路を確認した.

  • 荒井 新太郎, 三宅 陽一郎
    セッションID: 3E5-GS-2-04
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    近年、ビデオゲームなどの複雑な環境において深層強化学習を用いることでエージェントの行動最適化を狙う試みが多く行われている。しかし、強化学習における問題として報酬が疎らにしか環境から与えられない場合に学習が難しくなる傾向がある。この問題に対しては外部から与えられる報酬の他に、観測した状態の新規性に基づいた内部報酬を用いることで解決する手法(好奇心ベース)が提案されている。 本研究では報酬が疎らな他に、環境がランダムで生成されるという特徴を持つローグライクゲームを対象に、Q学習、Deep Q-Networks(DQN)によって学習を行う。また、それぞれに好奇心ベース手法を適用し学習することで、それぞれの手法がどのようにダンジョン探索を効率的に行えるかを比較する。その後、学習済みの各手法のモデルを用いてランダム生成したダンジョンの探索を行い、対しどれだけ性能を発揮できるか比較し考察を行った。

  • 清水 仁, 諏訪 博彦, 中村 翼, 岩田 具治, 藤野 昭典, 澤田 宏, 安本 慶一
    セッションID: 3F1-GS-10-01
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    人口が減少する日本では,小中学校の統廃合が進められている. しかし,校区再編には住民への説明や調整が必要であり,地方自治体が同時に変更できる校区の数には限度がある. これまでに校区再編計画は,整数線形計画問題として定式化して最適解を得る手法が開発されている. その定式化に対して,廃止する中学校の数や小学校の数,あるいは転校が発生する街区の数に,制約を追加することは容易である. ところが,校区再編を進めるために小学校と中学校の対応関係は固定されず,「ある中学校に進学する小学校に通学する街区」のような形式で個数を指定する場合の定式化は困難である. そこで本研究では,このような複雑な制約条件を,校区再編計画問題に導入する手法を提案する. 評価実験により提案手法の有効性を確認する.

  • 鈴木 陽介, 水野 一徳
    セッションID: 3F1-GS-10-02
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    勤務表の作成は,従業員の出勤可能日や店の混雑状況など,様々な制約を考慮し作成しなければならない.本研究で扱う個別指導塾も例外ではなく,講師の出勤可能日や指導可能な教科の考慮はもちろん,生徒の出席可能日や受講している教科なども考慮しなければならないため,作成者に多大な負荷を課すこととなる. さらに,この問題では,講師の勤務表を生徒の時間割をもとに作成しなければならないところにあり,シフトスケジューリングと時間割編成の2つの計画問題を解かなければならない. そこで本研究では,本問題を勤務表の作成と時間割編成の二段階に分けることで,望ましい解を効率的に発見することを目指す.具体的には,遺伝的アルゴリズムで講師の制約を考慮した解候補(仮シフト)を求め,焼きなまし法で仮シフトに対して受講教科を割り当てることで勤務表(本シフト)を自動的に作成するシステムを提案する. また,本システムは対話型インターフェースにより,ユーザが柔軟かつ容易にスケジュールの修正を行うことを可能にする.

  • 三神 賢雅, 佐久間 拓人, 加藤 昇平
    セッションID: 3F1-GS-10-03
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    近年日本では少子高齢化が深刻な課題であり,労働力人口は減少を続けている.その結果企業は新たな労働力の確保が難しく,既存の勤務者の要望を聞くことで労働者数を維持する必要がある.実際に食品メーカーではスケジュール作成者が多くの勤務者から多くの要望を聞き入れスケジュール作成をしているため,スケジュール作成は非常に負担の大きな作業になっている. そこで,本研究ではスケジュール作成に関わる全ての人の相互負担軽減のため,実時間でスケジュールを生成可能なシステムを提案する.本稿では複数の勤務帯労働者が混在する製造現場を想定し,多種多様なニーズに対応した条件を目的関数と制約条件に分け,それぞれを線形式で定式化し線形計画法に帰着させることでスケジュールを作成する方法を提案する. 本提案では、休憩交代、負荷分散などの複数の制約条件を満たしたスケジュール作成システムを提案する.本発表では時間勤務労働者が大半を占める食品メーカーから提供された実データに基づいた問題設定でスケジュール作成実験を実施する.実験により生成したスケジュールと食品メーカーの勤務実績を比較することで,提案システムの実用性を検証する.

  • 松井 藤五郎, 石田 匠吾
    セッションID: 3F1-GS-10-04
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    本論文では、深層強化学習を用いた経路探索における報酬関数の改善方法を提案する。従来手法では、2-opt法のヒューリスティック関数を深層強化学習で学習するにあたって、それまでの最良経路の経路長から現在の方策によって出力された経路長を引いた値を報酬としていた。しかしながら、実際の配送経路探索においては、複数の配送先が非常に近い場合があり、このような場合には報酬が小さくなってしまい最適経路を効率よく学習することが難しい。本論文の提案手法では、深層強化学習における報酬関数を改善が小さいときの報酬がより大きくなるよう補正する。改善が小さいときの報酬をより大きくすることによって、改善が小さいときでも学習が進み、より効率的な経路探索ができると期待できる。また、提案手法を実際の配送経路探索問題に適用し、その有効性を確認する。

  • YANG Sichang, 藤井 秀樹, 吉村 忍
    セッションID: 3F1-GS-10-05
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    大規模災害が発生すると,膨大な数の復旧オーダが同時に発生し,早期に復旧作業を終わらせる必要がある.本研究では,効率的な復旧計画の策定を実現するために,階層型最適化を用いて,大規模災害発生時,復旧作業員の巡回スケジューリング問題を解くコードを開発し,最適解を導き出した. 巡回スケジューリング問題の下位問題を解決するために,サブエリアでの作業所要時間を最小化する問題を設定し,遺伝的アルゴリズムを用いてその最適解を導き出すコードを作成し,結果を確認した.コードを検証するために,CVRPのベンチマーク問題の条件下でコードを実行し,結果を比較した. 本研究では,復旧作業員の巡回スケジューリング問題を設定し,階層型最適化を用いて復旧計画を効率化する際,下位問題である各サブエリアでの巡回スケジューリング問題の近似解を導き出すことができた.今後,上位問題であるリソース配分の最適化,作業優先順位,作業スキル等の制約の導入により,より現実的な問題設定を実現することが期待される.

  • 島袋 琉, 冨田 智彦, 福井 健一
    セッションID: 3F5-GS-10-01
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    1954年に提案されたアリソフ気候区分は、1月と7月の大規模な気団帯と前線の気候変動に着目した分類である。本研究では、全球再解析データに機械学習のクラスタリング技術を適用し、気団域を定量的かつ客観的に決定し、気団の概念に基づいた全球気候区分を行った。10-3月と4-9月の2半年期間における4つの気団帯の南北変位から9気候帯を設定し、大陸性気候・海洋性気候、すなわちある気候帯を東西方向の気候の差異を考慮することで、さらに27気候区へと細分化した。本研究は先ず、1950年代のアリソフの様に、地球気候を4気団帯に分けることは気候の不連続性を捉えられるのか、という点に疑いを持つことから始めた。その結果、1950年代のアリソフの4分類が、現代の高品質なデータを用いたデータ駆動型の観点からも支持された。さらにクラスタリング技術は、中高緯度の傾圧性に伴う前線性降水を正確に捉えることができた。本研究で新しく提案した気候区分は、アリソフ気候区分を約70年ぶりに更新するものであり、気象学・気候学分野へのデータ駆動型の機械学習技術を適用する1例として、気団に基づく成因的気候区分の標準を確立するものである。

  • 飛島 遼太, 浦野 昌一
    セッションID: 3F5-GS-10-02
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    太陽光発電は導入の際、日射量を考慮してその場所が十分な発電量を見込める地点であるか判断する必要がある。しかし、日射量データが継続して測定されている場所は限られている。そこで現在、人工衛星データを用いた日射量推定が注目されている。人工衛星は広範囲における大量の観測データを保有している。そのため、人工衛星データを特徴量とし、地上の日射量推定を行うことにより、地球上のあらゆる地点における日射量データの取得が可能となる。しかしながら、その推定精度が十分でないことが衛星日射量推定における課題となっている。そこで、本研究では一般的に日射量推定に用いられる静止軌道衛星データに加え、低軌道衛星データも特徴量として扱う。従来の低軌道衛星データは高解像度という特性がありながら、時間分解能が十分でないことから殆ど日射量推定には使用されてこなかった。しかし、近年、衛星コンステレーション技術の台頭により、高時間分解能の低軌道衛星データの取得が可能となった。そこで、この2種類の人工衛星データと地上で観測された日射量データの関係性を機械学習を用いてモデル化し、衛星日射量推定の有効性及び精度検証を行う。

  • 園田 潤, 中道 一紗, 小岩 晃
    セッションID: 3F5-GS-10-03
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    島国である日本では離島が多くアクセス手段は定期船であることが多いが,出航欠航の判断は生活や観光において重要である.例えば,山形県酒田市飛島では,出航の判断は当日朝に周辺地域の風速や波高などの気象データから行われている.このため出航の可否は当日まで分からず計画も立てづらく,前日までの定期船の運行予測が求められている.本研究では,翌日以降の定期船の運行予測を目的に,容易に入手可能な公開データである気象庁のアメダスデータと10年間の定期船の運行実績をもとに,SVM (Support Vector Machine) による定期船の運航予測を行うシステムを開発した.この結果,複数地点のアメダスデータを組み合わせることで1週間後の予測精度を72%にすることができた.また,利用者が週間天気予報とともに運航予測をWebで閲覧できるシステムを構築した.

  • 原田 慶紀, 沖 拓弥
    セッションID: 3F5-GS-10-04
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    昨今,Google Street Viewをはじめとする画像ビッグデータと機械学習を用いて,街路に対する人々の印象評価のモデル化が試みられている。しかし,使用する画像は,主に天候の良い昼間に撮影されたものに限られ,天候や時間帯が異なる場合の評価は困難であった。そこで本研究では,天候の異なる状況下において収集した街路画像を用いて,状況の違いが人々の街路印象評価に及ぼす影響を定量的に分析することを目的とした。まず,東京都世田谷区内の4地域を対象として,自転車で走行しながら街路画像を収集した。次に,収集した画像を用いて大規模印象評価Webアンケートを実施し,その結果をConvNeXt[Liu et al., 2022]を特徴抽出器としたSiameseネットワークに学習させ,「街路印象評価モデル」を構築した。そして,さまざまな街路画像をモデルに入力することで街路印象評価スコアを予測し,夜間に特定の項目のスコアが上昇する街路などを,定量的かつ詳細に把握できることを示した。さらに,街路構成要素を説明変数,街路印象評価スコアを被説明変数として回帰分析を行い,街路印象評価における天候や時間帯の重要性を検証した。

  • 尾亦 範泰, 堤 誠司, 安部 賢治, 篠原 育
    セッションID: 3F5-GS-10-05
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    人工衛星には故障検知・診断・復帰のためのシステム(FDIRシステム)が搭載されているものの,現状のFDIRシステムはプリミティブなルールベースで設計されている.そのため,FDIRシステムでは衛星の若干の状態の変化をはじめとする,故障の予兆が捉えられることは稀であり,人間の衛星運用者が随時データを監視する必要がある.人工衛星の運用に携われる専門家の人数は限られるため,運用者のワークロードを低減させることは重要な課題であるといえる.この問題は,衛星の多数化(コンステレーション)を実施する際には特に顕著である.そこで,本研究では,データ駆動型の人工衛星の状態自動監視に向けた変化検知手法を新たに提案・検討する.従前の研究に比べ,より素早い実用化を目指したアルゴリズムを提案する.実際にJAXAの衛星で取得されたテレメトリデータに適用した結果も報告する.

  • 兼田 寛大, 神原 元就, 杉浦 孔明
    セッションID: 3G1-OS-24a-01
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    生活支援ロボットは在宅介護者の不足などの社会問題に対する解決策として期待されている.そこで,本論文ではhuman-in-the-loop設定において,オープンボキャブラリのユーザ指示文から対象物体を検索する learning-to-rank physical objects (LTRPO) タスクを提案し,また本タスクを扱うMultiRankITを提案する.MultiRankItは,参照表現と対象物体領域との関係をモデル化するCrossmodal Noun Phrase Encoderと,対象物体とその周囲画像との関係をモデル化するCrossmodal Region Feature Encoderを導入している.実験結果より,提案手法は mean reciprocal rank と recall@Kにおいてベースライン手法を上回った.

  • 金沢 直晃, 河原塚 健人, 大日方 慶樹, 岡田 慧, 稲葉 雅幸
    セッションID: 3G1-OS-24a-02
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    調理タスクにおいては,レシピ記述に従って調理作業を行い食材を状態変化させていき料理を完成させることが目標となる.そのため,ロボットによる調理タスクの実行の実現のためには,自然言語で書かれた料理レシピを基にロボットの調理タスクを計画し,食材の状態変化をロボットが認識できることが望ましい.本研究では,近年盛んに開発が進められている大規模基盤モデルをロボットに応用することで,インターネット上の膨大な言語関連データに含まれる人の知識や常識をロボットが利用し,食材の状態変化を考慮しながらレシピ記述に基づいて調理を実行するロボットシステムを提案する.言語モデルによるレシピの調理関数表現変換と,視覚-言語モデルの時系列利用による言語記述に基づいた食材の状態変化認識を行い,実験により有効性を確認した.

feedback
Top