Loading
DeNA AI
contact

NEWS

2023年度 第37回 人工知能学会全国大会で甲野も企画・運営で参画するオーガナイズドセッションにて論文募集中


2023年6月6日(火)~9日(金) に開催予定の2023年度 人工知能学会全国大会 (第37回) にて、DeNA 甲野佑がオーガナイズドセッション「OS-27 強化学習の新展開」のオーガナイザの一人として参画いたします。詳細はこちら

強化学習アルゴリズムは自ら環境を自律的に試行錯誤し、行動パターンを習得していくフレームワークであるため、ある種の万能性を備えたものとして捉えられています。実用的、理論的には多くの課題が残っていますが、試行錯誤と観測から環境の状態表現・予測モデルを作り上げる構築型のモデルベース強化学習や、部分観測状態への対処法の進展から、フレーム(相互作用可能な環境での試行錯誤からの学習)としての強化学習は現在も有望です。しかし適用されるドメインの複雑性が増すほど、指数関数的に試行錯誤の回数は多くなり、実環境での利用は制限を受けます。そのためオンライン学習を目的としながらも、現実にはシミュレータを用いた事前学習を前提としていて応用範囲にも制約があります。Computer Vision などドメインが限定されていれば、学習済みモデルを fine-tuning して大幅に時間を短縮可能ですが、強化学習は行動空間が意味的に異なるなどモデルの使い回しが困難です。
つまり強化学習という枠組みでは、ベイズ推定における事前分布、あるいはそれに類するような推論による仮定の与え方が課題になります。この問題に対して、強化学習フレームの外側に位置する経験や事前知識を、ドメインや課題範囲の違いに考慮して価値推定や行動選択に導入する方法論が多数提案されています。本 OS ではそれら技術の整理・新たな提案を通じて真に汎用性のある新しい強化学習のフレームの進化と展望を議論します。

該当論文について 1/20(金)午後2時(JST)まで投稿を募集しておりますので、合致する内容を投稿予定の方は投稿先として御一考いただければ幸いです。また、本 OS への聴講もお待ちしております。

20230118-jsai2023-os-27

project member

YU KONO AI研究開発エンジニア