製造業関連情報総合ポータルサイト@engineer
WEB営業力強化支援サービスのご案内
製造業のための技術系セミナー/書籍/通信教育/雑誌
技術情報協会はセミナー・出版・通信教育を通じて企業の最前線に立つ研究者、技術者をサポートします!
イベント

【セミナー 12/18】強化学習の基礎とその使い方

  • このエントリーをはてなブックマークに追加
  • @engineer記事クリップに登録
セミナー情報  / 2018年11月08日 /  ロボット IT・情報通信 建設・プラント
イベント名 強化学習の基礎とその使い方
開催期間 2018年12月18日(火)
10時~17時
会場名 [東京・五反田] 技術情報協会 セミナールーム
会場の住所 東京都品川区西五反田2-29-5 日幸五反田ビル8F
地図 http://www.gijutu.co.jp/mailmap/company_map.htm
お申し込み期限日 2018年12月17日(月)15時
お申し込み

<セミナー No.812503>

 

強化学習の基礎とその使い方

~Q学習から深層強化学習AlphaGoZeroまで~

 

★強化学習とは何か?どんな仕組みか?何ができるのか?

 学習エージェントと環境、アルゴリズム、深層強化学習…分かりやすく解説します!

 

--------------------------------------------------------------------------------

 

■講師 京都工芸繊維大学 情報工学・人間科学系 准教授 飯間 等 氏

 

■聴講料

1名につき50,000円(消費税抜き、昼食・資料付)

1社2名以上同時申込の場合1名につき45,000円(税抜)

大学、公的機関、医療機関の方には割引制度があります。 詳しくはお問い合わせください。

 

※定員になり次第、お申込みは締切となります。

 

プログラム                                                                                   

 

【講演のポイント】 人工知能分野では、プロ棋士の経験に基づいて囲碁の打ち方を学習するAlphaGoが一昨年に大 きな話題となり、続いてこれを上回るAlphaGoZeroが昨年提案されました。AlphaGoZeroは深層強化学習とい う最先端技術を用いることでプロ棋士の経験を全く使用せずに学習できること、また応用分野が限定されて おらず、どのような分野でも適用可能であることから世界中のあらゆる分野で注目を集めております。 本講演では、このように注目を集めて続けている強化学習を基礎から平易に解説します。学習の方法につい て、伝統的で幅広く用いられているQ学習から最新の深層強化学習まで、様々な学習法を紹介します。例を 用い、また練習問題を解くことで理解を深めます。

 

【講演項目】

1. 強化学習の例示(デモンストレーション)

  1.1 最短経路探索

  1.2 ゲームプレイ

  1.3 二足歩行

 

2. 強化学習問題

  2.1 学習エージェントと環境

  2.2 問題の定義

  2.3 設定例

 

3. 表形式の強化学習法

  3.1 価値関数

  3.2 行動選択法

  3.3 伝統的な学習法:Q学習、Sarsa

 

4. 近似を用いる強化学習法

  4.1 価値関数の近似: 放射基底関数、ニューラルネットワーク

  4.2 勾配法

  4.3 価値勾配を用いる学習法

  4.4 方策勾配を用いる学習法

 

5. 人間を超える学習法:深層強化学習

  5.1 深層学習(ディープラーニング)

  5.2 ビデオゲームに対する学習法

  5.3 囲碁に対する学習法: AlphaGoとAlphaGoZero

 

【質疑応答・個別質問・名刺交換】

     

 

セミナーの詳細についてお気軽にお問い合わせください。 

  • HOME
  • 製品・技術 書籍・通信講座情報
  • イベント セミナー情報
  • 会社概要
  • お問い合わせ