製造業関連情報総合ポータルサイト@engineer
WEB営業力強化支援サービスのご案内
研究・技術・事業開発のためのセミナー/書籍 サイエンス&テクノロジー
イベント

12/14 【Live配信(Zoom使用)限定セミナー】 よくわかる!逆強化学習の基礎、手法選択と応用

  • このエントリーをはてなブックマークに追加
  • @engineer記事クリップに登録
電気・電子・半導体・通信 ICT・情報処理  / 2020年11月12日 /  ロボット IT・情報通信 先端技術
イベント名 【Live配信(Zoom使用)限定セミナー】 よくわかる!逆強化学習の基礎、手法選択と応用
開催期間 2020年12月14日(月)
10:30~16:30 
※会社・自宅にいながら学習可能です※
会場名 Live配信セミナー(リアルタイム配信)
会場の住所 東京都
お申し込み期限日 2020年12月13日(日)16時
お申し込み受付人数 30  名様
お申し込み

【Live配信(Zoom使用)限定セミナー】
よくわかる!逆強化学習の基礎、手法選択と応用

■講義中は、講師が画面に直接、書き込みや注釈を加えながらLive配信いたします■

 

本セミナーは、Zoomによる【Live配信受講】のみです。会場開催はございません。
※詳細につきましては下記「ライブ配信」の項目をご確認ください。

 

★ 逆強化学習を基礎から解法まで1日で徹底学習!

  

講師

 

電気通信大学 i-パワードエネルギーシステム研究センター&基盤理工学専攻 准教授 

曽我部 東馬 氏
兼任 (株)GRID 最高技術顧問

 

 受講料(税込)

 

49,500円(本体45,000円+税4,500円)※資料付

キャンペーン!2名同時申込みで1名分無料(1名あたり定価半額24,750円) 

 

※テレワーク応援キャンペーン(1名受講)【Live配信/WEBセミナー受講限定】
 1名申込みの場合:受講料( 定価:35,200円/S&T会員 33,440円 )
    35,200円 ( S&T会員受講料 33,440円 ) 

  定価:本体32,000円+税3,200円
  会員:本体30,400円+税3,040円
※1名様でLive配信/WEBセミナーを受講する場合、上記特別価格になります。
※お申込みフォームで【テレワーク応援キャンペーン】を選択のうえお申込みください。
※他の割引は併用できません。

 

 趣旨

 

 

 

 プログラム

 

 

第1部 逆強化学習の基礎知識
 1.1 マルコフ決定過程

      ・平均とマルコフ性(MP)
      ・逐次平均表現とMP
      ・マルコフ報酬過程
      ・マルコフ決定過程
 1.2 Bellman方程式の導出:
      ・平均から決定型Bellman方程式の導入:
      ・平均表現と価値関数の導入:
      ・確率型Bellman方程式の導出:
       (日)行動状態価値関数の導入:
       (月)確率型ベルマン方程式の導出
       (火)遷移確率関数 T (r ( S') , S'│s,a )の極意
       (水)グリッドワード問題の応用
 1.3 動的計画法
      ・ε = 1 - Greedy反復方策
      ・ε = 0 - Greedy方策反復法(On-Policy)
      ・ε = 0 - Greedy価値反復法(Off-Policy)
 1.4 逆強化学習の基本概念の導入
      ・報酬関数の定義
      ・報酬関数による価値関数の推定

第2部 逆強化学習の解法:線形計画最適化逆強化学習手法
 2.1 線形計画最適化逆強化学習手法の導入
 2.2 線形計画逆強化学習手法の定式化
 2.3 線形計画逆強化学習手法のコーディング要領
 2.4 線形計画逆強化学習手法の応用事例の紹介

第3部 逆強化学習の解法:最大エントロピー逆強化学習手法
 3.1 関数近似の基本概念 
 3.2 関数近似モデルを用いた報酬の表現 
 3.3 機械学習による報酬関数の回帰 
 3.4 最大エントロピーを取り入れた報酬誤差関数の設計
 3.5 熟練者による行動確率教師データの生成
 3.6 最大エントロピー逆強化学習手法のコーディング要領
 3.7 最大エントロピー逆強化学習手法の応用事例の紹介

第4部 逆強化学習の解法:深層NN最大エントロピー逆強化学習手法
 4.1 深層NN(neural network)の導入
 4.2 深層NN最大エントロピーを取り入れた報酬誤差関数の設計
 4.3 熟練者による状態頻度教師データの生成
 4.4 深層NN最大エントロピー逆強化学習手法のコーディング要領
 4.5 深層NN最大エントロピー逆強化学習手法の応用事例の紹介

第5部 逆強化学習の展望と関連技術の紹介


  □質疑応答□

 

 

【ZoomによるLive配信】

・本セミナーはビデオ会議ツール「Zoom」を使ったライブ配信セミナーとなります。

・お申込み受理のご連絡メールに接続テスト用のURL、ミーティングID 、パスコードが記されております。

 「Zoom」をインストールができるか、接続できるか等をご確認下さい。

・セミナー開催日時に、視聴サイトにログインしていただき、ご視聴ください。

・開催日時にリアルタイムで講師へのご質問も可能です。

・タブレットやスマートフォンでも視聴できます。

 

 

<配布資料>

製本テキスト(開催前日着までを目安に発送)
※セミナー資料はお申し込み時のご住所へ発送させていただきます。
※開催日の4~5日前に発送します。
 開催前日の営業日の夕方までに届かない場合はお知らせください。
※開催まで4営業日~前日にお申込みの場合、
 セミナー資料の到着が、開講日に間に合わない可能性がありますこと、ご了承下さい。


  

━━━━━━━━━━━━◆キャンペーンについて◆━━━━━━━━━━━━━━━━━━

≪お申し込み方法≫

 お申し込みページ一番上の連絡事項欄に「2名同時申込み」希望の旨と、

 2人目の受講者様の情報(お名前・メールアドレスは必須)をご入力ください。

 住所等が申込者様と同一の場合は、省略いただいて結構です。

・2名様ともS&T会員登録をしていただいた場合に限ります。詳細は別途ご連絡いたします。

・同一法人内(グループ会社でも可)による2名同時申込みのみ適用いたします。

・3名様以上でお申込みの場合、3人目以降は定価の半額で受講できます。

・受講券、請求書は、代表者にご郵送いたします。

・請求書および領収書は1名様ごとに発行可能です。ご希望の場合はお知らせください。

・他の割引は併用できません。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

---------------------------------------------------------------------------------------

○お申し込み後、サイエンス&テクノロジーより確認のご連絡を差し上げます。

○受講料は銀行振込、または当日会場にて現金でお支払いください。

○お申込み後、ご都合が悪くなった場合は代理の方のご出席も可能です。

やむなくキャンセルされる場合は、下記のキャンセル規定で承ります。

◇キャンセル規定◇

開催日から逆算(営業日:土日・祝祭日等を除く)いたしまして、

・開催7日前以前でのキャンセル: キャンセル料はいただきません

・開催3~6日前でのキャンセル: 受講料の70%

・開催当日~2日前でのキャンセル・欠席: 受講料の100%

※受講料入金後での7日前以前のキャンセルについて、返金の手続きが発生した場合の振込手数料はお客様負担とさせていただきます。

---------------------------------------------------------------------------------------

※お申し込み詳細についてはQ&Aにも掲載しております。

サイト内検索
ページカテゴリ一覧
新着ページ
月別ページ