adventar.org この記事はKyoto Universuty Advent Calendar 2021の23日目の記事です.元々は逆強化学習について記事を書こうと考えていたのですが, 時間が無かったので別の内容について雑な記事を書きました. 申し訳ございません. 授業か何かでやった内容が面…
東大の松尾先生の研究室主催のセミナー(RLSP2021)の復習に書いた記事です. 1回生で参加し, 知識不足ではありましたがとても勉強になりました. ありがとうございました. 記号の定義 SACとは? 概要 学習とそれぞれの損失関数 ・Critic()の損失関数 ・Actor()の…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。