Emileの備忘録

色々な事をだらだらと

アルゴリズム

Soft Actor-Critic(SAC)でdonkeycarのシミュを走らせてみる

東大の松尾先生の研究室主催のセミナー(RLSP2021)の復習に書いた記事です. 1回生で参加し, 知識不足ではありましたがとても勉強になりました. ありがとうございました. 記号の定義 SACとは? 概要 学習とそれぞれの損失関数 ・Critic()の損失関数 ・Actor()の…

ベルマン作用素の基本と性質

この記事上での定義 ベルマン方程式再び ベルマン作用素とその性質 2つのベルマン作用素 定義 性質 1.単調性 2.ベルマン作用素はバラせる. 3.収束性 4.一意性 5.縮小性 まとめ 間違っていたら教えてください この記事上での定義 ・作用素 : 関数から関数への…

【WRM007】Aquilaのソースコード

アルゴリズム部分だけです。個人的には探索アルゴリズムに関しては他のどのチームにも劣らなかったと思っています。 (異論は認めます.) ソースコード Aquila-2019/Src/source at master · rakuseirobot/Aquila-2019 · GitHub ↑ ここの data_structure.hpp & …

WRM007 Aquila アルゴリズム解説

目次 マッピング (改良)深さ優先探索(DFS) 細かい工夫と苦労した事 アルゴリズムに触れる方法 ※ここからは、頂点の数はV,辺の数はEとする.(頂点=Vertex,辺=edge) また大会の終了後にソースコードを公開する予定にしている. マッピング 30cm*30cmのマスを1つ…