ブラックボックス(ベイズ)最適化とハイパラの自動調整

この記事は学ロボアドベントカレンダー2023最終日の記事です。学ロボアドカレ2023、多数のご参加ありがとうございました!! さて、2023年も年の瀬が迫って参りました。皆様いかがお過ごしでしょうか？私はこの年末が学部生活の冬という現実に戦々恐々とし…

2023-12-18

キャチロボ23まとめ(新規開発物とその知見など)

この記事はポエムです。ｱﾚﾙｷﾞｰのある方は閉じてください。この記事は学ロボアドベントカレンダー18日目の記事です。 adventar.orgキャチロボ2023で新規開発した物・知見やその他もろもろについてまとめた記事です。 ==============目次============== 1. チ…

2023-12-10

ompl+αでリアルタイム経路生成

この記事は学ロボアドベントカレンダー11日目の記事です。 adventar.org この記事はompl+αでロボットアームの経路をリアルタイムで生成する手続きをまとめた記事です。実際の経路FMT*で生成したglobal pathをスプラインで二重に補間し、台形加減速まで経路…

2023-11-30

STM32 Nucleo-F767ziでmicro-ROSを動かす(CubeMX+CMake)

この記事は学ロボアドベントカレンダーの1日目の記事です。今年も先駆けを務めさせて頂きます。殿も務める予定です。 adventar.org この記事はSTM32 Nucleo-F767zi上でmicro-ROSを動かす為の設定をまとめた記事です。 CubeMX+CMakeで動かす事を前提にしてい…

2022-12-17

エクストリーム帰寮参加記

この記事はポエムです。ｱﾚﾙｷﾞｰのある方は閉じてください。 PCで見る事を想定して書いています。スマホだとレイアウトが崩れてるかも(ごめん) この記事はエクストリーム帰寮アドベントカレンダー2022の17日目の記事です。 adventar.org 時が経つのは早いもの…

2022-12-13

個人向けタスク管理

これはポエムです.アレルギーのある方はこの記事を閉じてください.この記事は学ロボAdvent Calendar 2022の13日目の記事です。 adventar.org この記事では個人向けのタスク管理サービスについて紹介します。 ==============目次============== 0. はじめに 1…

2022-12-01

計算量の話

この記事は学ロボAdvent Calendar 2022の1日目の記事です。魁はアドカレ作成者の私が務めさせて頂きます。adventar.org この記事ではプログラムの計算量などについて軽く軽く軽くおさらいします。 ==============目次============== 0. はじめに 1.計算量と…

2022-07-07

FRITによるデータ駆動型制御器チューニング

この記事ではFRITの手続きと「なぜそれで上手く行くのか?」を軽く軽く説明します。 1.はじめに 2.FRITとは? 問題設定 FRITの具体的な手続きなぜこれで上手く行くのか(概略) 3.おわりに参考文献 1.はじめに人間、10年・20年も生きていれば何度も制御器のパ…

2021-12-23

MCMCの画像のノイズ除去への応用

adventar.org この記事はKyoto Universuty Advent Calendar 2021の23日目の記事です.元々は逆強化学習について記事を書こうと考えていたのですが, 時間が無かったので別の内容について雑な記事を書きました. 申し訳ございません. 授業か何かでやった内容が面…

2021-08-10

Soft Actor-Critic(SAC)でdonkeycarのシミュを走らせてみる

強化学習アルゴリズム

東大の松尾先生の研究室主催のセミナー(RLSP2021)の復習に書いた記事です. 1回生で参加し, 知識不足ではありましたがとても勉強になりました. ありがとうございました. 記号の定義 SACとは? 概要学習とそれぞれの損失関数・Critic()の損失関数・Actor()の…

2020-12-21

A2Cの理論と実装

強化学習

この記事はKyoto University Advent Calendar 2020の記事の12/21日分として書かれた物です. adventar.org 先日のd0ra1998先輩の記事には改めて京都の四季の美しさに気付かされました. 先輩方の面白い記事が並んでいる中でこんな駄文を投下するのは気が引けま…

2020-12-13

DDPGでPendulum-v0を解く

強化学習

もし間違っている所やおかしいなと思う所があれば指摘してください DDPGとは概要決定論的な方策勾配定理損失関数 soft-target 実装 Pendulum-v0の問題設定ソースコード結果参考文献 DDPGとは概要 DDPGは,Actor-Criticの構造を取り, 学習には soft-tar…

2020-08-20

ベルマン作用素の基本と性質

強化学習アルゴリズム

この記事上での定義ベルマン方程式再びベルマン作用素とその性質 2つのベルマン作用素定義性質 1.単調性 2.ベルマン作用素はバラせる. 3.収束性 4.一意性 5.縮小性まとめ間違っていたら教えてくださいこの記事上での定義・作用素 : 関数から関数への…

2020-06-20

MountainCar-v0をfixed target Q-networkを用いて解く

強化学習

もし間違っている所やおかしいなと思う所があれば指摘してください MountainCar-v0の問題設定 fixed target Q-networkについて定義再びどういう手法かその他の工夫 Experience Replay 実装結果 MountainCar-v0の問題設定目的:台車を右上の旗がある所に…

2020-03-20

ベルマンフォード法について

間違ってたら教えてください。ベルマンフォード法はいつ使うの? どんなアルゴリズム? 定義の説明と前提・記号について・緩和(relaxtion) ・最短路は閉路を含まないどんなアルゴリズム? サンプルソースベルマンフォード法はいつ使うの? 負の大きさの辺を…

2019-05-01

【WRM007】Aquilaのソースコード

レスキューMAZE 迷路アルゴリズム RCJ

アルゴリズム部分だけです。個人的には探索アルゴリズムに関しては他のどのチームにも劣らなかったと思っています。 (異論は認めます.) ソースコード Aquila-2019/Src/source at master · rakuseirobot/Aquila-2019 · GitHub ↑ ここの data_structure.hpp & …

2019-04-26

WRM007 Aquila アルゴリズム解説

RCJ レスキューMAZE アルゴリズム迷路

目次マッピング (改良)深さ優先探索(DFS) 細かい工夫と苦労した事アルゴリズムに触れる方法 ※ここからは、頂点の数はV,辺の数はEとする.(頂点=Vertex,辺=edge) また大会の終了後にソースコードを公開する予定にしている. マッピング 30cm*30cmのマスを1つ…

Emileの備忘録

色々な事をだらだらと

ブラックボックス(ベイズ)最適化とハイパラの自動調整

キャチロボ23まとめ(新規開発物とその知見など)

ompl+αでリアルタイム経路生成

STM32 Nucleo-F767ziでmicro-ROSを動かす(CubeMX+CMake)

エクストリーム帰寮参加記

個人向けタスク管理

計算量の話

FRITによるデータ駆動型制御器チューニング

MCMCの画像のノイズ除去への応用

Soft Actor-Critic(SAC)でdonkeycarのシミュを走らせてみる

A2Cの理論と実装

DDPGでPendulum-v0を解く

ベルマン作用素の基本と性質

MountainCar-v0をfixed target Q-networkを用いて解く

ベルマンフォード法について

【WRM007】Aquilaのソースコード

WRM007 Aquila アルゴリズム解説