@ML_deep
HELLO CYBERNETICS
3 years
G検定では是非、深層強化学習にはスゲー数のサンプルがいるから、モデル乗せてオンライン学習してればなんか良くなる は無謀ということを教えておいてください。
1
9
73

Replies

@ML_deep
HELLO CYBERNETICS
3 years
一方、(サンプルサイズが小さくても)そもそも我々はエージェントを育てられるような観測ができているか、あるいはエージェントの行動は環境の状態遷移をコントロールできそうか(実は何も作用できていないのではないか)の分析を開始することはできる。
1
1
10
@ML_deep
HELLO CYBERNETICS
3 years
環境から十分な情報を得ているし、行動は環境の状態遷移を制御するに足るが、各時刻での行動の良い取らせ方が分からない という話と なにか未知の環境から観測値が得られていて、その観測に応じて行動すれば、環境が上手く遷移するかもしれない には凄まじい壁がある。両極端だけど。
1
0
11
@ML_deep
HELLO CYBERNETICS
3 years
この下の状態から上の状態への確信に近づくために、現状取れるデータに関して地道な分析を積み重ねて、不足している情報が何なのかを明らかにしていく試み がとても大事なのだけど、どうもそれがAIっぽくないと写る場合があるよう。(AIっぽくないならそれでも良い)
1
0
3
@ML_deep
HELLO CYBERNETICS
3 years
ここ、地道にやっていったら実はif thenルールで終わるとか、環境の外の話がちょっと変わったら(変えたら)目的達成できた、も起こりうる。 と思う。
1
0
3