G検定では是非、深層強化学習にはスゲー数のサンプルがいるから、モデル乗せてオンライン学習してればなんか良くなるは無謀ということを教えておいてください。 Tweet added by HELLO CYBERNETICS @ML_deep

HELLO CYBERNETICS

3 years

G検定では是非、深層強化学習にはスゲー数のサンプルがいるから、モデル乗せてオンライン学習してればなんか良くなるは無謀ということを教えておいてください。

1

9

73

HELLO CYBERNETICS

3 years

一方、（サンプルサイズが小さくても）そもそも我々はエージェントを育てられるような観測ができているか、あるいはエージェントの行動は環境の状態遷移をコントロールできそうか（実は何も作用できていないのではないか）の分析を開始することはできる。

1

10

HELLO CYBERNETICS

3 years

環境から十分な情報を得ているし、行動は環境の状態遷移を制御するに足るが、各時刻での行動の良い取らせ方が分からないという話となにか未知の環境から観測値が得られていて、その観測に応じて行動すれば、環境が上手く遷移するかもしれないには凄まじい壁がある。両極端だけど。

1

0

11

HELLO CYBERNETICS

3 years

この下の状態から上の状態への確信に近づくために、現状取れるデータに関して地道な分析を積み重ねて、不足している情報が何なのかを明らかにしていく試みがとても大事なのだけど、どうもそれがAIっぽくないと写る場合があるよう。（AIっぽくないならそれでも良い）

1

0

3

HELLO CYBERNETICS

3 years

ここ、地道にやっていったら実はif thenルールで終わるとか、環境の外の話がちょっと変わったら（変えたら）目的達成できた、も起こりうる。と思う。

1

0

3

Replies