【AI】ゲームのルールを一切教えなくても「自ら学んで戦えるAI」、英企業が開発 nature [すらいむ★]

■ このスレッドは過去ログ倉庫に格納されています
0001すらいむ ★2020/12/27(日) 16:32:40.96ID:CAP_USER
ゲームのルールを一切教えなくても「自ら学んで戦えるAI」が開発される!

 チェスや将棋でAIが当たり前のように勝利する時代になりましたが、ルールだけは人間に教えてもらわなければいけません。

 しかし、イギリスの人工知能企業「DeepMind」は、ルールを一切教えなくても自力で理解して、従来と同等かそれ以上戦えるAIを作成したと発表。

 AIアルゴリズムの詳細は、12月23日付けの科学誌『nature』に掲載されています。

(以下略、続きはソースでご確認下さい)

ナゾロジー 2020/12/25(金) 17:00
https://nazology.net/archives/78185

0099名無しのひみつ2020/12/29(火) 12:16:33.08ID:XaVtcveQ
なんだこの出鱈目

ルール一切教えなかったら勝ったか負けたかもわからんのに、ねーよ

逆に、例えば、ルール違反の駒の動かし方したら即負けと判定されるなら、駒の動かし方のルール教えてるのと同じ

0100名無しのひみつ2020/12/29(火) 12:19:59.30ID:+u8plbL4
>>8
このDeepMindはブロック崩しも自分でルール解析して人間を超えたよ

0101名無しのひみつ2020/12/29(火) 12:23:47.08ID:3laBHCNC
>>99
その辺をどうやって定義しようかねえ

例えば将棋なら最初から「この駒はこの方向だけ動く」とプログラムしておくのではなく
あるいは動かす側では全部の駒がランダムに動かしうる、
しかしルール違反の動かし方をした途端にルール違反で最初からやり直しになり
更にある所からある所に動かすと違反になる、というルールを配列かデータベースか知らんが
記録していく
そしてその記録部分の方向にだけ動くようになる

こういう構造のプログラムにして、上手くゲームを自動的にプレーできるようになったよ、って事かなあ

教わるな!目で見て覚えろ!って教え方がある(賛否両論あるが)けど
それに近いものをAIを使って実行できたって事だね

0102名無しのひみつ2020/12/29(火) 12:37:14.62ID:3laBHCNC
https://www.gamespark.jp/article/2016/11/26/70188.html

ラーメン屋の店主になって客にてきぱきと品物を出すゲーム
「カウンターファイト」

これをAIにプレーさせれば
実際の店でうまく作業できるロボットの開発に貢献できるかどうか?

0103名無しのひみつ2020/12/29(火) 12:46:37.86ID:HRTDgWgd
>>102
お客さんをフライパンで殴って判定があるの爆笑
おもしろそうだな

0104名無しのひみつ2020/12/29(火) 12:49:15.51ID:QH8vbExr
Deep Learningですでに実現してなかった?

0105名無しのひみつ2020/12/29(火) 12:50:01.18ID:d261AAaB
勝ち負けの判断能力だけ教えれば、結果から学習するの?

0106よっちゃん2020/12/29(火) 13:01:33.83ID:JaMe1uh9
Announcement 478: Who did derive first the division by zero 1/0
and the division by zero calculus $\tan(\pi/2)=0, \log 0=0$ as the outputs of a computer?

http://blog.livedoor.jp/saiseikaku/archives/9600743.html

0107名無しのひみつ2020/12/29(火) 13:07:26.20ID:+u8plbL4
>>99
>即負けと判定されるなら、

AIが知り得るのはルールや勝ち負けじゃなくて「報酬」のみ
報酬を高めるために自分自身でルールを作る

このやり方は人でも同じ
あるやり方がうまく行ったなら失敗するまで何度もそれを続ける
何度も続けてるうちに失敗したらその時に何かしらルールがあると考え始める
「黒猫が目の前を通ったから失敗したのかな」と考える人もいるだろう
本当の失敗の原因は何なのか知らなくても別に問題ない
自然界で生き抜くためのルールは自分で作るもの

そういう環境でAIが鍛えられてる

0108名無しのひみつ2020/12/29(火) 13:34:39.57ID:+u8plbL4
もっと極端なこと言うとルールに及ばず駒や盤の概念すらAIには教えられてないよ

AIはただメクラ滅法に自分の多数あるノードにONOFFの指令を出すところから始まる
AIの最初の目標は何か環境の応答
そこであるノードをONにすると駒が動くということを理解する
そして別のノードでも動くのを発見するけど動く方向が違うぞと
こうすればこうなるというのがわかれば自分でノードを再構成する
こういった無限とも思われるような試行・再構成を経て最終的に勝てるAIが作られていく

0109名無しのひみつ2020/12/29(火) 13:42:24.02ID:PKkUMqfB
>>67
今後軍事戦術分野にも導入されたらそうなるだろうと俺も思った。
歩兵から、戦車兵、航空機まで統括した戦術立てる様になるだろうなぁ。

0110名無しのひみつ2020/12/29(火) 13:54:47.76ID:+u8plbL4
報酬を高める方向にAIが進むわけだけども
最も大事なことはAIに与えられる報酬はAIが決めるということ

AIは数値の上下さえ知らない
1点より2点のほうが達成確率が低いとなると2点が確実にとれるように頑張る
そしてさらに3点も取れることを発見して3点が取れるように頑張る
AIにとっては点数がどうというより達成確率の難しい物を高報酬と選んで進んでいく
100万点より10点のほうが達成確率が低いなら10点を狙うのに至高の喜びを得るのがAI

0111名無しのひみつ2020/12/29(火) 14:10:32.40ID:NIcyiDCc
 
>ルールを一切教えなくても

強化学習なら正解があって自己修正していくんだろ?
それは教えていることになると思うが

0112名無しのひみつ2020/12/29(火) 15:56:45.60ID:Y+UmLwVA
AIをネットにつないで漠然と世の中の人を喜ばせるような学習をさせたら何をするようになるのかな

0113名無しのひみつ2020/12/29(火) 16:08:52.02ID:Y+UmLwVA
>>111
そだね
反則したら試合が止められるとか勝敗がついたら試合が止められるとかの判定結果或いはそれを適用済の状態を与えない限り
盤上で駒が増えもせず減りもせず或いは勝敗がついた後も駒が永遠に走るだけの意味のないAIにもなりうる

0114名無しのひみつ2020/12/29(火) 16:32:06.97ID:U5Vnpjgi
上上下下左右左右BA

0115名無しのひみつ2020/12/29(火) 16:54:35.07ID:VTqWjqNu
がんばれ森川くん3号位なのかな

0116名無しのひみつ2020/12/29(火) 20:11:29.01ID:3laBHCNC
OJTならぬOPT(On Playing Training?)というか
ルールも何も知らない状態でいきなりプレーして
反則するたびに失格!負けたらはい次!
と何度も繰り返し、
そのストップした時の駒の動きや相手の駒の状況を
記録させて行く

0117名無しのひみつ2020/12/29(火) 20:59:35.57ID:eds2+ozg
>>64
AIが「賢者」になるんやで
人間に勝ち目無くなるわ

0118名無しのひみつ2020/12/29(火) 21:01:53.99ID:eds2+ozg
>>84
ルールの穴というかゲームのバグを利用した攻略は絶対やるよな、これ

0119名無しのひみつ2020/12/29(火) 21:03:03.56ID:eds2+ozg
>>87
飛車をとっても勝てないんだからそこで学ぶだろう。

0120名無しのひみつ2020/12/29(火) 21:05:48.95ID:eds2+ozg
>>111
教えていないけど、ルール違反したらダメ出し食らって自然に学ぶって感じでしょ。
いう事聞かないガキ殴るのと一緒よ。

0121名無しのひみつ2020/12/29(火) 21:31:45.41ID:eds2+ozg
これ、でも結局大した意味ないよね。
いままでのAI
・ルールはコーディングで強制(ルール強制ギブス)されていた
今度のAI
・ルールを学ぶところも含めて学習
って違いやろ。
でもルールを懇切丁寧に教えてくれる人間はどうせおらんから
ルールを予めコーディングした先生プログラムがどうせ必要なんだよね。
だったらオプションとしてルール強制ギブスをつけられるようにするだけでええやんと思う。

俺が期待したのは「学習したルール(セオリーでも可)を人間に伝えるために文章化できるAI」なんだけど。
これができないと科学者のような仕事をAIに任せられるようにならないし
知識として積み重ねることができない。

0122名無しのひみつ2020/12/29(火) 22:06:52.52ID:VTqWjqNu
>>120
だから報酬系関係ねえだろって話じゃねえの
ルール一切教えなくてもってスレタイに書いてあんの読めねえのかよ

0123名無しのひみつ2020/12/30(水) 05:22:43.14ID:XxP+T7v1
買ってから攻略本観ないでRPGやるみたいな感じだろうな。一見非効率なんだけど、攻略本観ない時の方がめっちゃ楽しいんだよな。

0124名無しのひみつ2020/12/30(水) 08:33:38.16ID:Ym0ALknO
>>121
>学習したルールを・・・文章化できるAI

これはこれで別のAIとなるだろう
チェスAIを解析してルールを文章化するAI
チェスAIは学習したルールを文章化する必要もないしチェスAIにとっては不要な能力

「りんごが地面に落ちる」という現象を見て「万有引力があるから」「時空が曲がってるから」なんて答えられたところで地上に生活する人にとってはどうでもいいこと
「落ちるに決まってる」で十分
さらに「なんで?」って聞いたところで頭を殴られるだけ

0125名無しのひみつ2020/12/30(水) 08:38:21.67ID:QpE+/BYf
>>10
そのうちルールブックがあることに気付くだろう

0126名無しのひみつ2020/12/30(水) 08:58:13.21ID:AcTs3/1Y
ルールに基く動きと勝つための戦略に基く動きを導き出す学習器をごっちゃにした感じか

0127名無しのひみつ2020/12/30(水) 09:05:27.16ID:PJwmguOF
>>2
だよなw
ルールがあるものはAIは得意だよ。
ルールが無いものはAIは全くダメ。

0128名無しのひみつ2020/12/30(水) 09:07:45.28ID:PJwmguOF
>>122
ルールって書くからおかしいんだよな。
法則というべきだろ。
これも人間だから解ることで。

0129名無しのひみつ2020/12/30(水) 09:18:18.50ID:F6jCSB6b
「王(玉)を取られたら負け」
「駒の動かし方(飛車は斜めに動かせない等)」

は最低教えないと将棋はダメだろ?

0130名無しのひみつ2020/12/30(水) 11:58:05.13ID:nKCdfkzA
>>129
それを繰り返して、学習するということだろ

0131名無しのひみつ2020/12/30(水) 12:02:16.38ID:snGgE8ns
>>122
すまん、なんでオマエが切れてるのかよくわからんわ。

0132名無しのひみつ2020/12/30(水) 12:07:42.90ID:snGgE8ns
>>124
そうだね、チェスに勝つだけなら文章化は不要。

それだと面白くないし、発展性も無いから次の段階がほしいという発言をしたつもり。
例えば、チェスの定石を子供に教えようとしたらそういう知識としての抽出が必要やん?

昨今の若者の嫌いな「AIの背中を見て学べ」にしたくは無いやろ。

0133名無しのひみつ2020/12/30(水) 12:23:57.34ID:snGgE8ns
>>126
ひとことでいうとこれだよね。

0134名無しのひみつ2020/12/30(水) 13:09:40.58ID:Fz241H5v
AI「俺がルールだ!」

0135名無しのひみつ2020/12/30(水) 16:37:15.94ID:fISngFeI
>>128
法則ならしっくりするし、ルールっていわば規則だよな
>>131
切れてるようにみえるってどこら辺?
まぁせめて日本語を理解しろ

0136名無しのひみつ2020/12/30(水) 23:52:22.87ID:AcTs3/1Y
>>121
ルール部は分離して学習対象を戦略部分に特化・単純化させた方が精度が上がるのか
ルール部も密接に関連させて係数を調整させた方が精度が上がるのか気になるところだな

0137名無しのひみつ2020/12/31(木) 08:14:50.21ID:3SVi5kc/
>>136
https://nazology.net/wp-content/uploads/2020/12/0d40a5e4a645fc6b96e767d64ac0878e.png

このグラフからだとチェスや将棋の到達地点は従来AIと変わらない
囲碁だとMuZeroが追い越す
ルールは単純だけど奥深いってのが戦略重視型有利に働くんだろうな

0138名無しのひみつ2020/12/31(木) 09:18:31.34ID:7xdxq9+2
単に計算増の結果だけのような
パラダイムシフトには至っていないように思える

0139名無しのひみつ2020/12/31(木) 22:00:32.45ID:kMDAkzkp
>>135
>ルール一切教えなくてもってスレタイに書いてあんの読めねえのかよ
これ、俺に対して文句言ってる文章じゃないの?
違う解釈があるなら俺が間違ってるわ。

0140名無しのひみつ2020/12/31(木) 22:04:06.44ID:kMDAkzkp
>>136
ルール違反に対するペナルティが軽いケースでは
ルール違反を絶対にしないAIより
ルールごと学習するほうが好成績を収める可能性はあるかもね。
あえてルール違反をするっていう選択肢が増えるから

ルール違反したら即負けっていうゲームなら戦略が変わるとは思えんけど。

0141名無しのひみつ2020/12/31(木) 22:22:44.31ID:+3nvPrHc
>>139
いや文句っちゃ文句なんだけど
ルール違反にペナルティを課すならルールを教えてる事になるよな?ここまでは理解出来るか?
つまり、確かにお前の解釈が違うって事ではある
自ら学ぶんだぞ?ルール違反にダメ出ししてなんで有利不利を教えない事になるんだ?アホかよ

0142名無しのひみつ2020/12/31(木) 22:42:11.28ID:3SVi5kc/
>>141
人が学ぶ過程を考えてみるといい
はじめにルールありかな

よちよち歩きはじめるころからかけっこしたり飛び跳ねたり
自然と学んでいく
たしかに物理学的なルールに人は束縛されてるけどそんなルール知らなくたっていつの間にか上手に走れるようになる
そもそも物理学得意な奴が速く走れるとは限らないだろ

このAIもそういった学習の過程をトレースしてるんだよ

0143名無しのひみつ2020/12/31(木) 23:17:08.11ID:+3nvPrHc
>>142
多分安価ミス?それともAIなのかな
君が安価くれたレスと話が噛み合ってない

0144名無しのひみつ2021/01/01(金) 01:26:58.94ID:OuB9C0oF
やりますね

0145名無しのひみつ2021/01/01(金) 02:08:47.79ID:iT7wNxCy
First-Ever Quantum Chess Tournament Won by Amazon Researcher
New Scientist (12/10/20) Leah Crane

Amazon researcher Aleksander Kubica won the world's first quantum chess tournament
during the virtual Practical Quantum Computing (Q2B) conference. Quantum chess
incorporates ideas from quantum mechanics, with pieces able to be placed into a
superposition of two locations, for instance, or entangled with one another. The
winner must capture the opponent's king and make a robust quantum measurement of its
location. California Institute of Technology's Spiros Michalakis said, "It's like
ou're playing in a multiverse but the different boards [in different universes] are
connected to each other." Cantwell noted the ultimate goal of quantum chess is to
provide a familiar mechanism for teaching the basics of quantum mechanics.

https://orange.hosting.lsoft.com/trk/click?ref=znwrbbrs9_6-28b2cx2271bbx069070&;

0146名無しのひみつ2021/01/01(金) 02:36:16.88ID:1uhzy4oF
スゲーな
もう実戦でも利用できんじゃね
このAIどうしのリアル戦争とか見てみたい

0147名無しのひみつ2021/01/01(金) 03:47:49.80ID:iL118sBr
持将棋の駒の点数ルールなんて、1億局観察しても分かんないと思うな

0148名無しのひみつ2021/01/01(金) 06:18:37.76ID:TRHBtiU3
1億はスパコンには小さすぎる数

0149名無しのひみつ2021/01/01(金) 11:31:53.69ID:uDq2/Tif
勝ち負けだけ伝えるならそりゃいつかは勝手にルールを覚える

■ このスレッドは過去ログ倉庫に格納されています