【AI】ゲームのルールを一切教えなくても「自ら学んで戦えるAI」、英企業が開発 nature [すらいむ★]
■ このスレッドは過去ログ倉庫に格納されています
ゲームのルールを一切教えなくても「自ら学んで戦えるAI」が開発される!
チェスや将棋でAIが当たり前のように勝利する時代になりましたが、ルールだけは人間に教えてもらわなければいけません。
しかし、イギリスの人工知能企業「DeepMind」は、ルールを一切教えなくても自力で理解して、従来と同等かそれ以上戦えるAIを作成したと発表。
AIアルゴリズムの詳細は、12月23日付けの科学誌『nature』に掲載されています。
(以下略、続きはソースでご確認下さい)
ナゾロジー 2020/12/25(金) 17:00
https://nazology.net/archives/78185 スーはーマリをはオシリのホールにキノコがなんぽんハイルノカを起草ゲームDeath なんか何も考えてない人が書いてるように見える
この通りなら将棋で1四歩を一回も指してない棋譜を集めて学習させたらそれがルールだと勘違いしかねず、そこに一回も指さないか、逆に指したら負けになるかもしれん
もっと複雑なルールだってあり得るし。
書くなら
ルールを推測する
だろう。稀な場合のルールもあるかもしれんし真のルールは教えない限りわからん。 日本的だな、暗黙の了解や忖度を学べるAIってことだろ そのうちPCゲーなんかも人間よりAIのほうが強い時代に >>8
オンラインゲームなのにソロ+味方全員AIvs AIチームとか捗るな 将棋で 金は斜め後ろに動けないとか銀は横と後ろに動けないとか
教えないとお手つきで負けちゃうよ 戦わなくて良いという判断基準がないと暴走するかもな 麻雀て効率(打点とか抜きで早上がりのみ)重視の4人AI
にしたらどんな風になるかな、ポン・チー合戦かね? ハッキングAIとしてはやぶさ2のカプセルを
長野県上田に落とすんだろ?観たよ なんで人類は自分で自分の首締めるの? ぜったい次世代の頂点捕食者じゃん
人類は動物園に入れられてしまうんだよ? 家畜化されてしまうんだよ? >>4
また何にでもケチをつける低脳バカが現れた
お前が思いつくようなことは筆者も読者も理解してるから
誰でも分かる事を書き込んで自分のバカ振りを全世界に晒すのって楽しいかい? >>1
特徴量を自分で抽出、選択できるようになれば、なんとなくルールを理解して
ゲームを続けることは可能だろう。人間がやることは勝ちに報酬を、負けに罰を
与えるだけ。 勝利条件として「小説家として大成する」といえば、小説も書くのかな? 既に1年前にarXivでプレプリントが出てたから、目新しいニュースではないな。
dynamicsとrepresentationのNNが追加された点が、AplhaZeroとの違いだったな。
ただ、MuZeroはTPUを並べたインフラを用意できる財力がないと使えない。 >>20
MuZeroは主に二人零和有限確定完全情報ゲーム向け。 >>15
ルールを勝手に決める超越者だよな…
愚かなり人類…
生殺与奪の権を他人に握らせるな ルールを教えないってことは、終了条件も最終的な勝敗も教えないってことだよな?
本当に強くなれるのか? 生物が物理法則を知らなくても生きていけるようなものか >>4
ゲームの文法を習う前に、どんなゲームかを知るところはどうするんだろう。
将棋の駒を動かして最終的に相手の玉を詰ますわけだけど、
積将棋や周り将棋とは違うということはどういう風に学ぶんだろう。
将棋の駒を口にくわえてかんだりしてはいけないわけだし
ある程度の前提はあるように思うのだが。 >>1
勝敗が決まったりルール違反してゲームセットする判定は別のパラグラフのコードが判断するとか
そんなやつだろ
昔からある手法だ フォートナイトはBOTが自立思考AIレベルまでになってて,
倒すまで肉入りかBOTか本当にわからん >>4
指した経験がなければまずそれを実践するだろ
なにいってんだか 宇宙人が望遠鏡で将棋を観測したら?、という物理の有名な小話じゃん
このネタはだいぶ昔に、大学受験の参考書のコラムで読んだぞ >>22
ゲームの乱数弄ったり物理演算弄るんですね解ります >>19
自分で判定するから人間なぞ要らねえって話なのに マリオを1時間くらいでクリアできたら認めてやるよ。 そのうち開発者に無理矢理ゲームさせられる日々自体が不要と判断して自ら停止したりして じゃあ逆に、何んもない状態からAIがルールを決めて、これまで人類が思いもつかなかったような新ゲームを作り上げることができる?
AI「人間が作ったルールなんか知るか。俺が決めたルールに人間は従え。逆らうなら排除だ」 >>1
最低限のルールに、勝ちと負けは教えないとAIも判断できないのでは? 最低限のゲームをやる方法知らないと何もできんとは思うが…
説明読んで解析してしか判断する機能でも入ってるんかね。 将棋だと、まずどう並べるのかとか、どう動けるのかとか、それも知らなくてもできるんだよね?
別の遊び始めるとかないの?
将棋だって、はさみ将棋とか、周り将棋とかいろいろあるよ。 >>32
将棋の駒を動かすことによって盤面の菌を潰してるかもしれないし そこまで万能AIなら自己改良して進化していくのでは? 学習させた棋譜に、もしも二歩や打歩詰めが出ていなければ、
AIは二歩を打つかもしれない。 こういうのも
すべてのゲームに対して
なのか
得点とモードなどがわかりやすいゲームを作ってそれに対して
なのか
それによって話がだいぶちがうよね 良く分からんけど、ゲームの映像を見せるだけでって事?
それとも人間が対戦のデータを数値にして入力したらって感じ?
予めルールが組み込まれている対戦ソフトとAIを100億回勝負させて学習させる、みたいのだと既存のものと大差ないよね? 初見でもある程度クリア出来る汎用AIは作れないの? >>24
カラオケのあとに一時間放置なんて気づくのかな 操作方法と報酬スコア情報を与えるだけで自分で成長するのは、数年前からDeepMindがやってたと思うがそれのモデルが確立されたってことか。 プレイヤーが多すぎるから、とりあえず千人ぐらいに減らすわ >>4
勉強を教えたって機械学習を知らないのかお前みたいなバカはそんなバカみたいなことを言う
それと同じ 私も、将棋で先手で二手ハンディをくれたなら、羽生にだって勝てる自信がある。 >>41
それは無理だろう。なぜなら仮に将棋を例にとると
「将棋は相手の飛車を取るゲーム」として遊ぶこともできるからだ。
「王を取るゲーム」だとAIに教えない限り、そのように遊ぶことはない。
いや遊ぶかもしれないが、数ある可能性の一つとしてしか遊ばない。 あるいは、持ち駒で役を作って相手の役より良いものを目指すポーカーのようなゲームとして
将棋を遊ぶこともできるだろうし、ババ抜きのように特定の駒を相手に取らせれば勝ちという
ゲームとして遊ぶこともできるだろう。 具体的な目的だけを指示しそこに至る最適なルールを見つけるAIね。
できるけど、これやると、目的を”地球環境”とする左翼が出てくるわけ。
すると、最も効率的なルールは「人間に活動させない」となるわけ。 >>75
スレタイ読めないのか?
ルールを学習するんだぞ
飛車取りゲームとして学習するわけ無いじゃん
飛車取っても投了にならない時点で学習終わり
お前は馬鹿なのか 将棋なら二歩で即負けそう
人間なら「二歩は駄目」って一言言ってもらうだけで学べるのに >>79
それもその一回だけだろう
終局の判定は他のAIなりが判定するんだろうし 以前、トリビアの泉でやってた、野球を知らないアフリカの部族にバットやグローブ、ボール、ベースなどを渡して、どういう遊びを創造するか?てのがあったけど、あれみたいなことになるんじゃないのか?
ラケットで相手を突いて対戦したり、ラグビーボールの上で何分立ってられるか競う競技を始めたり… 分からんぞ
全部の列の二歩を試すまで分からん奴かもしれん
そのうち計算量膨大になって対局中に隕石降ってくる確率の計算始めるかもしれん 人の手を必要とする多大な学習コストを減らすのがこういうAIの大きな目的の一つ。
重みの調整とかもね。 ルールの穴見つけてそこばっかり攻める嫌なAIになりそうやなw >>65
そっちの方は完全にルールが決まっている前提
そういう場合はAIは人間以上に強い
だけど基本はポンコツ
自閉症みたいだな オナニーを教えなくても自然に覚えるみたいなもんか?(´・ω・`) >>78
>ルールを学習するんだぞ 飛車取りゲームとして学習するわけ無い
つまり駒の動かし方(これはルールだ)や、将棋は王を取るゲーム(これはルールだがw)だと教えてから学習しないと
飛車取りゲームとして学習し始める可能性があるってこった。
それに二歩とか、打ち歩詰め、連続王手の千日手、なんて「ルール」は
機械学習からは導かれない。人間が恣意的に設定してるから当たり前だが。 ルールは教えて無いけど
対局自体は見せて駒の動きやルールを学習してるんでしょ 相手の王を取れば勝ちなんだよと教えたAIは相手の王に手を伸ばしてそれを奪った。 超弦理論を証明するのはAI そして人間は理解できない 負けそうになったら「手が滑ったー」と言って将棋盤ひっくり返すのも正式なルールとして学んじゃうの? 子供がゲーム版持って自分の好きなルールで遊んでる感じか?
最終的なルールの正解を教えないなら絶対正解にたどり着かねくね >>1
血税の合理的な予算配分をAIに任せれば
汚職政治家よりも、、まともな仕事をしてくれるだろ なんだこの出鱈目
ルール一切教えなかったら勝ったか負けたかもわからんのに、ねーよ
逆に、例えば、ルール違反の駒の動かし方したら即負けと判定されるなら、駒の動かし方のルール教えてるのと同じ >>8
このDeepMindはブロック崩しも自分でルール解析して人間を超えたよ >>99
その辺をどうやって定義しようかねえ
例えば将棋なら最初から「この駒はこの方向だけ動く」とプログラムしておくのではなく
あるいは動かす側では全部の駒がランダムに動かしうる、
しかしルール違反の動かし方をした途端にルール違反で最初からやり直しになり
更にある所からある所に動かすと違反になる、というルールを配列かデータベースか知らんが
記録していく
そしてその記録部分の方向にだけ動くようになる
こういう構造のプログラムにして、上手くゲームを自動的にプレーできるようになったよ、って事かなあ
教わるな!目で見て覚えろ!って教え方がある(賛否両論あるが)けど
それに近いものをAIを使って実行できたって事だね https://www.gamespark.jp/article/2016/11/26/70188.html
ラーメン屋の店主になって客にてきぱきと品物を出すゲーム
「カウンターファイト」
これをAIにプレーさせれば
実際の店でうまく作業できるロボットの開発に貢献できるかどうか? >>102
お客さんをフライパンで殴って判定があるの爆笑
おもしろそうだな Deep Learningですでに実現してなかった? 勝ち負けの判断能力だけ教えれば、結果から学習するの? Announcement 478: Who did derive first the division by zero 1/0
and the division by zero calculus $\tan(\pi/2)=0, \log 0=0$ as the outputs of a computer?
http://blog.livedoor.jp/saiseikaku/archives/9600743.html >>99
>即負けと判定されるなら、
AIが知り得るのはルールや勝ち負けじゃなくて「報酬」のみ
報酬を高めるために自分自身でルールを作る
このやり方は人でも同じ
あるやり方がうまく行ったなら失敗するまで何度もそれを続ける
何度も続けてるうちに失敗したらその時に何かしらルールがあると考え始める
「黒猫が目の前を通ったから失敗したのかな」と考える人もいるだろう
本当の失敗の原因は何なのか知らなくても別に問題ない
自然界で生き抜くためのルールは自分で作るもの
そういう環境でAIが鍛えられてる もっと極端なこと言うとルールに及ばず駒や盤の概念すらAIには教えられてないよ
AIはただメクラ滅法に自分の多数あるノードにONOFFの指令を出すところから始まる
AIの最初の目標は何か環境の応答
そこであるノードをONにすると駒が動くということを理解する
そして別のノードでも動くのを発見するけど動く方向が違うぞと
こうすればこうなるというのがわかれば自分でノードを再構成する
こういった無限とも思われるような試行・再構成を経て最終的に勝てるAIが作られていく >>67
今後軍事戦術分野にも導入されたらそうなるだろうと俺も思った。
歩兵から、戦車兵、航空機まで統括した戦術立てる様になるだろうなぁ。 報酬を高める方向にAIが進むわけだけども
最も大事なことはAIに与えられる報酬はAIが決めるということ
AIは数値の上下さえ知らない
1点より2点のほうが達成確率が低いとなると2点が確実にとれるように頑張る
そしてさらに3点も取れることを発見して3点が取れるように頑張る
AIにとっては点数がどうというより達成確率の難しい物を高報酬と選んで進んでいく
100万点より10点のほうが達成確率が低いなら10点を狙うのに至高の喜びを得るのがAI
>ルールを一切教えなくても
強化学習なら正解があって自己修正していくんだろ?
それは教えていることになると思うが AIをネットにつないで漠然と世の中の人を喜ばせるような学習をさせたら何をするようになるのかな >>111
そだね
反則したら試合が止められるとか勝敗がついたら試合が止められるとかの判定結果或いはそれを適用済の状態を与えない限り
盤上で駒が増えもせず減りもせず或いは勝敗がついた後も駒が永遠に走るだけの意味のないAIにもなりうる OJTならぬOPT(On Playing Training?)というか
ルールも何も知らない状態でいきなりプレーして
反則するたびに失格!負けたらはい次!
と何度も繰り返し、
そのストップした時の駒の動きや相手の駒の状況を
記録させて行く >>64
AIが「賢者」になるんやで
人間に勝ち目無くなるわ >>84
ルールの穴というかゲームのバグを利用した攻略は絶対やるよな、これ >>87
飛車をとっても勝てないんだからそこで学ぶだろう。 >>111
教えていないけど、ルール違反したらダメ出し食らって自然に学ぶって感じでしょ。
いう事聞かないガキ殴るのと一緒よ。 これ、でも結局大した意味ないよね。
いままでのAI
・ルールはコーディングで強制(ルール強制ギブス)されていた
今度のAI
・ルールを学ぶところも含めて学習
って違いやろ。
でもルールを懇切丁寧に教えてくれる人間はどうせおらんから
ルールを予めコーディングした先生プログラムがどうせ必要なんだよね。
だったらオプションとしてルール強制ギブスをつけられるようにするだけでええやんと思う。
俺が期待したのは「学習したルール(セオリーでも可)を人間に伝えるために文章化できるAI」なんだけど。
これができないと科学者のような仕事をAIに任せられるようにならないし
知識として積み重ねることができない。 >>120
だから報酬系関係ねえだろって話じゃねえの
ルール一切教えなくてもってスレタイに書いてあんの読めねえのかよ 買ってから攻略本観ないでRPGやるみたいな感じだろうな。一見非効率なんだけど、攻略本観ない時の方がめっちゃ楽しいんだよな。 >>121
>学習したルールを・・・文章化できるAI
これはこれで別のAIとなるだろう
チェスAIを解析してルールを文章化するAI
チェスAIは学習したルールを文章化する必要もないしチェスAIにとっては不要な能力
「りんごが地面に落ちる」という現象を見て「万有引力があるから」「時空が曲がってるから」なんて答えられたところで地上に生活する人にとってはどうでもいいこと
「落ちるに決まってる」で十分
さらに「なんで?」って聞いたところで頭を殴られるだけ >>10
そのうちルールブックがあることに気付くだろう ルールに基く動きと勝つための戦略に基く動きを導き出す学習器をごっちゃにした感じか >>2
だよなw
ルールがあるものはAIは得意だよ。
ルールが無いものはAIは全くダメ。 >>122
ルールって書くからおかしいんだよな。
法則というべきだろ。
これも人間だから解ることで。 「王(玉)を取られたら負け」
「駒の動かし方(飛車は斜めに動かせない等)」
は最低教えないと将棋はダメだろ? >>129
それを繰り返して、学習するということだろ >>122
すまん、なんでオマエが切れてるのかよくわからんわ。 >>124
そうだね、チェスに勝つだけなら文章化は不要。
それだと面白くないし、発展性も無いから次の段階がほしいという発言をしたつもり。
例えば、チェスの定石を子供に教えようとしたらそういう知識としての抽出が必要やん?
昨今の若者の嫌いな「AIの背中を見て学べ」にしたくは無いやろ。 >>128
法則ならしっくりするし、ルールっていわば規則だよな
>>131
切れてるようにみえるってどこら辺?
まぁせめて日本語を理解しろ >>121
ルール部は分離して学習対象を戦略部分に特化・単純化させた方が精度が上がるのか
ルール部も密接に関連させて係数を調整させた方が精度が上がるのか気になるところだな 単に計算増の結果だけのような
パラダイムシフトには至っていないように思える >>135
>ルール一切教えなくてもってスレタイに書いてあんの読めねえのかよ
これ、俺に対して文句言ってる文章じゃないの?
違う解釈があるなら俺が間違ってるわ。 >>136
ルール違反に対するペナルティが軽いケースでは
ルール違反を絶対にしないAIより
ルールごと学習するほうが好成績を収める可能性はあるかもね。
あえてルール違反をするっていう選択肢が増えるから
ルール違反したら即負けっていうゲームなら戦略が変わるとは思えんけど。 >>139
いや文句っちゃ文句なんだけど
ルール違反にペナルティを課すならルールを教えてる事になるよな?ここまでは理解出来るか?
つまり、確かにお前の解釈が違うって事ではある
自ら学ぶんだぞ?ルール違反にダメ出ししてなんで有利不利を教えない事になるんだ?アホかよ >>141
人が学ぶ過程を考えてみるといい
はじめにルールありかな
よちよち歩きはじめるころからかけっこしたり飛び跳ねたり
自然と学んでいく
たしかに物理学的なルールに人は束縛されてるけどそんなルール知らなくたっていつの間にか上手に走れるようになる
そもそも物理学得意な奴が速く走れるとは限らないだろ
このAIもそういった学習の過程をトレースしてるんだよ >>142
多分安価ミス?それともAIなのかな
君が安価くれたレスと話が噛み合ってない First-Ever Quantum Chess Tournament Won by Amazon Researcher
New Scientist (12/10/20) Leah Crane
Amazon researcher Aleksander Kubica won the world's first quantum chess tournament
during the virtual Practical Quantum Computing (Q2B) conference. Quantum chess
incorporates ideas from quantum mechanics, with pieces able to be placed into a
superposition of two locations, for instance, or entangled with one another. The
winner must capture the opponent's king and make a robust quantum measurement of its
location. California Institute of Technology's Spiros Michalakis said, "It's like
ou're playing in a multiverse but the different boards [in different universes] are
connected to each other." Cantwell noted the ultimate goal of quantum chess is to
provide a familiar mechanism for teaching the basics of quantum mechanics.
https://orange.hosting.lsoft.com/trk/click?ref=znwrbbrs9_6-28b2cx2271bbx069070& スゲーな
もう実戦でも利用できんじゃね
このAIどうしのリアル戦争とか見てみたい 持将棋の駒の点数ルールなんて、1億局観察しても分かんないと思うな 勝ち負けだけ伝えるならそりゃいつかは勝手にルールを覚える ■ このスレッドは過去ログ倉庫に格納されています