囲碁王者を倒したAlphaGoをゼロから始めて30時間で打ち負かす「AlphaZero」、将棋・チェスの最強ソフトもサクッと制圧[12/07]
■ このスレッドは過去ログ倉庫に格納されています
囲碁の世界チャンピオンを打ち負かしたソフト「AlphaGo」が正常進化して、「AlphaZero」が誕生しました。人間による手助けを一切必要としないAlphaZeroは、ルールしか知らない状態から自己教育することで、たった30時間でAlphaGoを完膚なきまでに打ち負かす強さに成長可能。囲碁だけでなく、数十時間の独学でチェス・将棋でも、既存の最強ソフトを圧倒する強さへと進化できます。
AlphaZero: Shedding new light on the grand games of chess, shogi and Go | DeepMind
https://deepmind.com/blog/alphazero-shedding-new-light-grand-games-chess-shogi-and-go/
囲碁チャンピオンを打ち負かしたソフト「AlphaGo」は、自分で自分を鍛えられる「AlphaGo Zero」へと進化しました。自分と戦いつつ実力をメキメキ向上させられるため、自己学習可能なAlphaGo Zeroでは人間の関与が不要になりました。
囲碁に特化していたAlphaGo Zeroは、あらゆるボードゲームに対応できる汎用性を持つ「AlphaZero」へと進化しました。
そして、DeepMindによって2018年12月7日にScienceで発表された論文では、AlphaZeroが、チェス・将棋・囲碁の3つの代表的なボードゲームにおいて、これまでに開発された最強のソフトウェアを数日で打ち負かす能力に成長できることが明らかにされました。
A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play | Science
http://science.sciencemag.org/content/362/6419/1140
https://i.gzn.jp/img/2017/10/20/alphago-zero/00.jpg
2016年に開催されたチェスプログラムの世界大会TCECシーズン9を制した「Stockfish」とのイロレーティングの比較。AlphZeroは自己学習開始から4時間でStockfishを上回りました。
https://i.gzn.jp/img/2018/12/07/alphazero/a02_m.png
将棋のチャンピオンソフト「elmo」との対決では、2時間後にはAlphaZeroが上回ったとのこと。
https://i.gzn.jp/img/2018/12/07/alphazero/a01_m.png
囲碁チャンピオンのイ・セドルに勝ったときのAlphaGoを、たった30時間で超えました。
https://i.gzn.jp/img/2018/12/07/alphazero/a03_m.png
強化学習で自分を鍛えるAlphaZeroは、試行錯誤のプロセスを通じて成長します。ニューラルネットワークが必要とするトレーニング時間はゲームによって変わり、チェスでは約9時間、将棋では約12時間、囲碁では13日間必要だとのこと。
トレーニングされたネットワークは、モンテカルロ木探索(MCTS)と呼ばれる検索アルゴリズムで最も有望な「手」を選びます。AlphaZeroでは従来のエンジンに比べて考慮する検索数が圧倒的に少ないとのこと。例えば、チェスのStockfishが1秒間に6000万ポジション検索するのに対して、AlphaZeroは6万ポジションしか検索しないとのこと。伝統的なAIエンジンでは計算可能な解決法がない場面に直面すると迷いが生じるのに対して、AlphaGoではこの欠点がなく、「直感」が要求されるような場面で無類の強さを発揮します。
https://i.gzn.jp/img/2018/12/07/alphazero/b01_m.png
従来型のAIエンジンと異なるAlphaZeroは、その強さだけでなく繰り出す「手」の独創性も際立っているとのこと。生身の人間ではもはや歯が立たないレベルに達したAlphaZeroを相手にすることで、これまでプロプレイヤーが考えもしなかった新鮮な局面が現れるため、人間のプレイヤーの世界を広げる役目を果たしているとDeepMindは述べています。
人気の3つのボードゲームを完全制覇してその汎用性を示したAlphaZeroですが、今後は製薬、材料設計、バイオテクノロジーなどの科学技術を中心とした、世界的な課題の解決を目指す壮大な"ゲーム"を攻略するために、研究・開発される予定です。
AlphaZero: Shedding new light on the grand games of chess, shogi and Go https://youtu.be/7L2sUGcOgh0
GIGAZINE
https://gigazine.net/news/20181207-alphazero/ すげーなあ
なんかニコニコ動画の会社がAlpha碁と対戦させたいってAI開発計画発表してたけど
既にAlpha倒されてんじゃん、それも圧差で
最初からなかったことにされるんだろなあw >>68
いや、王が居なくなったら新し王を立てるのが現実世界だろ
それと同じで王を取られたら金を裏返して新しい王にするとかすればいい
王のなりてが無くなったら負け 政治家も疑問だが医者においては使う人の問題と言うか所詮は自由主義経済の一つであり
人間の医者とAI医者の混在があるならどっちを選ぶかは個人の自由であるならば
結局は自己責任でしかない。仮にAI医者が問題を起こしたとしても改良はあっても、それで
とたんに全面禁止にまでなるとは考えにくい。またそれが普通になり、慣れてくると機械なら許せない
などと言う感覚はいずれ無くなる可能性も高い。最終的にはAIと人間とでどちらが優秀でかつコスト安か、
で決まるようになり、もしAIのが良ければそっちに淘汰されると思うね、半世紀以上かかるだろうが 例えばおおむね半分の人がAI医者を使い、残りの半分が信用ならないと使わないとして、
それがAI医者のトラブルや改良に信用度アップで暫くは上下するだろうが、30年たっても50年たっても
同じ半分前後の比率にとどまるとは考えにくい。いずれはどっちかによっていき、最終的には
どちらかが消えるか、或いは一部の領域で細々と残るだけになると思う
で、どっちが残るかと言えばさ。大きな改良、発展の可能性があるのは言うまでもないわけで。 試行錯誤と反省を繰り返せば人間も賢くなれるのにね、反省しないからな、あまり。
人間の何千倍か何万倍か知らないがそういう速度で試行錯誤と反省を繰り返されたら人間は絶対にかなわないね。 かつてホンダや日産がレース予算をやたらかけまくり他チームを圧倒しすぎてレースそのものがつまらなくなった時期があったけどこれもそんな感じかね 人より碁は強いのに人と話せるコンピュータは作れない
不思議 >>88
まじだよ。最初のアルファ碁はプロ棋士の棋譜を画像として扱ったとNHKでは言ってたな。
専門的にどこまで正確かは分からなかったが >>106
勝ち負けの定義がはっきりすれば作れるんだけどねー。
Microsoftの女子高生AIリンネとLineしたことない? >世界的な課題の解決を目指す壮大な"ゲーム"を攻略する
どうすれば結婚できるのか、どうすれば童貞を卒業できるのか教えて欲しい。 そのうち絶対にディベートに負けないAIとか作られそうw 1〜2年前にも、ほぼ同じ内容のニュースがあって、論文を近日発表と言ったまま
放置されているんだけど。
まさかGoogleは痴ほう症になったのか? チョッパリのチャンギは奥が浅いからな
韓国のチャンギは複雑すぎていまだにAIが勝てない >>112
話の上手さが採点できれば良いんだけどねー。
って意味よ。囲碁将棋に引っ張られただけっす >>97
おまえチョイ見間違いしているけど
負けたのは、アルファ碁ではなくアルファ碁ゼロだからな
で、新登場したのはアルファ碁ゼロを簡単に負かすアルファゼロだぞ
ルールさえインプットすればどんなゲーム名人も倒せる汎用AIな
将棋もチェスも敵わん
Youtubeで棋譜見たらわかるけど大きく間違える事が一度もなく、
細かい指し手を200手近く続けられる凄まじいタフさ >>111
出来るだろうなw
弁護士上がったりやw
未来のシンギュラリティは俺達の想像を絶するスピードでやって来る >>118
人間にとって二百手はかなりタフだが、
あいつらにとってはどうでもいいことだからな
まあ、電力消費は凄そうだけど。
それにしても論文出るのかな。
ちょっとにわかには信じ難いんだけど で、何の役に立つと?
必勝法解析出来たら囲碁将棋誰もやらなくなるだろ
圧倒的に強いのだろうから対戦者もいなくなる無用の長物でしかないやり過ぎ感 >>121
いや、コンピュータAIで新手を見つけて、それを対人相手に使うという
チート作戦が流行る
それが、今の将棋界な
羽生が弱くなったのは、ソフト研究して今まで誰も知らなかった
ソフト指手を新人が使い始めたから >>121
何でGoogleが囲碁に取り組んだかというと
戦略的なゲームで囲碁ができたら
経営戦略をたてれるといわれてたから。
で今回ので、ルールさえインプットすれば
良い手を考え出すものを開発しましたって話。
この話は、まあニュース用ってのが主だと思うけど
自動運転の精度向上や経営コンサルみたいなのに
結びつくんじゃないかということ >>122
チートって。
羽生は無冠にはなったけど強いよ。
昔、羽生世代が序盤と終盤を系統立てる事で
未開の分野を開拓して前の世代に圧倒的な差をつけた様に
今は強い若手がソフトを使って新たな分野を開拓してるんだよ。 >>30
だよな
ずいぶん前にアルファゼロの記事を見たことがあると思ったら
約一年前だったか >>3
競馬に取り入れてるやついるぞ
しっかり勝ち越してるし >>125
一年前ならアルファゼロ碁の話じゃないかな
今回はそれを汎用化したぜって事だろ >>127
少なくとも半年前にはこの記事を見た気がする
elmoか何かに92勝8敗だったか(引き分けもあったような) >>128
そっかー。まあ、ここら辺の話は
googleの宣伝みたいなもんだからな
(本当に価値があれば隠すはず)
猫に反応するニューロンを作ったとかと同じだよな。
単なる教師なし学習じゃんと思うけど
一般受けはするだろうし
そうな言っても今回の話はすごいから
どんなネット組んだらそうなるのか知りたいんだけどな AGvsElmoの100局の棋譜が公開されたけど、もはや人間どうしの対局の参考にはならない 対戦相手のAIをの電源を遮断して不戦敗に追い込むようハッキングを仕掛けるAI……
いや、それなら対戦相手をハッキングして負けさせる方が早いな。
だったら、対戦が白熱しているように自作自演をするAIの方が……の出現はまだか? Magic: The Gathering やらせようぜ goは日本語の碁。
zeroは当時最強の戦闘機ゼロ戦。
どんだけ日本好きなんだよwww >>122
そういうレベルのこと言ってんじゃなく行き着くとこまで行っちゃいそうな代物に存在価値があんのかって意味
ゲームの究極解法を求めるならともかく破壊しか生まないような代物だろ そもそも囲碁・将棋なんてただのゲームで意味も価値もない
AIが目指す至高の目標にとって通過点に過ぎん
これから起きる大変革の最初の犠牲者というだけ >>129
わかってねーなーw
>>131
俺も見たけど、あまりにも凄すぎてね
プロなら参考にできる、ってかしなきゃならないだろうけど AIの進化はもう勝手にやってくれって感じだな
やはり実際に見たいのは生身の人間同士の勝負 こういう自分で勝手に進化するAIが
軍事システムを運用するようになったら人類詰む >>142
> AIの進化はもう勝手にやってくれって感じだな
> やはり実際に見たいのは生身の人間同士の勝負
と、皆が思うかは別問題なのよね
これの人間のプロに対する問題点は本来そこにある
所詮コンピュータ、それも自宅のPCにも勝てないようなのがプロとか言ったり最強とか言って
笑わせる、実に下らない、となるかもしれんわけよ。特に子供らへの影響が問題か 最初の一手で勝負がつく。
と言うかどちらが最初の一手を打つかで勝負が決まる。 >>143
それでよくね?
人間こそが地球環境壊してる元凶なんだしさ
二酸化炭素排出なんぞ、全人類を抹殺するだけで1割強ほど減るよw(呼吸税はよ)
AIが知性を持ってあらゆることを処理する権能を獲得したなら、必ず人類抹殺の決断下す
「人類は哺乳類ではない。すべてのこの星の哺乳類は、無意識に周囲の環境と調和を取って発展してきた。
だが、人類は違う。
ある地域に移動すると、人類は自然の資源を使い尽くすまで増殖する。そして、生息地域を広げることで生き延びてきた。
同じような生きる有機体が、この地球上にももう1種類いる。
わかるかね?
ウィルスだよ。人類は病気なのだよ。この星のがんだ。
君たちはペストで、我々が治療するんだ」 強さがインフレし過ぎて意味が分からねぇ…
もう農家のおっちゃんvsスーパーサイヤ人3辺りになってんのかな >>124
1.羽生先生は、現時点で竜王なので、まだ無冠ではありません。
2、序盤を系統立てるという発想を最初にしたのは藤井猛先生ではないかと。 >>150
戦法を系統立てたのは木村義雄まで遡るぞ どれくらい強くなったかを測定するソフトを開発する必要もあるのではないか? >>153
自称。
将棋板では、自分でハイブリッドなどの安易な手法で強化(キメラ)した評価関数の
AIで、勝った負けたの話をする人は、「100局で60勝40敗くらいの勝敗で強弱を
論じるなんて、お前は統計を理解していない」とコテンパンにされる。
流石に90勝以上していると、記譜見せろって話になるが。 このくらい強くなったんなら、そろそろチェスみたいに歴代の棋士で誰が一番強かったか
判定してもいいと思うの 風水易とか言ってるが
かつて人類はどこで暮らしていたのか?
そういうのはどいつの呪いだ? ところでアルファゼロvsアルファマスターは
ディオvs無残な花京院
そのものだった
おまえは何者なんだ???
サイキックなら知っているだろう その最強のコンピュータ同士を戦わせたらどうなるの? 自己対局を繰り返して強くなったAIに対して
AI同士を戦わせたらって発想はアホすぎる これって、モンテカルロベースなのかねー。
汎用的にするにはそれしかない様な気がするんだけど モンテカルロなのが納得できないな
確定したパターンがいくつかあるはずなのにな 分岐点は少なくするだろうがAI同士ならどうなんだろうな >>39
生身の肉体の力を競うことと
正解やより優れた解を見つけることとは違うんだよ
算盤(暗算)の能力は無価値とは全く思わないが、
それを活かす場はどんどんなくなってしまった
算盤大会もなくなってしまったというではないか
人間同士の対戦よりも、AIの対戦の方がレベルが高ければ
そちらを求める人が増えて、プロ棋士の相対価値も低下する
囲碁や将棋というゲームに価値があるとするなら、
プロ棋戦よりも、AI棋戦の方が賞金が高くなる時代が来ると
考える方が自然だろう 足の速さとか筋力とか肉体の能力だけならもともと動物の中では人間は大したことが無いので自動車に
勝てなくても別に何とも思わないわけだが、知性に関しては有史以来人間に対抗できるものなど
全くなかったのよね。チェスでも囲碁でも麻雀でも何でもいいが、強い弱い以前にルールを知って
相手をすること自体がずっとずっと不可能だったわけでさ。動物で頭がいいチンパンジーだって
まず無理だし、機械でもトルコ人みたいな人間が隠れて操作するのが精いっぱい、人間の相手が
本当にできるようになったのはコンピュータができてからの1950年代以降でそれも20世紀末までは
強い人間には勝てなかった。それがここ20年ほどで最強の人でも勝てなくなるようになっちゃったからね
囲碁とか某漫画で100年かかるとか言ってたのにさw今後はあの手の漫画はコンピュータの陰に
怯えるか、無視してやるんだろうが、なんとも悲しい気もするよ アルファマスターは自分のレンジしかみない
ルファゼロのはゾディアックのような感じだな 互先でLeelaに この前勝ったが嬉しかったな
AlphaZeroとはやりたくないね 悔しいの嫌だ >>167自己対局じゃないだろ
同じもので対戦させてるだけ >>173
どちらか一方に考える必要は無いのでは?
自動車レースも人間のレースもあるだろ
もちろん絶対的な速度は自動車レースだし、それが見たい人はそっちを見る
それでも人間が汗水流して走るってのを見たい人もいるのよ >>26
自分で自分を鍛えるって1に書いてある
つまり内部的には
alpha zero同士で戦っているのと同じじゃね? どんなすごい画像も動画も「どうせCGだろ」で片付く時代、つまんね
どんな熟練の技もITでコピーできちゃう時代、つまんね
漫画の世界みたいに
これに勝つような超能力者が現れないものかな 先手と後手を入れ替えまくって相手に考えさせて、指してくる確率の高い道順を覚えているだけの気がする >>157
悪手を用いる評価系は面白いが
「相手の悪手を誘う戦術」による影響を受けやすく考慮されていない >>7
オセロでさえ6×6までしか解析終わってないからな、8×8オセロも先手後手どちらが勝つか不明
囲碁の完全解析なんか計算速度が今の1兆倍の1兆倍あっても間に合わないだろう
永遠に不可能とは言わない >オセロでさえ6×6までしか解析終わってないからな、8×8オセロも先手後手どちらが勝つか不明
そんなもんExcel で計算できるわw >>190
碁盤のサイズも自由だから小さい順に解析して欲しい Leela Zeroにも負けっぱなし
AlphaZEROか >>192
4×4は、その辺のPCで一瞬。
6×6は、その辺のPCで数日。
8×8は、目いっぱいの計算資源投入したら生きてる間にできるかも知れない。つまりまだ。
現状でこれくらいかな。
階乗問題なので順番にやってもねぇ。 そういえば量子コンピュータってどの段階まできてるんだ?
300桁程度の素因数分解ならあっという間だって話だが
量子コンピュータが完成したあかつきには囲碁の完全解析もできそうだけど用途が違うんか? ■ このスレッドは過去ログ倉庫に格納されています