囲碁王者を倒したAlphaGoをゼロから始めて30時間で打ち負かす「AlphaZero」、将棋・チェスの最強ソフトもサクッと制圧[12/07]
■ このスレッドは過去ログ倉庫に格納されています
囲碁の世界チャンピオンを打ち負かしたソフト「AlphaGo」が正常進化して、「AlphaZero」が誕生しました。人間による手助けを一切必要としないAlphaZeroは、ルールしか知らない状態から自己教育することで、たった30時間でAlphaGoを完膚なきまでに打ち負かす強さに成長可能。囲碁だけでなく、数十時間の独学でチェス・将棋でも、既存の最強ソフトを圧倒する強さへと進化できます。
AlphaZero: Shedding new light on the grand games of chess, shogi and Go | DeepMind
https://deepmind.com/blog/alphazero-shedding-new-light-grand-games-chess-shogi-and-go/
囲碁チャンピオンを打ち負かしたソフト「AlphaGo」は、自分で自分を鍛えられる「AlphaGo Zero」へと進化しました。自分と戦いつつ実力をメキメキ向上させられるため、自己学習可能なAlphaGo Zeroでは人間の関与が不要になりました。
囲碁に特化していたAlphaGo Zeroは、あらゆるボードゲームに対応できる汎用性を持つ「AlphaZero」へと進化しました。
そして、DeepMindによって2018年12月7日にScienceで発表された論文では、AlphaZeroが、チェス・将棋・囲碁の3つの代表的なボードゲームにおいて、これまでに開発された最強のソフトウェアを数日で打ち負かす能力に成長できることが明らかにされました。
A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play | Science
http://science.sciencemag.org/content/362/6419/1140
https://i.gzn.jp/img/2017/10/20/alphago-zero/00.jpg
2016年に開催されたチェスプログラムの世界大会TCECシーズン9を制した「Stockfish」とのイロレーティングの比較。AlphZeroは自己学習開始から4時間でStockfishを上回りました。
https://i.gzn.jp/img/2018/12/07/alphazero/a02_m.png
将棋のチャンピオンソフト「elmo」との対決では、2時間後にはAlphaZeroが上回ったとのこと。
https://i.gzn.jp/img/2018/12/07/alphazero/a01_m.png
囲碁チャンピオンのイ・セドルに勝ったときのAlphaGoを、たった30時間で超えました。
https://i.gzn.jp/img/2018/12/07/alphazero/a03_m.png
強化学習で自分を鍛えるAlphaZeroは、試行錯誤のプロセスを通じて成長します。ニューラルネットワークが必要とするトレーニング時間はゲームによって変わり、チェスでは約9時間、将棋では約12時間、囲碁では13日間必要だとのこと。
トレーニングされたネットワークは、モンテカルロ木探索(MCTS)と呼ばれる検索アルゴリズムで最も有望な「手」を選びます。AlphaZeroでは従来のエンジンに比べて考慮する検索数が圧倒的に少ないとのこと。例えば、チェスのStockfishが1秒間に6000万ポジション検索するのに対して、AlphaZeroは6万ポジションしか検索しないとのこと。伝統的なAIエンジンでは計算可能な解決法がない場面に直面すると迷いが生じるのに対して、AlphaGoではこの欠点がなく、「直感」が要求されるような場面で無類の強さを発揮します。
https://i.gzn.jp/img/2018/12/07/alphazero/b01_m.png
従来型のAIエンジンと異なるAlphaZeroは、その強さだけでなく繰り出す「手」の独創性も際立っているとのこと。生身の人間ではもはや歯が立たないレベルに達したAlphaZeroを相手にすることで、これまでプロプレイヤーが考えもしなかった新鮮な局面が現れるため、人間のプレイヤーの世界を広げる役目を果たしているとDeepMindは述べています。
人気の3つのボードゲームを完全制覇してその汎用性を示したAlphaZeroですが、今後は製薬、材料設計、バイオテクノロジーなどの科学技術を中心とした、世界的な課題の解決を目指す壮大な"ゲーム"を攻略するために、研究・開発される予定です。
AlphaZero: Shedding new light on the grand games of chess, shogi and Go https://youtu.be/7L2sUGcOgh0
GIGAZINE
https://gigazine.net/news/20181207-alphazero/ Alphaは怖いほど凄いのに、
GoogleHomeはなんであんな馬鹿なの? いよいよターミネーターの世界が現実になる日が来るのか、怖いよ〜 これについてはすごいと思う
でも、生身の人間が戦車と戦うようなものだからな
最近は、そう考えることにしてる
自動車が馬より早くなった時もこんな感じだったのか まあ、盤の面積が有限であるなら
手数は有限だからなあ。
いずれ全ての手を解析できるA Iが出来るだろう。 ★ お楽しみタイム
2020年東京オリンピックの泣ける歌
「東京ルーザー 〜 2020年のオリンピックを」
『東京ルーザー オリンピック』
↑
これで、ユーチューブ検索
きっと、泣けマス
(新宿、渋谷、上野、浅草、下北沢、池袋、銀座、原宿)
↑
以上8ヶ所の東京都内の地名が、歌の歌詞に登場します
「東京砂漠」「トーキョー迷子」以来の
東京≠テーマにした、歌謡曲でもあります 単なる判断業務をうまくこなせない 現在の裁判官に置き換える >>4
天才現る!
AlphaZeroも>>4には敵わない! 自己学習タイプのAI強い 定石定跡とかの人間的な概念はいらんな
他の分野でもこのタイプのものは増えそう
先入観いらんしな一からだと 全数の0.001%すら計算していないそれは、
別のアルファGOを一瞬で打ち負かす学習したソフトだってできることを逆に説明しているのと同じである。 >>15
ボードゲームは極端にいえばマルバツゲームを複雑にしただけで
数学的にモデル化できるから可能なのよ
実世界で教師無しの学習は難しいしぞ 囲碁では画像認識を活用したらしい、白黒のパターンだから、まあQRコードみたいなもんだ、読みやすいだろ、コンピュータには >>3
大手の証券会社は数学オリンピックのメダリストを雇って開発しているらしいね >>1
最強の将棋ソフトをたったの二時間で制圧
たったのニ時間・・・!!!
森田将棋とか内藤九段将棋秘伝とか何だったんや 汎用性が生まれたってことだよなこれ
このままいけば人間の汎用性を超えるのか 量子コンピュータなら1億倍速いので1時間で全部読みきって必勝手で勝つ 何の役にも立たないくだらないゲームばかりやってんじゃねえよ AlphaZeroどうしを戦わせたら
どうなるのかな? >>26
そら、AlphaZeroが勝つだろ (笑) 人間に勝っちゃったことで存在意義が完全に失われちゃったね スゴイとは思うが、一方で消費電力も凄いんだろうな
アルファ碁の電気使用量が「どこかの街並み」な25万ワット
(人間の脳は起きてる時で20ワット)
年間のサーバー使用料が30億円だっけか
これを大きく超えるのではなんかもにょるわ 大元のソースであるDeepmind社のブログは冒頭に去年の暮れに我々はアルファゼロを発表しましたとあるんだけど、Gigazineは時制を無視して新規にアルファゼロが発表になったかのような記事を書いてるね。
Gigazineはちゃんとチェックしろよ。 >>28
さすが阿呆の人間のうちでも底辺阿呆の人間の言うことは違う
書いてあるのに
>生身の人間ではもはや歯が立たないレベルに達したAlphaZeroを相手にすることで、
これまでプロプレイヤーが考えもしなかった新鮮な局面が現れるため、人間のプレイヤーの世界を広げる役目を果たしているとDeepMindは述べています。
人間が勝てなくなってもたとえば将棋人気は衰えぬばかりか最近は藤井君の件はじめ逆に上がり、
それらプロ棋士がそもそもこういうものからヒントを得た手を指している
まったく常識外の戦法を繰り出すらしい今度のこれらを研究し咀嚼することでプロもアマも、純粋な知的興味も含めさらに面白くなる 初手天元はともか、くいきなり辺に打つのには驚いた。
人間のプロ相手に数百連勝してるね。 街並みの設計とか高層ビルの設計とか
まったく無駄のない高効率のものを組み上げてくれそうだなあ プロ棋士の意義がどんどん薄れていくな
鍬一本で自動運転のトラクターと勝負するようなものだ >>3
公表してないだけで、既に稼動してるのでは?
内緒の儲け話を他人に話すのはバカのやることだ
投資の世界じゃ人工知能は90年代から使われてるし
製鉄会社が高炉の制御に人工知能を使って、それを投資に応用したことがある
・結果に関与する要素が多い
・入力の変動が出力に反映されるのに時間差がある
システムの特徴が高炉と株式市場は似ているらしい。なので応用が試みられたとのこと こういうのはもう正攻法で戦うのではなく
バグとかシステム特有の盲点をついて勝つとかいう戦法になっていくんだろうな >>36
乗馬、自転車、自動車等の人力より速く走れる文明の利器が在ろうとも
マラソン及びマラソンランナーの意義が消えてないのと同じように
対人競技のプロとしての棋士の意義は変わらないのでは? >>2
Google Home「自分でググれよ、ご主人様。それが最適解だ」 ■ このスレッドは過去ログ倉庫に格納されています