囲碁王者を倒したAlphaGoをゼロから始めて30時間で打ち負かす「AlphaZero」、将棋・チェスの最強ソフトもサクッと制圧[12/07]
■ このスレッドは過去ログ倉庫に格納されています
囲碁の世界チャンピオンを打ち負かしたソフト「AlphaGo」が正常進化して、「AlphaZero」が誕生しました。人間による手助けを一切必要としないAlphaZeroは、ルールしか知らない状態から自己教育することで、たった30時間でAlphaGoを完膚なきまでに打ち負かす強さに成長可能。囲碁だけでなく、数十時間の独学でチェス・将棋でも、既存の最強ソフトを圧倒する強さへと進化できます。
AlphaZero: Shedding new light on the grand games of chess, shogi and Go | DeepMind
https://deepmind.com/blog/alphazero-shedding-new-light-grand-games-chess-shogi-and-go/
囲碁チャンピオンを打ち負かしたソフト「AlphaGo」は、自分で自分を鍛えられる「AlphaGo Zero」へと進化しました。自分と戦いつつ実力をメキメキ向上させられるため、自己学習可能なAlphaGo Zeroでは人間の関与が不要になりました。
囲碁に特化していたAlphaGo Zeroは、あらゆるボードゲームに対応できる汎用性を持つ「AlphaZero」へと進化しました。
そして、DeepMindによって2018年12月7日にScienceで発表された論文では、AlphaZeroが、チェス・将棋・囲碁の3つの代表的なボードゲームにおいて、これまでに開発された最強のソフトウェアを数日で打ち負かす能力に成長できることが明らかにされました。
A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play | Science
http://science.sciencemag.org/content/362/6419/1140
https://i.gzn.jp/img/2017/10/20/alphago-zero/00.jpg
2016年に開催されたチェスプログラムの世界大会TCECシーズン9を制した「Stockfish」とのイロレーティングの比較。AlphZeroは自己学習開始から4時間でStockfishを上回りました。
https://i.gzn.jp/img/2018/12/07/alphazero/a02_m.png
将棋のチャンピオンソフト「elmo」との対決では、2時間後にはAlphaZeroが上回ったとのこと。
https://i.gzn.jp/img/2018/12/07/alphazero/a01_m.png
囲碁チャンピオンのイ・セドルに勝ったときのAlphaGoを、たった30時間で超えました。
https://i.gzn.jp/img/2018/12/07/alphazero/a03_m.png
強化学習で自分を鍛えるAlphaZeroは、試行錯誤のプロセスを通じて成長します。ニューラルネットワークが必要とするトレーニング時間はゲームによって変わり、チェスでは約9時間、将棋では約12時間、囲碁では13日間必要だとのこと。
トレーニングされたネットワークは、モンテカルロ木探索(MCTS)と呼ばれる検索アルゴリズムで最も有望な「手」を選びます。AlphaZeroでは従来のエンジンに比べて考慮する検索数が圧倒的に少ないとのこと。例えば、チェスのStockfishが1秒間に6000万ポジション検索するのに対して、AlphaZeroは6万ポジションしか検索しないとのこと。伝統的なAIエンジンでは計算可能な解決法がない場面に直面すると迷いが生じるのに対して、AlphaGoではこの欠点がなく、「直感」が要求されるような場面で無類の強さを発揮します。
https://i.gzn.jp/img/2018/12/07/alphazero/b01_m.png
従来型のAIエンジンと異なるAlphaZeroは、その強さだけでなく繰り出す「手」の独創性も際立っているとのこと。生身の人間ではもはや歯が立たないレベルに達したAlphaZeroを相手にすることで、これまでプロプレイヤーが考えもしなかった新鮮な局面が現れるため、人間のプレイヤーの世界を広げる役目を果たしているとDeepMindは述べています。
人気の3つのボードゲームを完全制覇してその汎用性を示したAlphaZeroですが、今後は製薬、材料設計、バイオテクノロジーなどの科学技術を中心とした、世界的な課題の解決を目指す壮大な"ゲーム"を攻略するために、研究・開発される予定です。
AlphaZero: Shedding new light on the grand games of chess, shogi and Go https://youtu.be/7L2sUGcOgh0
GIGAZINE
https://gigazine.net/news/20181207-alphazero/ ルールだけの自己学習でそんなに強くなるってのが信じられんわ。
昔自分が作ったやつは定石ブチこまんとアホアホマンだったのに。
どんなアルゴリズムなのか… >>197
量子コンピュータは特定の形の式しか解けない
素因数分解はその式に変換するやり方がわかってる
なので、まず探索部分がその特定の式に変換できるかどうかを調べるところから
できないなら解けない こんなん株式市場から先物取引、果には公営ギャンブルも全て優秀なAI持ってる人の所に一気に金が集中する時代がもう到来しちゃったってことか 打っていって地を多く獲得できるよう、学習させたんだろ 碁の序盤中盤は手は広いけど致命的な手が少ないからな。
だからモンテカルロとも相性が良かったのだ。
将棋とかは1手の遅早で勝敗が逆転してしまうから、完全にランダムに
学習したらダメだ。せめて駒の損得と数手読みを組み合わせないと、
まともな手など学習しない。 >>174
チンパンジーに麻雀や将棋を教えれたら凄いと思う
ぶっちゃけ、不可能ではないと思う よくみろ花京院 おまえは頭がおかしいのだ
が
アルファマスターに対するアルファセルフ よくあるただの画像検索とかをAIとかほんま名前変えてほしい
それなら郵便局の番号住所見てハガキを自動振り分けもAIだし
不在感知エアコン、なんなら自動改札もAIじゃん
これをAI@にして、ゲーム強いのAIA
そんでわいの基準で言うとくるくるバカなグーグル翻訳がばっちりになったらAIB完成だと思ってんだけど
D段階くらいの評価でAI分けれ CPUに勝てると思って俺も自己学習をしてみたけど勝てなかった >>180
バ力なの?
>>173は人のレースの価値を認めてるだろ
自動車レースと人のレースは質が違うからそれぞれ別のものとして成り立つが、
囲碁や将棋というゲームにおいては盤上に現れる戦いで、そのレベルが問われるから、
人間が考えた手か、AIが考えた手かによって評価が変わることはない。
人間の中で最強ですといっても、
今までは最強棋士として高い指導料をもらえたものが、
コンピューターに教わればよいということになる
相対的に価値が低下するのは明らかだわな 未開部族の言語の解析?はできないのはなんでだろ
実際に音声データがあっても無理なんだよね
不規則だからかな これでスポーツとかいいだしたらあれだろ
サッカーも野球も監督がAIとかやりそうだな >>210
まあ気持ちはわかる
今までの閃きみたいのが
短縮を覚えたのにかなわなくなってる
ブレイクスルーがこの10年で変わったな
日本は世界的に広めた功労者ではあったけど
プロの囲碁は弱かったからまあ適当に >>211
もともとデータが少ない
囲碁や将棋やチェスはもともとかなり前からコンピューターゲーム化してて蓄積が半端ない
予測のしかたがこの5年でショートカット的にできてきてる >>202
ゴールドマン・サックスとか一時期金融工学のインド人ばかりやったで
アメリカの財務省すら4年で総白髪になっとった >>10
今時の証券会社のトレーダーはAI任せだよ >>210
馬や自転車はわかるけど
もう自動車レースもサーキットでは人間いらないよ ☆ 改憲しましょう。『憲法改正國民投票法』、でググってみて
ください。国会の改憲発議はすでに可能です。平和は勝ち取るものです。
拡散も含め、ぜひよろしくお願い致します。☆ >>72
どう考えても弱いAIだろ
科学カテゴリ住人とは思えない発言だな >>42,136,190
ノイマン型で思考実験する必要は無いんだぞ? 音声認識と、構文解析のところに、ニューラルネットの技術が活用されている。
一方で、アレクサ自体は、話しかけられたコマンドにレスポンスしているだけ。
たまたまインターフェースが音声だっただけで、これがCUIだったらコマンド
プロンプトとなんら変わりはない。何ら自律的な判断はしていない。
音声認識にニューラルネットを使うのは、人間の脳でもやっている事だが、
かなり低レベルなインターフェースだと思う。
構文解析は結構高度なインターフェースではあるが、しょせんブローカー野。
前頭葉には敵わない。
この辺の認識で、AI(人工知能)であるか、無いかの見立てが変わってくる。 クルマに乗って
歩く人間より早く移動した
それに何の意味がある? これ使って先手後手の有利不利を調整するルールを探せないかな >>225
できそうだけど、あくまで、このAIにとっての調整になるぞ
個々の人間では別だろうし、別のAIでは別になる 大昔からチェス(笑い)と並んでAI研究者の夢だった「内科医の置き換え」だけど
これはうまく行ってないようだな・・・試験的に導入した病院で誤診が相次いで廃止になってしまった
自動運転も誤認識であらぬところに突っ込むとかの事故がどうしても無くせないとのこと・・・
まるで意識を持っているように見えるだけで「理解してる」訳じゃないからだとも >>18
数学的モデル化というが
強化学習やってるやつのモデルというのは
ほぼゲームのルール程度であってだな
隠れた部分のモデルを人が教えてあげなくていいのがいいのな
非数学的なやつでも飲み込んじゃうん >>221
最近、Google翻訳が著しく精度が悪くなった
翻訳が雑で抜けや誤訳が多い
なんでだろう
どんだけ金あっててもどうにもならないんだろうね >>229
ゴミのような教師データを大量に与えられたからじゃね?
ゴミで学んだら、ゴミを出力するようになる。
いくらビッグデータを集めても、中身の検証ができなければゴミそのもの。 日本はこういった数理技術の研究をあまりせずに、
加速器などの大型装置にばかり金を投じるのは良くないな。 手筋や詰碁に飽きてきたんで囲碁の思考法を学ぼうと白石本に興味をもったが金がないわ AIっていうか機械学習がどんどん発達する中で、テレビでは相変わらず、
ググればすぐに答えが出てくるようなクイズにすばやく答えることを競い合ってるバカ番組ばかりになってることに
危機感を感じざるを得ない。
こういう奴らや、そういう番組を見て「頭いいなあ」なんて感心している馬鹿は
真っ先に淘汰されるべきだな。 数学の試験で人とAIが勝負してほしいね。ただし文章題はなしで。 >>236
図形問題
AIが解答・判断に苦しむのは一般に図形問題だっていうことだけどね このソフトの棋譜がYouTubeにあるから見たんだが空恐ろしかった。
なんか見ちゃいけないものを見たような気がする Alexaは1年経っても寝室の電気毛布を理解しない >>25
それいったら、将棋のプロとか何の役にも立ってないって言ってるようなもんじゃん >>3
株取引スパコンは少し昔からある。
株取引スパコンには経済人類学が悪用されている。 2008年 12808万人 + 5万 △△△△△
2009年 12803万人 − 5万 ▼▼▼▼▼
2010年 12806万人 + 3万 △△△
2011年 12780万人 −26万 ▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼
2012年 12752万人 −28万 ▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼
2013年 12730万人 −22万 ▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼
2014年 12709万人 −21万 ▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼
http://lavender.5ch.net/test/read.cgi/asaloon/1546600138/l50
福島県や宮城県で甲状腺ガンが白血病が激増、原因は不明 。安倍移民党が政権取って何年目だっけ?
http://rosie.5ch.net/test/read.cgi/liveplus/1546677645/l50
死 ん で る 死 ん で る 死 ん で る 死 ん で る 死 ん で る 死 ん で る >>227
よく考えたら道路は車と人間しかいないわけでもないのだよね
動物が飛び出す可能性もある >>25
国民に頭を使う趣味を普及させている意義は大きい
スポーツもそう 特定分野だけとは言え人間を叩きのめしてるわけだ
局地的なシンギュラリティなってんな >>4
実際そうなんだろうな
囲碁みたいに規則的な入力があれば
適切な答えを返してくれるはず ■ このスレッドは過去ログ倉庫に格納されています