【IT】「AlphaZero」がチェス、将棋、囲碁の各世界最強AIを打ち負かす
■ このスレッドは過去ログ倉庫に格納されています
米Alphabet傘下の英DeepMindは12月6日(現地時間)、「AlphaGo Zero」から進化させた強化学習採用のAI「AlphaZero」が、チェス、将棋、囲碁のそれぞれの世界最強AIを打ち負かしたと発表した。
強化学習(reinforcement learning)は大まかに言うと、学習用のデータを使わずに、AIが選択した行動が正しければ報酬を与えることで、AIの状況判断能力を上げていく機械学習方式。AlphaZeroはまた、行動の選択に「モンテカルロ木探索(MCTS)」と呼ばれる検索アルゴリズムを使う。
AlphaZeroはこの方法で、チェスを9時間学習した後チェスの世界チャンピオンAI「Stockfish」を、将棋を12時間学習した後世界コンピュータ将棋選手権の2017年の勝者「elmo」に、囲碁を13日間学習した後AlphaGo Zeroに勝利した。
AlphaZeroはMCTSを使うことで、例えばチェスではチャンピオンのStockfishが1秒当たり約6000万のポジションを検索するのに対し、わずか6万しか検索せずに済むという。
また、AlphaZeroは、系列である米Googleのオリジナルプロセッサ「TPU」を5000基使っている。ちなみに、TPUは1基だけで1日当たり1億点のGoogleフォトを処理する能力がある。
DeepMindは、AlphaZeroの目的はチェスや将棋、囲碁に勝つことの先にあり、様々な実世界の問題を解決するシステムを構築することにあると語った。AlphaZeroは、単一のアルゴリズムが一連の設定で新しい知識を発見する方法を学べることを示しており、まだ初期段階ではあるが「複雑な問題に対する斬新な解決策を見いだす汎用的な学習システムを構築するというわれわれのミッションに自信を与えてくれた」という。
2018年12月09日 08時18分
http://www.itmedia.co.jp/news/articles/1812/09/news018.html お前らなんで平日のこの時間に2ちゃんできるの?
夜勤なの?
自営業なの?
2部学生なの?
フリーターなの?
入院中の患者なの?
平日休みの仕事なの?
職場で書き込んでるの?
昼からはじまる仕事なの?
親元に住んでる就活生なの?
来年以降に本気出す予定なの?
貯金を食いつぶして生きてるの?
金持ちの子供で遊んで暮らせるの? >AlphaGo Zeroに勝利した
主人公の息子ないしクローンに主人公が倒されるって展開だな
次は主人公の特訓回か ボードゲームの為に開発してるのとボードゲームは学習手段の一つとしか考えてないのではそもそものステージが違うよな 一時期圧勝しすぎたからこの手のゲームに関する開発辞めるんじゃなかったのかよw 人工無脳(じんこうむのう)は、英語圏ではchatterbotもしくはchatbotと呼ばれる会話ボット
あるいはおしゃぶりボット >>2
あの〜〜
本日は日曜日なのですが、
お薬ちゃんと飲んでますか? マージャンはAIやらないの?
それとも既にやってるのかね? AIでも、2020年東京オリンピックをからめて泣ける歌≠ヘ作れないだろう
★ お楽しみタイム
2020年東京オリンピックの泣ける歌
「東京ルーザー 〜 2020年のオリンピックを」
『東京ルーザー オリンピック』
↑
これで、ユーチューブ検索
きっと、泣けマス
(新宿、渋谷、上野、浅草、下北沢、池袋、銀座、原宿)
↑
以上8ヶ所の東京都内の地名が、歌の歌詞に登場します
「東京砂漠」「トーキョー迷子」以来の
東京≠テーマにした、歌謡曲でもあります 世界最強AIがファイナルファンタジータクティクスをどうクリアするかは見てみたいものだな 将棋の棋譜を見た。
名人級の渋い手が美しい。
鑑賞に値する将棋を指す。
これからそういう楽しみ方もあるのではないか。 AlphaZeroをばれねえように体に装着すれば藤井聡太にかてるんだな ゲームばっかりやってないで早く役立つことやれよ
って >>9
麻雀は運の要素が大きすぎるから「負けにくい」AIは作れても、ほぼ常に勝てるAIは作れない
だから誰も本気で挑戦しない The Institute of Reproducing Kernels is dealing with the theory of division by zero
calculus and declares that the division by zero was discovered as $0/0=1/0=z/0
=0$ in a natural sense on 2014.2.2. The result shows a new basic idea on the
universe and space since Aristotelēs (BC384 - BC322) and Euclid
(BC 3 Century - ), and the division by zero is since Brahmagupta (598 - 668 ?). ゼロ除算(division by zero)1/0=0、0/0=0、z/0=0
2018年05月28日(月)
テーマ:数学
これは最も簡単な 典型的なゼロ除算の結果と言えます。
ユークリッド以来の驚嘆する、誰にも分る結果では ないでしょうか?
Hiroshi O. Is It Really Impossible To Divide By Zero?. Biostat Biometrics Open
Acc J. 2018; 7(1): 555703. DOI: 10.19080/BBOJ.2018.07.555703
ゼロで分裂するのは本当に不可能ですか? - Juniper Publishers
https://juniperpublishers.com/bboaj/pdf/BBOAJ.MS.ID.555703.pdf
再生核研究所 ゼロ除算の発見と重要性を指摘した:2014年2月2日 file:///C:/Users/saito%20saburo/Downloads/SJM_2018_57-73_okumura_saitoh%20(1).pdf
ゼロ除算の発見は日本です:
∞???
∞は定まった数ではない・・・・
人工知能はゼロ除算ができるでしょうか:
とても興味深く読みました:2014年2月2日 4周年を超えました:
ゼロ除算の発見と重要性を指摘した:日本、再生核研究所 >>19
お馬鹿登場w
これら対戦ゲームの根本は、戦争、戦略なんだがw >>1
面白いなぁ。ただ獲得した学習データは人間が理解できるものにはなっていないだろう。
機械がどのような理由で「よい」と判断したのか人間の側から理解しがたいものもあるだろう。
学習データの可視化技術?などはどうなっているんだろうか。 >>1
もう碁は引退するとか言ってなかったか...😅 >>9
ゲーセンの脱衣麻雀が世界最強のAI搭載されてる 低スペックのPC同士で、ソフト対決させてもアルファゼロが勝てるのか?マシンパワーが
前提のプログラムでは、特段に意味がないと思うけど。 >>29
>機械がどのような理由で「よい」と判断したのか人間の側から理解しがたいものもあるだろう。
その中にあるいわゆる「筋」を探求することで、人間の棋力も上がることに期待したいけどね。 将棋の投了図を見ても
どちらが勝って、どちらが負けてるのか
全然分からねーじゃねーな (激怒) 激怒のあまり打ち間違い
こっちが正しいので修正
↓
将棋の投了図を見ても
どちらが勝って、どちらが負けてるのか
全然分からねーじゃねーか (激怒) 人間チェス!!、人間チェス!!、人間チェス!!!
これの世界は意外と早く到来したな 将棋なんかは1日で終わりにしないとやりたい放題になるな 単一アルゴリズムが一連の設定で新しい知識を発見する方法を学べる、というのは、AIでAIの学習アルゴリズムや最適なパラメータを学習する、ということか?
それでMTCSが二元ゼロ和有限確定完全情報ゲームでは良さげだと解ってきて、少ない検索数で既存のソフトに勝てた、という感じかな
AI研究者は研究にAIを使うのは、ある意味当たり前ではあるが、早晩研究対象のアルゴリズムが人間の理解を超える可能性が高いな 勝率でどの程度なのか出してくれないと
判断できないな。 >>19
人間がいくら頑張ってもボードゲームじゃAIに勝ち目無いとわからせて、
頭のいい人間が将棋やチェスみたいな意味の無いことに時間を費やすのをやめて、科学や数学の研究に時間を使わせる意義がある 学習プロセスにランダム要素が入る方が効率ってことかな。 >>19
>>49
人力車やめて自動車作れよって促すようなものだなw
もしくは黒船の大砲でビビらしてちょんまげと刀を止めさせるようなものw
そのくらい日本と海外はITで一気に差が付いてしまったね >>43
アルゴがない
複雑な行列計算をひたすら繰り返して機械の神経網発達させるような感じ >>50
無秩序を擬似的に用意してバイアスを無くすためだね 10年前ならチェスでもまだ人間が勝つ可能性があったけどねぇ
ここへ来て機械の進化が異様に加速してきた
恐らくAlphaZeroが十分に学習すれば人間は引き分け以上の結果は出せなくなる
こうなるともうゲームとは呼べなくなるワケで 論じても意味が無い AIって言ったってチンパンジーのアイちゃんみたいに5ちゃんにレスしたりできないんだろ?
大したことないじゃん >>33
昔、ゲーセンの脱衣麻雀で地和やられたことがある >>51
太平洋戦争でバンザイ突撃や神風特攻で悪あがきしてたけど、原爆で焼け野原にされた時代から進歩してないんだよな日本って
思考ルーティーンが農耕民族と狩猟民族の違いなんだろうね
将棋プロなんて女はなれないんだから、理系的素養が日本トップクラスの人間の集まりかつ、長時間1つのことを考えたり研究に没頭する
極めてAI開発にも向いてる集団なんだから
タイトル争いに絡めない底辺プロなんかはAI研究者になればいいのに。金も稼げるし
残念 Ai「藤井ごときが7段?じゃあワイは何10段なんだよ?w(呆れ >>61
>長時間1つのことを考えたり研究に没頭する
>極めてAI開発にも向いてる集団
これは微妙。AIは自動運転のように枠内思考では不可能な開発をやってるから
東大クイズ王とか将棋名人とは全く異なる思考が必要とされる >>21
AIが自分で洗牌して自分で山積んで
さらにガン牌出来るようになったら無敵だな >>65
それは偽物アカギレベル
本物アカギや鷲巣にはなれない すべての積む手を保存していったほうがもういいんじゃないの。 AlphaZero「スーパーリアル麻雀勝てんのやが?」 そのうちもっと曖昧な領域
例えばディベートとか弁論大会でも
力を発揮するかもしれんな チェスは早々に解法見つかって先行が必ず勝つって分かってた気がするけど 9日の記事なのか?随分前に聞いた話だが
自己対局のみでここまで成長するんだからAIのヤバさが分かる >>69
次々と5ちゃんの論客を論破していくAIか・・・ 1年以上前に将棋AIに勝ったと主張して、近日論文にして発表すると言ったまま
ずーっと放置されているんだけどなぁ。
いや、アルファゼロなら既存AIより強くても驚かないけど、以前の発表の時も
点差が1500点ついたら勝負ありとみなすとか、ちょっと客観性が欠ける対戦方法
と言っていて、そういうところの妥当性がきちんと検証された論文という形で発表し
てもらわないと、また言うだけ詐欺か?という事になっちゃう。 >>70
いえ。まだわかっていません。
>>73
いえ。まだわかっていませんが、引分または後手必勝のどちらかで、おそらく
引分だろうという段階です。ちなみに、オセロの場合黒番の初手には選択肢が
ありません。どこに着手しても相似形です。多くの場合、最後の1手は後手番が
着手して、石がひっくり返るので、もともと後手が有利と言われています。 どうせAlphaGo Zeroのときみたいに評価値が2000を超えた時点で打ち切りとかやってるんだろ Aと対戦しまくってAには勝てるようになるけど他の相手には勝てない感じ?
BにもCにもDにも勝てることを目指すとデータベースが肥大化して実用レベルじゃなくなりそう >>77
今、論文書くAI作ってるからちょっと待ってて。 >>70
分かってない。オセロですらまだ分かってないのに。
「人間より強い」のと「先手・後手必勝が判明する」の間には、
かなりの壁がある。 >>18
カジノの必勝法は既に解明されてる。
負けた場合に倍額かける方法。 ボッキデータデータは日々進化している。
最新のものがそれ以前より強いのは当たり前。
取り立てるほどのニュースではない。 これはいろんな問題解決に適用できる手法だもんな
今後のAIの発展が楽しみだしちょっとビビる 麻雀、上海ゲーム徹夜でやってました。バカになりました。((´∀`*))ヶラヶラ >>84
ルーレットは00があるので50:50ではない >>69
もう負けてる
難しい文章を理解して反論 ディベート大会で人間がAIに敗北
http://news.livedoor.com/lite/article_detail/15665809/
IBMのAIシステムと人間のディベート大会で、敗北を喫したのは人間だった
テーマに基づき両者がスピーチや反論をしたが、聴衆の大半がAIを支持
いまやAIは難しい文章を理解し、反論できるまでに進化を遂げているという >>1
>「TPU」を5000基使っている。
この物量に圧倒されるわ。
やっぱり「戦争は数だよ兄貴!」なのか。 ふつーのパソコンで名人級に指せる何かを求めてるのだが
そーいうのは出てくるの? 普通のパソコンソフトですでに名人相手に角落ちでも勝てるよ よーし戦争指揮もこいつに任せよう
からの人類絶滅まだー >>83
>分かってない。オセロですらまだ分かってないのに。
オセロはわかってるだろ?多分
ひとマスにつき3つの状態しかないんだから、再帰で調べられるだろ? >>96
こいつに核発射ボタン持たせれば負け知らずって考える国が出てきそうだな
AlphaZeroは、多分先手必勝って結論を出す(オレもそう思う) >>9
麻雀は東大がやってんな
同じ不完全情報ゲームだとポーカーやってたとは思うけど麻雀は聞かないな >>101
一応世界中で知られてるとはなってるが主に日本と一部アジア中心のマイナー気味ゲームだから当たり前だね
欧米で特に盛んなポーカーとはわけが違う。本気でやればすぐに勝率で世界チャンプ以上のを作れるだろうが
欧米じゃ知名度が低いから。日本が作るのだと囲碁のていたらくを見る限り大したものは作れんだろう 「なお、各最強ソフトは公開されてるから俺たちは検証できたけど、AlphaZeroは公開しないし検証もさせません」
Googleの論文はこのパターン多くね? あまり内容知られたくないのだろ
そういうの発表するだけで何をどうしてるか、ある程度わかっちゃうからね
おおげさに言えばAI技術を盗まれることになる >>104
「アルファーゴは世界最強、グーグルの技術力は世界一〜」
ってのはgoogleの宣伝になるけど、
企業秘密の手の内を公開するのは損にしかならないから公開しないだけ
googleは金儲けのためにアルファーゴの開発をしてるだけであって、ボランティアじゃない >>104
論文をもとに作られたクローンが公開されてるけどね どのAIもルールは最初にインプットするんだろ?
そこ越えないと現実に持ち込むAIにはなれないよな 行動が正しければ報酬を与えるってどんなことするの? 筐体の中のホコリを取ってあげたり、パネルを磨いてあげたり、 俺なんて引っ越してから3年経つのに、いまだ自宅の電話番号を覚えられないわw >>77
そういうこと言うなら今回どういう発表なのかちゃんと調べろよ
恥ずかしい… AIの技術があれば、暗号とか古代文字の解読とか行けるんじゃないかと思うけど、どうなん? >>98
ノード数(盤面の分岐)多すぎて、実時間では不可能。
というか再帰で調べるのに、なぜ盤面の状態が3つというのが重要な情報に
なるのか、僕には理解できません。ぜひ、あなたの見識をご開陳ください。 オセロはだいぶ前に解析された、という話を聞いたがな
あれは違うのか >>118
4×4とかじゃね?
そのサイズなら今のコンピュータでも1秒かからずに完全解析できる。 >>119
さすがに4x4はないw人でも俺でも時間かければできそうだw
まあいずれにしてもそんなちっこいのは勿論、限定されたものとは思えんね、それならそう記憶してるだろうし 調べたら6x6までは出てるが8x8はまだっぽいみたいね
後手必勝っぽいけど確定ではない状態
まあ自分の記憶違いか、当該情報が誤っていたようですまん >>105
>>107
おまえら素人だから知らないんだろうけど
アルファ碁に関してはクローンがGithubで開発されていた
なぜかというとAIはビッグデータの方が重要だから
基本オープンソース
論文がなかなか出ない理由は
開発しているエンジニアですら
GoogleAIが何を考えているのかわからないから
自動運転を自動車メーカーが独自に開発始めたのはそれが理由
GoogleはAIの出力結果に責任が取れないから >>18
ブラックジャックでカウンティングすれば良い。
まぁ、カジノ側が必敗なんで禁止されてるが。
日本にカジノができた直後なら、バレないかもしれない。 >>122
>AIが何を考えているのかわからないから
それじゃ、開発者は無能なその辺のAI詐欺開発者と一緒だと言っているようなもの。
一応、色々なツールでAIが何をもって判断したのか、可視化するツールはそろっている。
論文にならなかったのは、対局結果として出した数値に、妥当性が無いから、もっと
客観性がある方法で実施しなさいという事かなと。
まあ、修士論文のレベルの話かな。 アホ。論文になるかは新規性の問題。
今回何の新規性もないじゃん。
アクセプトしてくれるところはあるかもだけど、
前回みたいなScienceやらNatureは無理。となると出す意味ない。 >>127
お前何言ってんだ?
サイエンスに掲載されたってニュースだぞ。 >>112 脳の報酬系と同じ事してるんだと
良手を探り出したアルゴリズムの優先度を上げる 正しければ報酬を与える
将棋なんかは勝てば正しいと簡単だけど現実問題正しい事の評価は人間が行うわけでそこが難しいと思うわ 大量にパターン覚えて、その傾向を出しているだけだからAIじゃねーよ
アルゴリズムだ。
ちなみに、将棋なんて知能じゃなくて、記憶でやってるってことがこれでバレてる
なんで将棋の人気が落ちないか不思議だ。 それこそ、高度なアルゴリズムはAIに見えるもんだ。
でも、アルゴリズムはアルゴリズムだ >>133
全ての局面を記憶/記録できれば勝てるよ。
やってみたらいいじゃない。
できないことを宣うだけの無能だから無理かw >>134
AIの定義がいい加減だからなあ。
勝手に自己学習してパフォーマンスが向上するプログラムをAIというなら、それは正しいんだが。 日本企業がアピールの為に多用するから、AIの定義が広がってる
>>127
ココが違うのでは?
>単一のアルゴリズムが一連の設定で新しい知識を発見する方法を学べることを示しており これ前にやねうらおだかが将棋側のソフトを弱くして戦ってるから同条件じゃないだろ
って指摘してたな。ちゃんとしたハードに載せて使ってないらしい >>1
まだ強化学習の真価を発揮していない。
強化学習の真価を発揮したAIは、与えられた報酬が真に妥当なものであるかどうかの疑問を提示するところから始まる。 斬新な解決法というと
ヒトラーさんが正しいとか
殺しが正しいとかですか?
確かに期待できそうですねwうふふw どのAIも「人類は危険な存在なので直ちに駆除すべき」という結論にたどり着くんだよな
なんでこんな間違った結論しか出さないのかな?
絶対にバグだと思うよね >>141
まずAIがその結論にたどり着かないからダウト ■ このスレッドは過去ログ倉庫に格納されています