【AI】ルービックキューブを一瞬で解くことに深層強化学習アルゴリズムが成功[07/17]
■ このスレッドは過去ログ倉庫に格納されています
ルービックキューブを一瞬で解くことに深層強化学習アルゴリズムが成功
https://gigazine.net/news/20190717-rubiks-cube-solve-deepcubea/
2019/7/17 12時20分
GIGAZINE
【科学(学問)ニュース+】
(写真)by Olav Ahrens Røtne
https://i.gzn.jp/img/2019/07/17//rubiks-cube-solve-deepcubea/00.jpg
囲碁のトップ棋士に勝利したAI「AlphaGo」は、自らの進化形として生まれた「AlphaGo Zero」に、誕生からわずか30時間で超えられてしまいました。AlphaGoとAlphaGo Zeroの違いは、AlphaGo Zeroが人間の棋譜を参考にせず、自身による強化学習で鍛錬を重ねたという点にありました。これと同じように、カリフォルニア大学アーバイン校(UCI)が生み出した深層強化学習アルゴリズム「DeepCubeA」は、人間の手助けなく、ルービックキューブをほんの一瞬で解けるようになったそうです。
UCI researchers’ deep learning algorithm solves Rubik’s Cube faster than any human | UCI News | UCI
https://news.uci.edu/2019/07/15/uci-researchers-deep-learning-algorithm-solves-rubiks-cube-faster-than-any-human/
https://i.gzn.jp/img/2019/07/17//rubiks-cube-solve-deepcubea/01.png
Solving the Rubik’s cube with deep reinforcement learning and search | Nature Machine Intelligence
https://www.nature.com/articles/s42256-019-0070-z
6色のパネル9枚で構成された六面体の立体パズル・ルービックキューブは、慣れてくると50手程度で解くことができ、最短だと20手を切ることが可能です。
UCIのピエール・バルディ教授らは、このルービックキューブを「DeepCubeA」と呼ばれる深層強化学習アルゴリズムで攻略。事前に解法を与えたり、人間を手助けをしたりすることなく、2日間かけた自己学習の結果、解決率100%、うち60.3%の事例で最短の解き方を得ることに成功しました。解くのにかかる時間は「ほんの一瞬」だとのこと。
バルディ教授によると、「DeepCubeA」は解決戦略が人間の解き方と異なっており、そもそも推論形式が異なっていると考えられるとのこと。プロジェクトの究極の目標は次世代AIシステムの構築にあるとのことで、「今回のことは、大きな目標への一歩です」とバルディ教授は語っています。
なお、今回の事例は「自己学習で解法に到達した」という点がポイントの1つ。すでにコンピューターを用いた「ルービックキューブ早解き」は相当な速度に到達しており、2018年にはマサチューセッツ工科大学のベン・カッツ氏とジャレッド・ディ・カルロ氏がわずか0.38秒での攻略に成功しています。
世界最速の0.38秒でルービックキューブを解くマシンが登場、世界記録を大幅に塗り替える様子がムービーで公開中 - GIGAZINE
https://gigazine.net/news/20180308-rubiks-cube-solving-machine/
GIGAZINE 知的好奇心のおもむくままにAI開発して、自滅してく人類
人間最大の魔物は知的好奇心 >>5
記事も読めないチンパンジーくん、
君には早かったみたいだねw What Was Division by Zero?;
Division by Zero Calculus and New
World:
http://vixra.org/abs/1904.0408 Announcement 478: Who did derive first the division by zero 1/0 and
the division by zero calculus tan(pi/2)=0, log 0=0$as the outputs of a computer? \\ ( これらの1番のキモは自己解答でたどり着いたってことだろ The Institute of Reproducing Kernels is dealing with the theory of division by zero
calculus and declares that the division by zero was discovered as 0/0=1/0=z/0=0
in a natural sense on 2014.2.2. The result shows a new basic idea on the universe
and space since Aristotelēs (BC384 - BC322) and Euclid (BC 3 Century - ),
and the division by zero is since Brahmagupta(598 - 668 ?). 再生核研究所声明 470 (2019.2.2)
ゼロ除算 1/0=0/0=z/0=\tan(\pi/2)=0 発見5周年を迎えて
Black holes are where God divided by 0:Division by zero:
1/0=0/0=z/0=tan(pi/2)=0 発見5周年を迎えて 将棋や囲碁に明日はあるのか どんな名人にもスマホがあれば勝てる時代 >>5
おまえバカだなw
問題の解決策を一瞬で提示できるという意味だぞ。 >>27
こいつ馬鹿すぎるだろw
AIに置き換えなければ >>103
それ、AIの手として駒を動かしてるだけで、本人は勝ってないだろ コーチやらせたら選手の成績上がったってのはまだだっけ? >>9
実は沢山シャッフルしても意味がない
回してくうちに偏りが出来て一部分揃ってる状態が出てくるから
90度回転を20回くらいすれば充分 >>65
ルール与えないAIが自由に解くなら一度分解して貼り直すと思う
もしそれを思いつかないならまだ人間には程遠いね >>110
ルービックキューブの登録商標を持ってるメガハウスが出してるキューブなら2×2でもルービックキューブ
ちなみに他の会社のはスピードキューブとか立体パズルという名称 ルービックキューブは10の18乗のオーダー程度(エクサスケール)だから、
それなりの規模のDCNNだったら、全パターン暗記に近い近似表現ができてる
可能性あるね。
囲碁・将棋と比べたらべらぼうに狭い。 ルービックキューブのどんな組み合わせも90度回転が20回以内で揃えることができると証明されている。
90度回転は18通りあるから、総当たりで揃えようとすると、最大で18の20乗ほど試さなければならない。
これはエクサスケールコンピュータをもってしても、最短で数ヵ月かかる計算量だ。 >>116
人間が10秒以内に解けるくらいの解法が確立しているわけで。
総当たりなんて持ち出すのは筋が悪い。
その解法を外部からルールを与えることなく、DCNNの強化学習で
導き出す事に成功したという事でしょ。
凄い成果というより、最初からできることがわかっていた問題を試した
くらいのレベルにしか見えない。 >>78
何が世界一なのか書いてない
価格が、質量が、分割数が、などいろいろある
そして、他の人から言われている通り、ルービックキューブは登録商標だという点を考慮してなさそう
クイズとしてまるでダメ 初期状態や色の遷移規則や目標状態などのルールは与えてる
与えてないのは解に向かう戦略 >>123
いやこれはルービックキューブ解く方法を数式で与えている
与えていないのはルービックキューブの初期状態 決定論的に解ける問題をDL使って解いても「へー」としか思えんなあ…
学生実験でNNに初めて触れた時、「すげえ、ニューラルネットってXORを学習できるんだ!人間なら一発だけど計算機が学習できるんだ!」
という感動があったが、専門家にとってはそれに近いものがあるんだろうか >>127
AIを使わずに何を使うんだよ
言えないだろ >>1、え・・・?
要は、真ん中の層は動かさなくていいの? なんか世界(世界)はスパコンってのが仮説ではなくなりそうだな・・。 再生核研究所声明 500(2019.7.28)
数学の令和革新と日本の挑戦、東京オリンピック >>129
ここで重要なことは、ORやANDは1層で実現できるのに対し、XORは1層では実現できないということ。 >>130
横から見て上層、中層、下層とする
中層を右に回す=上層と下層を左に回す
なので中層は固定したままで良い
この説明で伝わった? 所詮ん中身は半導体
あいつら馬鹿だから
足し算と引き算しか出来ないんだぜ
2×3456なんか
2を3456回足し算してるんだぜ
すごい馬鹿だろ >>136
ビットシフト命令と足し算でやってる
掛け算ができないCPUでも掛け算を足し算の繰り返しでやるプログラム書いたら恥ずかしいぞ 「フィールドマルチプライヤー」ってちょっと格好いい単語だよな >>136
人間は「たす」「ひく」「かける」「わる」の四則演算
半導体は「たす」「はんてん」「ずらす」の三則演算です ■ このスレッドは過去ログ倉庫に格納されています