DeepSeekの推論モデル「DeepSeek-R1」をOpenAIのo1&o3と比較することで明らかになったこととは?
ほとんどのAIベンチマークはAIの出力精度(スキル)を測定するものですが、スキルはAIの知能を表すものではありません。
スキルではなくAIの知能を測定するため、AIがスキルを効率的に習得する能力を測定するベンチマークが「ARC-AGI」です。そんなARC-AGIの開発者であるフランソワ・ショレ氏が立ち上げた「ARC Prize」が、話題の中国AI企業DeepSeekの最新推論モデルである「DeepSeek-R1」ファミリーについて分析しています。
R1-Zero and R1 Results and Analysis
https://arcprize.org/blog/r1-zero-r1-results-analysis
(以下略、続きはソースでご確認ください)
Gigazine 2025年01月30日 20時00分
https://gigazine.net/news/20250130-deepseek-r1-zero-analysis/
探検
【AI】「DeepSeek-R1」をOpenAIのo1&o3と比較することで明らかになったこととは? [すらいむ★]
■ このスレッドは過去ログ倉庫に格納されています
1すらいむ ★
2025/01/30(木) 21:20:46.59ID:qxphUV5i■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 高市首相、衆院解散検討 意向を周辺に伝える 最速で2月8日投開票(毎日) [蚤の市★]
- 高市首相、衆院解散検討 意向を周辺に伝える 最速で2月8日投開票(毎日) ★2 [蚤の市★]
- 「ステーキとバターを食べよ」米国の新食事ガイドラインが波紋 [ぐれ★]
- 【芸能】明石家さんま 正月早々、携帯ショップの店員と口論 「お前今、何言うた?って感じ」「ワケわからへんねん」と語気を強める [冬月記者★]
- 「究極の自己都合解散」危ぶむ声も 熟慮する首相、対中関係も要因に(朝日) [蚤の市★]
- 住所、顔写真、家族の個人情報まで拡散され…「栃木」「大分」生徒暴行問題で「ネットの怒り」はなぜ暴走するのか ★4 [ぐれ★]
- 【速報】高市「国民に審判を仰ぐ」 [931948549]
- ごみ収集に転職したいんだけど、いきなり運転手って無理なの?
- 00:00:00.000
- 【疑問】巨人の阿部が立浪みたいに笑えない理由w w w w w w w w w w w w w w w w w w w w
- 【悲報】やす子、アンチの誹謗中傷に心が壊れる [935793931]
- 自称勝ち組のくせにめちゃくちゃ精神的に余裕ないよね
