OpenAIが推論に焦点を当てた新AIモデル「Strawberry」を2週間以内にリリースか
OpenAIは複雑な数学やプログラミングの処理を行える「Strawberry」というモデルを開発中だと報じられています。
このモデルは2024年秋頃に発表される予定だとうわさされていましたが、2024年9月中にも登場する可能性があると、海外メディアのThe Informationが伝えました。
New Details on OpenAI’s Strawberry; Apple’s Siri Makeover; Larry Ellison Doubles Down on Data Centers — The Information
https://www.theinformation.com/articles/new-details-on-openais-strawberry-apples-siri-makeover-larry-ellison-doubles-down-on-data-centers
(以下略、続きはソースでご確認ください)
Gigazine 2024年09月11日 11時24分
https://gigazine.net/news/20240911-openai-strawberry-new-details/
探検
【AI】OpenAI、推論に焦点を当てた新AIモデル「Strawberry」を2週間以内にリリースか [すらいむ★]
■ このスレッドは過去ログ倉庫に格納されています
1すらいむ ★
2024/09/11(水) 22:37:17.14ID:3wMGcuJn2名無しのひみつ
2024/09/12(木) 03:25:25.78ID:iPcfu7Uf でも単純な数値の比較すら間違えますってやつか?
4名無しのひみつ
2024/09/13(金) 16:13:56.81ID:wqYK9WXt 実際そうだし
2024/09/14(土) 08:18:07.83ID:KmCNYj7O
OpenAI o1-preview難問な数学の問題も普通に正解するな
o1-previewは機能特化バージョンらしいのでフルバージョンヤバそう
もうAGI直前なのかもな
o1-previewは機能特化バージョンらしいのでフルバージョンヤバそう
もうAGI直前なのかもな
6名無しのひみつ
2024/09/14(土) 13:44:47.41ID:JsGfX3qV 今のLLMに数学の基本概念を質問したら、誰もが知っていることなら正しく答える。しかし一般に間違って理解されていることや勘違いされている概念はことごとく間違える。今のLLMは次のトークンを確率的に予測しているだけ。自分で考えないで、わからないようにカンニングしているのがLLMだ。だから皆んなが間違っていることは間違わざるを得ない。人が考えるということが、未だに正しく定義できていないから、当然間違いを正せない。まともな数学AIができるのは遥か先だ。
7名無しのひみつ
2024/09/14(土) 20:11:18.04ID:6sq7lq5B2024/09/16(月) 09:12:27.61ID:Xl+7RJ0m
OpenAI o1-previewに数学の試験させたらPh.Dの平均上回ったらしいね
ネットや書籍などの公に出てない難問も4問中3問過程も合わせてちゃんと正解したとか
ネットや書籍などの公に出てない難問も4問中3問過程も合わせてちゃんと正解したとか
2024/09/16(月) 11:59:00.03ID:rNaZAkRo
AGIってぼんやりしすぎて何言ってるかわからなかったけど
openaiとかの人が言ってるのはプログラミングのことだな
(AGI)—by which we mean highly autonomous systems that outperform humans at most economically valuable work
競技プログラミングで人間トップレベルは確かに5年以内にできそう
そうなると世界で100人レベルのプログラマを
電気代だけで24時間何万人も働かせられることになる
現在使えるやつ Codeforces 1650
o1-ioi IOI参加者平均 1800
1万回提出 IOI金メダルクラス 2500
あと3年で普通に2500行くだろうな
自分で出力した1万回から1~10個選び出せるに学習させるのは
正解を出せるようにするより遥かに簡単だろう
openaiとかの人が言ってるのはプログラミングのことだな
(AGI)—by which we mean highly autonomous systems that outperform humans at most economically valuable work
競技プログラミングで人間トップレベルは確かに5年以内にできそう
そうなると世界で100人レベルのプログラマを
電気代だけで24時間何万人も働かせられることになる
現在使えるやつ Codeforces 1650
o1-ioi IOI参加者平均 1800
1万回提出 IOI金メダルクラス 2500
あと3年で普通に2500行くだろうな
自分で出力した1万回から1~10個選び出せるに学習させるのは
正解を出せるようにするより遥かに簡単だろう
10名無しのひみつ
2024/09/17(火) 10:26:11.64ID:7v+PF1t011名無しのひみつ
2024/09/21(土) 19:24:36.69ID:h/ulnj4g 【IT】プログラミングに関するChatGPTの回答、半数以上に何らかの間違いが含まれるとの研究結果 [田杉山脈★]
https://egg.5ch.net/test/read.cgi/bizplus/1716893768/
https://egg.5ch.net/test/read.cgi/bizplus/1716893768/
12名無しのひみつ
2024/09/22(日) 22:17:47.02ID:0fnU3K8E >>6
新しいのは使ってないけど、
4oを使っていると論理と呼ばれているものは、結局は予測を整合させることに過ぎない気がしてきてる。
つか4oやGeminiのpreview版の一般の言語処理はそこら辺のオヤジよりよっぽど論理的
新しいのは使ってないけど、
4oを使っていると論理と呼ばれているものは、結局は予測を整合させることに過ぎない気がしてきてる。
つか4oやGeminiのpreview版の一般の言語処理はそこら辺のオヤジよりよっぽど論理的
13名無しのひみつ
2024/09/22(日) 22:19:02.05ID:0fnU3K8E >>5
オレもOpenAI o1-preview使ってみたいけど無料で使える枠がまだないんだよね
オレもOpenAI o1-preview使ってみたいけど無料で使える枠がまだないんだよね
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 【前橋市長】小川晶氏の再選確実 ホテル問題、辞職出直し ★6 [煮卵★]
- 高市首相の「解散に対する世論の評判は思ったより悪い」 解散なら予算案の年度内成立が困難 [お断り★]
- 【芸能】現代の若者は『AKIRA』を楽しめない? 評論家が指摘「キャラクターと物語の良し悪しで語る傾向が強まっている」 ★2 [湛然★]
- 【米国】トランプ大統領「いずれにせよ、グリーンランドはわれわれのものになる」 ★2 [シャチ★]
- YouTubeショート動画で収益化停止、「海外の反応」「2chまとめ」「ゆっくり解説」「〇〇の教え」 ★3 [お断り★]
- 【高校サッカー】初の6万人超えアナウンスに国立がどよめく 決勝史上最多の観衆6万142人 ★2 [尺アジ★]
- 男同士のキスってたまらんよね…
- 喜多川海夢ちゃんみたいな彼女が欲しい
- 明日納車
- ラーメン食わなくなったな
- 【悲報】がん保険の男性差別がヤバすぎる 60歳新規なら男性は女性の約2倍保険料の模様助けて高市 [358382861]
- 私人逮捕ハンターっているの?
