【AI】OpenAI、推論に焦点を当てた新AIモデル「Strawberry」を2週間以内にリリースか [すらいむ★]

**すらいむ ★** · 2024/09/11(水) 22:37:17.14

OpenAIが推論に焦点を当てた新AIモデル「Strawberry」を2週間以内にリリースか

　OpenAIは複雑な数学やプログラミングの処理を行える「Strawberry」というモデルを開発中だと報じられています。
　このモデルは2024年秋頃に発表される予定だとうわさされていましたが、2024年9月中にも登場する可能性があると、海外メディアのThe Informationが伝えました。

　New Details on OpenAI’s Strawberry; Apple’s Siri Makeover; Larry Ellison Doubles Down on Data Centers — The Information
　https://www.theinformation.com/articles/new-details-on-openais-strawberry-apples-siri-makeover-larry-ellison-doubles-down-on-data-centers

（以下略、続きはソースでご確認ください）

Gigazine 2024年09月11日 11時24分
https://gigazine.net/news/20240911-openai-strawberry-new-details/

**名無しのひみつ** · 2024/09/12(木) 03:25:25.78

でも単純な数値の比較すら間違えますってやつか？

**名無しのひみつ** · 2024/09/13(金) 15:38:44.53

>>2
すぐネガティブな事言うなしね

**名無しのひみつ** · 2024/09/13(金) 16:13:56.81

実際そうだし

**名無しのひみつ** · 2024/09/14(土) 08:18:07.83

OpenAI o1-preview難問な数学の問題も普通に正解するな
o1-previewは機能特化バージョンらしいのでフルバージョンヤバそう
もうAGI直前なのかもな

**名無しのひみつ** · 2024/09/14(土) 13:44:47.41

今のLLMに数学の基本概念を質問したら、誰もが知っていることなら正しく答える。しかし一般に間違って理解されていることや勘違いされている概念はことごとく間違える。今のLLMは次のトークンを確率的に予測しているだけ。自分で考えないで、わからないようにカンニングしているのがLLMだ。だから皆んなが間違っていることは間違わざるを得ない。人が考えるということが、未だに正しく定義できていないから、当然間違いを正せない。まともな数学AIができるのは遥か先だ。

**名無しのひみつ** · 2024/09/14(土) 20:11:18.04

>>6
具体的にはどんな質問？
昨日出たChatGPTのo1-previewは試してみた？

**名無しのひみつ** · 2024/09/16(月) 09:12:27.61

OpenAI o1-previewに数学の試験させたらPh.Dの平均上回ったらしいね
ネットや書籍などの公に出てない難問も4問中3問過程も合わせてちゃんと正解したとか

**名無しのひみつ** · 2024/09/16(月) 11:59:00.03

AGIってぼんやりしすぎて何言ってるかわからなかったけど
openaiとかの人が言ってるのはプログラミングのことだな
(AGI)—by which we mean highly autonomous systems that outperform humans at most economically valuable work
競技プログラミングで人間トップレベルは確かに5年以内にできそう

そうなると世界で100人レベルのプログラマを
電気代だけで24時間何万人も働かせられることになる

現在使えるやつ Codeforces 1650
o1-ioi　IOI参加者平均 1800
1万回提出　IOI金メダルクラス 2500

あと3年で普通に2500行くだろうな

自分で出力した1万回から1～10個選び出せるに学習させるのは
正解を出せるようにするより遥かに簡単だろう

**名無しのひみつ** · 2024/09/17(火) 10:26:11.64

>>9
俺も部署のちょこちょこした業務アプリ化させて楽してるけど
GPT4の時点でモジュール一つくらいさらっと書いてくれてるからな
ちょっといじって組み合わせるだけで使えるからかなり便利

**名無しのひみつ** · 2024/09/21(土) 19:24:36.69

【IT】プログラミングに関するChatGPTの回答、半数以上に何らかの間違いが含まれるとの研究結果 [田杉山脈★]
https://egg.5ch.net/test/read.cgi/bizplus/1716893768/

**名無しのひみつ** · 2024/09/22(日) 22:17:47.02

>>6
新しいのは使ってないけど、
4oを使っていると論理と呼ばれているものは、結局は予測を整合させることに過ぎない気がしてきてる。
つか4oやGeminiのpreview版の一般の言語処理はそこら辺のｵﾔｼﾞよりよっぽど論理的

**名無しのひみつ** · 2024/09/22(日) 22:19:02.05

>>5
オレもOpenAI o1-preview使ってみたいけど無料で使える枠がまだないんだよね