おおよその正確性の目安(GPT-4などの先進モデル)

質問のタイプ 正確性の目安(%) 備考


一般常識・日常知識 90~95%

専門知識(医学、法律など) 70~90%
数学・論理問題(中級レベル) 80~95%

プログラミング 85~95%

創作・推論・要約 80~90%
最新情報・時事 50~70%以下
 
ほらよ、お前の大好きなAIの自己評価
コレが間違ってると言うならそれ自体AIが信用できないという証拠になる