>>100
リンク先見ると出力された参考文献が学者データベースになかったみたいな話なので生成された出力の評価だね
LLMの外で実際のWebをサーチしてそれを出力する話でもないね
一方で生成AIの学習時には当然ながら存在してるものがLLM作成時に使われるわけだけどこれはトークンとして切り刻まれてベクターデータとして切り刻まれたそれ自体では文ではない情報で格納される
出力時にそのバラバナものが次々と並べられる
当初の文献にあった文字ならびでもなく、引用情報などLLMにはなく、引用情報として出力されるものも本文もLLMは同じように並べて出力する
これがLLMというものの文章生成

OpenAIもGPT作った時は業界専門的なアプリを作ることしかなかった
ところが単にデモのためにこんなことができるんですよとチャットにしたらそのさまざまな業界専門家側の人たちがそのチャットがすごくおもしろいという
そこでやっとこれそのものでいけるんじゃないかと出したのがChatGPT

そもそもGPT2までは社内評価も低かったのにRedditの高評価を入れたGPT3はダントツにいい出力を出すことに作ってる側が「驚く」話だったらしいから「出力は利用者が使える!と思えるかどうか」であって、使える分野は使えるし使えないなら使えない程度

学術の正確性はないかもしれないが普段使いには便利とか当然あるし
当初の飛行機もいきなり海渡れるくらいになりレースまでされて今では大量移動に使われてる
落ちることがないとは言えないレベルだけどみんな使ってる