【AI】AIモデルのトレーニングデータを開示することを義務付ける法案が提出される　米 [すらいむ★]

**すらいむ ★** · 2023/12/24(日) 19:15:03.28

AIモデルのトレーニングデータを開示することを義務付ける法案が提出される

　アメリカのカリフォルニア州選出の民主党議員であるアンナ・エシュー議員と、バージニア州選出の民主党議員であるドン・ベイヤー議員が、AIモデルのトレーニングデータに著作権で保護されたデータが利用されているか否かを明確にするために、トレーニングデータのソースを開示することを求める法案を提出しました。

　AI companies would be required to disclose copyrighted training data under new bill - The Verge
　https://www.theverge.com/2023/12/22/24012757/ai-foundation-model-transparency-act-bill-copyright-regulation

（以下略、続きはソースでご確認ください）

Gigazine 2023年12月24日 13時00分
https://gigazine.net/news/20231224-ai-required-disclose-training-data-bill/

**名無しのひみつ** · 2023/12/24(日) 19:58:19.14

アメリカって尖ってるねw

**名無しのひみつ** · 2023/12/24(日) 22:55:07.31

中国に負けるじゃん

**名無しのひみつ** · 2023/12/24(日) 23:16:58.90

>>1
六法全書とか読むほうがよっぽどマシだと思うけど
本当に送付された膨大な開示データ見るの？

**名無しのひみつ** · 2023/12/24(日) 23:26:57.44

ローカルでトレーニングデータ積めばいいだけ

**名無しのひみつ** · 2023/12/25(月) 08:09:05.25

世界のAI企業は学習天国の日本へいらっしゃい！

**名無しのひみつ** · 2023/12/25(月) 13:43:32.29

>トレーニングデータのソースと推論プロセス中のデータ保持方法
これって、一定以上の大規模データを保持できるのはGAFAなどの巨大企業だけ、
みたいになりそうだけどね。AIベンチャーはアメリカから逃げだすんじゃね？

**名無しのひみつ** · 2023/12/25(月) 19:42:51.57

「一番○○な××は何ですか？」
「▲△です(JACS2023，)」
みたいに参考文献も出力したらいいのに。
現状は「本当かなあ」と思うしかない。

**名無しのひみつ** · 2023/12/26(火) 12:44:49.29

一度、LLMを作ろうと思ってOpenAIの発表論文読んで同じOpenCrawlerの
データダウンロードしてみたが160TBもあって挫折した。
これ、中のデータは一々、著作権表示されてないから、著作権表示しろって
言われてもOpenCrawlerのデータを使用してます以上のことは言えない。
これを突き詰めるとGoogleの検索結果ページにも著作権表示が必要とかいう
ことになってかなり無理なことを言ってる。

**名無しのひみつ** · 2023/12/27(水) 08:10:34.43

こっちこい！

**名無しのひみつ** · 2023/12/28(木) 00:28:28.43

また素人騙し

ネットの有象無象のデータがベースモデルで
ファウンデーションモデルや基幹モデルどいわれるものは
一番代表はメタのLLama2
これフリー仕様

しかしメタもいってる
このままじゃ使えるものじゃない
ファインチューンやRAGとか使えるようにするためのものは結局バイアス作ってるから使えるわけ
業界用語とか業界コミュニケーションとか社内とか
そっちは金かけて作るから明らかにするのは別のリスクが出る

だからトレーニングデータを出すということは意味のないネット全部をこれですと指さすだけかもしくは企業や業界のノウハウを出せ言ってることになる

どちらもバカ

**名無しのひみつ** · 2023/12/28(木) 00:30:06.95

日本国政府がチャットGPTの日本政府カスタマイズモデルを作るのに全公開しろ

って言ってるレベル

**名無しのひみつ** · 2023/12/28(木) 00:31:27.61

こういう話はGnu/FSFのライセンスと同じで自分だけが得する話はない

**名無しのひみつ** · 2023/12/28(木) 00:33:46.10

>>7
金持ってるところがベースモデルを作れる
コストと時間でね

だからそこをやってくれてるベースをフリーにしてあとカスタマイズだけしろというメタは
人類に貴重な貢献してる

**名無しのひみつ** · 2023/12/28(木) 00:41:15.86

>>5
それがLLMならLLMを作ってることになる
OpenAIのファインチューンAPI使うならこの法律できたらオープンAIが献上する話になるな
それがローカルRAGならLLMじゃないからさてどうなるかな
RAGまでやるなら社内システム開示と同じだな

**名無しのひみつ** · 2023/12/28(木) 01:09:48.04

100％利用してるに決まってるだろw

**名無しのひみつ** · 2023/12/28(木) 02:08:29.20

>>8
youtu.be/ht3XV_nbduQ
Perplexityってのがそれやってるといってるぞ