2026年までにAIのトレーニングに使うデータが枯渇する「データ不足問題」とは?
インターネット上には膨大なデータが存在しており、それらを学習させることで作られたAIが続々と登場するようになりました。
AIの普及が爆発的に進む一方、研究者からはAIシステムを動かす燃料である学習データが枯渇する可能性があると懸念する声が上がっています。
Researchers warn we could run out of data to train AI by 2026. What then?
https://theconversation.com/researchers-warn-we-could-run-out-of-data-to-train-ai-by-2026-what-then-216741
(以下略、続きはソースでご確認ください)
Gigazine 2023年11月08日 12時00分
https://gigazine.net/news/20231108-run-out-data-train-ai/
探検
【AI】2026年までにAIのトレーニングに使うデータが枯渇する「データ不足問題」とは? [すらいむ★]
■ このスレッドは過去ログ倉庫に格納されています
1すらいむ ★
2023/11/09(木) 21:14:19.98ID:yjWmHbSd2023/11/09(木) 22:01:38.89ID:AbLyt3Hj
枯渇した後のAIの振る舞いが楽しみやん?
2023/11/09(木) 22:04:02.90ID:IyWoNj/c
将棋や囲碁だと人間の作ったデータだけでは
少なすぎるので自己対局で学習という方向に
なったけどLLMで同じことはできるのか
少なすぎるので自己対局で学習という方向に
なったけどLLMで同じことはできるのか
2023/11/09(木) 22:08:29.38ID:PR4ZgOtf
>>1
>研究者からはAIシステムを動かす燃料である学習データが枯渇する可能性があると懸念する声が上がっています。
なるほど
webサイトのデータも大量に取ってしまったし
しかも幾つものニュースサイトが自社のデータをAIに使うのを禁ずるというポリシーを打ち出してるからなあ
データが無いなら人を雇って作らせるしかない、か
有料でニュースやブログを書いてもらってそれを参考図書にする、みたいな
日本に関しては、国会図書館に所蔵されている全データを使った言語モデルとか
あるいはlineやmixiや「ここ」のデータもまだあまり活用され切ってないよなあw
>研究者からはAIシステムを動かす燃料である学習データが枯渇する可能性があると懸念する声が上がっています。
なるほど
webサイトのデータも大量に取ってしまったし
しかも幾つものニュースサイトが自社のデータをAIに使うのを禁ずるというポリシーを打ち出してるからなあ
データが無いなら人を雇って作らせるしかない、か
有料でニュースやブログを書いてもらってそれを参考図書にする、みたいな
日本に関しては、国会図書館に所蔵されている全データを使った言語モデルとか
あるいはlineやmixiや「ここ」のデータもまだあまり活用され切ってないよなあw
5名無しのひみつ
2023/11/09(木) 22:32:31.62ID:U48jVYjTゴミ食わせ
出て来たゴミを
ゴミが読む
6名無しのひみつ
2023/11/09(木) 22:34:42.48ID:ovLEsShx 「評価するAI」が絶対に必要
2023/11/10(金) 01:47:56.87ID:NmDD9JCh
やはりロボットが要るな。言語化出来ていない知識経験の収集まで自動化するには、ハード面でもブレイクスルーが必要。アンドロイド的なハードウェアをAIに与えられたら、やっと人間の役目が終わる。
2023/11/10(金) 14:54:07.94ID:WFlG3oaI
人間がいる限り常時データ生産してるんだか枯渇なんかするわけがない
10名無しのひみつ
2023/11/10(金) 16:51:40.12ID:RZEuhzyW AIの学習データをAIが生成するというマッチポンプw
11名無しのひみつ
2023/11/10(金) 16:54:32.37ID:EWUsA+pV >>7
いい暮らししてる人間のところで育ったロボットは高値がついて、
そうでないのはそれなりのお値段で売られるようになるんだろう
データはコピーできるからみんな同じ中身、って考えちゃダメだと思う
自分だけのAI、自分の趣味に合うAIってのを追及するようになる
プライベートな情報を学習させたりもするだろうし
スマホの待ち受け画面より多種多様なロボを連れ歩くんだろうな
一族で代々引き継ぐロボとかな
いい暮らししてる人間のところで育ったロボットは高値がついて、
そうでないのはそれなりのお値段で売られるようになるんだろう
データはコピーできるからみんな同じ中身、って考えちゃダメだと思う
自分だけのAI、自分の趣味に合うAIってのを追及するようになる
プライベートな情報を学習させたりもするだろうし
スマホの待ち受け画面より多種多様なロボを連れ歩くんだろうな
一族で代々引き継ぐロボとかな
12名無しのひみつ
2023/11/10(金) 17:13:57.72ID:3IEHzV3t13名無しのひみつ
2023/11/10(金) 17:23:00.61ID:OuUq+oky 従来の小さなニューラルネットワークでも「メタ学習」で
ChatGPTを凌駕するほど高度な生成AIができるとの報告、Nature誌
https://aiboom.net/archives/57838
この新技術は、限られたデータ量であっても高い効果を発揮するとされ、
生成AIにおける多くの課題—コスト、資源、データの制約—を解決する
新たな進路を開く可能性があります。
ChatGPTを凌駕するほど高度な生成AIができるとの報告、Nature誌
https://aiboom.net/archives/57838
この新技術は、限られたデータ量であっても高い効果を発揮するとされ、
生成AIにおける多くの課題—コスト、資源、データの制約—を解決する
新たな進路を開く可能性があります。
14名無しのひみつ
2023/11/10(金) 17:25:11.47ID:qNglU8Z516名無しのひみつ
2023/11/10(金) 18:01:26.28ID:+T3vzC4j 今の方法は明らかに効率が悪いから効率を上げたほうがいい
17名無しのひみつ
2023/11/10(金) 18:24:25.81ID:1UCZ8WjJ AI「ちょっと人間の脳みそに電極刺して、データーぶっこ抜いてみようぜ!」
18名無しのひみつ
2023/11/12(日) 07:05:09.90ID:1l3Ans42 TikTok LiteでPayPayやAmazonギフトなどに変換可能な4000円分のポイントをプレゼント中!
※既存TikTokユーザーの方はTikTokアプリからログアウトしてアンインストールすればできる可能性があります。
1.SIMの入ったスマホ・タブレットを用意する
2.以下のTikTok Litのサイトからアプリをダウンロード(ダウンロードだけでまだ起動しない)
https://lite.tiktok.com/t/ZSNfDwVky/
3.ダウンロード完了後、もう一度上記アドレスのリンクからアプリを起動
4.アプリ内でTikTok未使用の電話番号かメールアドレスを使用して登禄
5.10日間連続のチェックインで合計で4000円分のポイントゲット
ポイントはPayPayやAmazonギフト券に変換可能!
家族・友人に紹介したり通常タスクをこなせば更にポイントを追加でゲットできます。
※既存TikTokユーザーの方はTikTokアプリからログアウトしてアンインストールすればできる可能性があります。
1.SIMの入ったスマホ・タブレットを用意する
2.以下のTikTok Litのサイトからアプリをダウンロード(ダウンロードだけでまだ起動しない)
https://lite.tiktok.com/t/ZSNfDwVky/
3.ダウンロード完了後、もう一度上記アドレスのリンクからアプリを起動
4.アプリ内でTikTok未使用の電話番号かメールアドレスを使用して登禄
5.10日間連続のチェックインで合計で4000円分のポイントゲット
ポイントはPayPayやAmazonギフト券に変換可能!
家族・友人に紹介したり通常タスクをこなせば更にポイントを追加でゲットできます。
19名無しのひみつ
2023/11/12(日) 07:22:25.23ID:ch0dHKVW >>1
電力、マシンパワーの方が枯渇やばいだろうけど
世界のリードの1角であるグーグルのような資金があれば
気にするのはそっちの方か
まあ、数学的に識別する数が1つ増えるたびに必要なデータが指数関数的に増加する次元の壁があるのだから
ニュースはそのインスタンスの1つにすぎないわな
電力、マシンパワーの方が枯渇やばいだろうけど
世界のリードの1角であるグーグルのような資金があれば
気にするのはそっちの方か
まあ、数学的に識別する数が1つ増えるたびに必要なデータが指数関数的に増加する次元の壁があるのだから
ニュースはそのインスタンスの1つにすぎないわな
21名無しのひみつ
2023/11/12(日) 09:16:29.45ID:P9W6xDtH22名無しのひみつ
2023/11/12(日) 19:30:29.86ID:Wb1QBj3b 昔はITの教科書出版とも言われるオライリーからスパイダー制作入門なんて本が売られてた。
出版社はどこか忘れたけど、AZURE ML入門の書籍には、Twitter舐め尽くしてデータを抜く例題が分かりやすく書かれてた。
いまはChronium webdriver で、人が操作するのと判別つかないブラウザ操作でクロールできる。
出版社はどこか忘れたけど、AZURE ML入門の書籍には、Twitter舐め尽くしてデータを抜く例題が分かりやすく書かれてた。
いまはChronium webdriver で、人が操作するのと判別つかないブラウザ操作でクロールできる。
23名無しのひみつ
2023/11/13(月) 05:19:04.44ID:xx+EYIJV AI用サンプルは、人的入力で済むものなら、いまは中国インドで山ほど行われてる。
2020年代前に早々に中国でAI関連の会社が複数立ち上がったのはこれ。人的な入力ではいまや間に合ってないからこれからどうなるかわからんけどね。
2020年代前に早々に中国でAI関連の会社が複数立ち上がったのはこれ。人的な入力ではいまや間に合ってないからこれからどうなるかわからんけどね。
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 【速報】 NVIDIA、オープンAIへ15兆円を出資する計画を凍結か オープンAIが2027年に手元資金枯渇、倒産リスク [お断り★]
- 埼玉県川口市長選で自民推薦新人が落選確実(共同通信) [少考さん★]
- 東京の店で「たぬきそば」を注文した関西人の客、「揚げ玉」にクレーム「お揚げさん入ってない!」東と西で「たぬき」の定義が違う…★2 [muffin★]
- 社民党・福島瑞穂氏 高市首相に「党首討論は欠席をするが街頭演説は可能という理由がわからない」 [夜のけいちゃん★]
- 【訃報】落合信彦さん死去 84歳 老衰のため [おっさん友の会★]
- 高市首相、NHK番組への出演取りやめ… ★15 [少考さん★]
- 【高市悲報】大石あきこ総理大臣、爆誕wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww [871926377]
- 高市なら割とマジで日中戦争開戦すると思うけど俺らはどうしたらいいの? [695089791]
- 🏡アー須摩イツ👶塩ドフィールド🏭🏗
- 国民「インフレがキツイから高市早苗を支持します」 [175344491]
- 【悲報】朝日新聞自民単独300万議席予想、調査手段が電話とdポイントのアンケートだった… [517791167]
- 自民党320議席👈流石にヤバくないか?ちょっとでも減らさないと日本終わるだろ [339035499]
