【AI】「富岳」で和製生成AI 東工大や富士通、23年度中に [田杉山脈★]
■ このスレッドは過去ログ倉庫に格納されています
東京工業大学や富士通などは22日、スーパーコンピューター「富岳」を使って2023年度中に高度な生成人工知能(AI)を開発すると発表した。日本語を中心とした基盤技術を構築し、24年度から国内企業などに無償で提供する。米オープンAIの「Chat(チャット)GPT」などが世界で注目を集める中、日本の産学が連携して自前技術で対抗する。
開発には理化学研究所や東北大学も参加する。生成AIの基盤となる大規模言語モデルを独自に開発する。AIの学習にはオンライン百科事典の「ウィキペディア」などで公開されている日本語のデータなどを使い、日本語の対話能力を高める。日本企業として独自の生成AIの開発を目指すサイバーエージェントとも連携する。
日本でも生成AIを開発する動きはあるが、性能を左右するパラメーター数は数十億程度であることが多い。サイバーが17日に公開した大規模言語モデルも最大68億だ。東工大などはチャットGPTの基盤である「GPT-3」の1750億に近い1000億程度のパラメーター数を持つ大規模言語モデルなどを構築する。
大規模なモデルの構築には高い計算能力を持つスパコンが必要だが、日本の民間企業は世界的な競争力のある機種を保有していない。世界ランキング2位の富岳を運営する理研などは新たに生成AIの開発を重点テーマと位置づけ、開発した大規模言語モデルは産業界や研究機関が活用できるよう公開する。
富岳は生成AIの学習に適した画像処理半導体(GPU)などを搭載していない。ただ、国内にあるAIの計算に特化したスパコンと比べても「富岳は高性能のCPU(中央演算処理装置)を多く搭載しており、AI開発でも性能は高い」(富士通)として活用を決めた。
オープンAIなどの米テクノロジー企業は外部企業に対して学習済みのAIを提供するケースが多い。東工大などは基盤となる大規模言語モデルそのものを公開し、日本企業などが自前のデータで学習させて独自の生成AIを開発できるようにする。
https://www.nikkei.com/article/DGXZQOUC223IT0S3A520C2000000/ 計画時点で遅れているな。
パラメーター数は次世代型で数十兆じゃなかったのか? どうせ書き溜めたテキストから適当なやつ選んで返すのがせいぜいだろ日本なら 日本発のとか日本人による、、とか今の時代にこだわる必要があるの?
発想がすでに負け戦なんだよなあ せめて日本語対応だけでも海外製と勝負になったら良いね いや、この早くも下火になりつつある流れの中で開発続けるのは凄いわ 『仮面ライダー』『GTO』『科捜研の女』佐野岳、沢口けいことの結婚を発表「絵になる二人」「浮気の心配大変そう」
https://ghyui.lutzenheiser.com/0523/cdve/f007fg.html これから開発するのか
ベンチャーでもいまから開発するって言って資金調達できないだろ
どこから金が入ってくんだよ 周回遅れ過ぎるし8年成果出せない状態でも出資してくれるようなとこがこの国のどこにあんのか知らないけど和製GPTは意味あるよ
一つの言葉に複数の意味を持たせたり複数の言葉で一つの意味を表現したりするこの七面倒な言語に脳みそが英語ベースだと意図を読み切れない部分が大量にあるからクオリティの高い創作物を出力するのに今は手間と時間がいる
だから早いとこ国会図書館の蔵書全部ぶち込んだLLM作って1億総活躍させろ >日本企業などが自前のデータで学習させて独自の生成AIを開発できるようにする。
学習基盤も大事だろうけどデータはもっと大事だろ?
自前のデータを持ってる日本企業なんてないだろうに。 富士通はマイナンバーでもやらかしてるよね大丈夫?
俺の富士通のクロームブックも糞鈍いし音が途中ででなくなる
まじで今年の7月で期限が切れるASUSのクロームブックより劣るんだけど・・
東芝レベルに富士通は信用できねえ Wikipediaか。俺たまに書くけど間違えてばかり
修正は面倒だとしないで放置
あまり学習してほしくないなあ 日本語で集められるデータは英語に比べて極めて少ないから勝負になるんだろうか 富士通?
とりあえず交付サービスなんとかしてからだろ 和製に頑張って欲しいのはやまやまだけど
uiがクソすぎて使うだけで心がくじけたりするから、、、 >>20
AIとは違って言葉は関係ない
学者が考えた計算式をひたすら繰り返す機械 >>1
とりあえず流行りのAIで税金チューチューするぞまで読んだ ある物を使うのは当然の話
スパコンの場合は次世代機の開発を前倒しせんとな
仙台あたりにセンター作ったらエエ
東京大阪神戸以外なら、どこでもエエけど 国の事業なら国立国会図書館電子分館作って司書をこいつに 飛沫感染シュミレーターとしての延命が難しくなったから
和製生成AIの開発とやらにすがったのか
なかなかしぶといな 日本語版Wikipediaから学習させるためには、まず日本語版Wikipediaの記事を精査して編集しなおさなくてはいけない。 研究機密が守れない富岳に予算が付いたのがおかしい
オープンな研究や研究発表直前の権威付けでしか使わないというしな
次世代でも国産でやるか知らんけど
もうちょい研究の実態に寄り添った計算機行政をやって欲しいわ よくわからんけど今までのGPUがfloat32や64で性能追求してたけどAIに必要な計算ってint8とかint4とか精度低くてもとにかく規模の方が重要なんでしょ?ルールが変わるんならチャンスだからAIに特化したチップから作るべきでは。NVIDIAばっか儲かるのはつまらん。 >>1
うっかりテヘペロ機能のある人間味あふれる富士通製AIか。 えっ、
富岳の性能は置いといて
日本にAIがわかる人居るのか?
COCOAすらまともに作れんのに 5/10
【AI】ソフトバンク、LINEと和製GPT立ち上げへ 「やらなければ今後の参加権がなくなる」 [HAIKI★]
https://egg.5ch.net/test/read.cgi/bizplus/1683712019/111-113,116,117
4/10
【企業】サムスン、機密情報をChatGPTにリークして大問題に [田杉山脈★]
https:
//egg.5ch.net/test/read.cgi/bizplus/1681126197/
5/15
【AI】3省庁が生成AI利用へ 機密情報扱わず、期間限定 [oops★]
https://egg.5ch.net/test/read.cgi/scienceplus/1684157593/ 5/12
サイバーエージェント、日本語特化の大規模言語モデルを開発
https://www.watch.impress.co.jp/docs/news/1499904.html
5/11
“和製GPT”競争勃発か サイバーエージェント、独自の日本語LLM発表 「活用を始めている」
https:
//www.itmedia.co.jp/news/spv/2305/11/news206.html
5/17
サイバーエージェント、日本語の大規模言語モデルを一般公開 最大68億パラメータ 商用利用可能
https://www.itmedia.co.jp/news/spv/2305/17/news096.html
5/16
サイバー、大規模言語モデル公開 和製生成AI開発に弾み
https:
//www.nikkei.com/article/DGXZQOUC15BUK0V10C23A5000000/ 5/22
【AI】「富岳」で和製生成AI 東工大や富士通、23年度中に [田杉山脈★]
https:
//egg.5ch.net/test/read.cgi/bizplus/1684761854/
5/23
文章生成AI「国産」で開拓
https:
//www.nikkei.com/article/DGKKZO71234900S3A520C2TEB000/
https://encrypted-tbn0.gstatic.com/images?q=tbn:ANd9GcSr-t0N5nlGJ_zoIrEevA8QEq98zjJ-UQr-wQ&usqp=CAU
5/23
【日本版ChatGPT】東工大等スパコン「富岳」で生成AI基盤技術を開発…Wikipedia・ブログ記事等で学習 [おっさん友の会★]
https://asahi.5ch.net/test/read.cgi/newsplus/1684807605/ 4/14
【IT】Amazon、生成AI参入 自社クラウド経由で提供 [ムヒタ★]
https://egg.5ch.net/test/read.cgi/bizplus/1681426419/
4/21
【AI】マイクロソフト社長「生成AI、開発の手ゆるめず」 [田杉山脈★]
https:
//egg.5ch.net/test/read.cgi/bizplus/1682081769/
5/11
【IT】グーグル 生成AI「Bard」日本語でもサービス提供開始 [ムヒタ★]
https://egg.5ch.net/test/read.cgi/bizplus/1683763492/
5/8
【AI】「ChatGPTに匹敵する」ドイツ新興の生成AI、HPEが製造業への導入例を披露 [すらいむ★]
https:
//egg.5ch.net/test/read.cgi/scienceplus/1683548070/ 富士通、、、、、
本音はAIネタに公金チュウチュウだよね。 こういう発想がクソダサすぎる
わざわざスパコン使う必要ある?
ちょっとお偉い老害どもの思いつきに振り回される身になってみろや スパコンでやる意味が分からん
とにかくやってみたいとか
すんごいエロ絵を作りたいとか
そういうこと?
4090買って来てスタブルデフュージョンでやればいいだろ
公金使ってやることじゃない アメリカ様は富嶽()の半額で性能四倍のスパコンを作ってきたからな
日本の税金チューチューするのは美味しすぎなんだろうなぁ 富岳はあまり使われていないのか?
AIは、専用機でやれよ。 富岳を無料で使ってみたいんだが、研究機関に所属していないので申請できない。 >>55
元々コロナ専用機なんだろ
コロナ終わって無理クリAI(爆笑) 日本語しか話せないAI作ってどうすんの
国内の市場なんて大したことないのに 富嶽もコレも税金バラマキ公共工事だから仕方ないねぇ 富士通なんかよりそこら辺の中小企業の方がレベル高いぞ ChatGPTのスマホアプリ出たけど、お友達になれそうでちょっと嬉しい どーせ素人老害官僚が「あれあったろ、あれ何だっけ、すげーコンピュータあれ使えよ」で決めた仕事だろ。技術が企業大学から発信してこない時点で衰退国家だな。 何でもいっちょ噛みして存在意義をアピール
それが国家としての最重要任務である軍事利用を初めから使途目的を
否定されてる国策スパコンの悲しき
日常稼働業務
あってもなくても1位でも2位でも100点でも0点でもいいんだよ
最初から
w 西村って本当、分かりやすいことしかやらないよなあ
技術的なことは全く分かってないんだろうなー
ただのスマートなおしゃれさん大臣
安倍シンパ どう見ても税金チューチュー案件です。
実績は出しません(笑) アメリカ様は富嶽の4〜5倍の速さのスパコンをすでに使ってるが、さらにもう一台5〜6倍の速さの2号機を完成予定
なんせみんな使いまくってるからね…
日本の税金チューチュー国威発揚ホルホルスパコンとは大違い… >>73
真面目に潜水艦探知のための海洋予測とかに使ってんだろ
平和ボケの学者の趣味の研究とは違って命が掛かってるからな 日本語の対話能力を経ていると、先端のAI による開発とは別次元の翻訳作業を
課すことになるだろ。先端開発とは別次元すぎる。中国のAI 開発は中国語で
やってるのか? 少し、音頭をとる上層部が、根本的に英語能力なさそう。
技術開発では日本語訳のない、terminology も多いよ。 >>74
ほんとにやってんのか?
最近カワサキのP1とかもアメリカのに負けてるとか聞いたが NVIDIAが処理能力1エクサFLOPS・メモリ144TBの生成AI向け大規模スパコン「DGX GH200」を発表
NVIDIAのジェンスン・フアンCEOが、2023年5月30日(火)から台湾の台北市で開催されているCOMPUTEX TAIPEI
2023で、生成AIのトレーニングや大規模言語モデルのワークロードなど、大規模なAIワークロードのためのスーパー
コンピューター「DGX GH200」を発表しました。DGX GH200の処理性能は1エクサFLOPS(1000ペタFLOPS)に及び、
GoogleやMicrosoftなどのクラウドコンピューティングで試験的に運用される予定となっています >>76
ソノブイがポンコツすぎて話にならないと
T元海幕長がゲロしたしな 自ら投資して生成AIをやろうとしない昔ながらのSIer富士通 SE配下に押さえつけられた旧富士通研究所がもがいているのか
NECの方がまだ見込みがある、研究開発投資という言葉が社内で忘れられていないようだ 写真は十分作れるから、あとは音声合成でAI革命が起きてほしいな
voicepeakみたいなソフトはあるけど進化が遅すぎて話しにならんのよ 爆発的進化が欲しい 税金チューチューの理由がメタバースから生成AIに変わっただけ
さすがAI後進国日本 >>89
> 計算能力3倍に
ショボすぎワロタ
アメリカ様はすでに富嶽の4倍早い一台と5倍早い一台の二台体制なのに
さらに次世代スパコン開発のフェーズに入ってるのに 6/23
【AI】Microsoftがたった13億のパラメーターでGPT-3.5超えのパフォーマンスをたたき出す「phi-1」を発表 [oops★]
https://egg.5ch.net/test/read.cgi/scienceplus/1687521175/ >>92
7/1
【IT】ヤフーの検索エンジン技術契約、Googleから変更検討 [田杉山脈★]
https://egg.5ch.net/test/read.cgi/bizplus/1688277232/35-38
【朗報】ヤフー、検索エンジンをGoogleから韓国NAVERに切り替える英断! [126042664]
https:
//greta.5ch.net/test/read.cgi/poverty/1688222718/1,3
https://twitter.com/shibuya_nikkei/status/1675100078447677444
ヤフー検索エンジン、経済安保への影響注視
https:
//www.nikkei.com/article/DGKKZO72413550R00C23A7EA5000/
https:
//encrypted-tbn0.gstatic.com/images?q=tbn:ANd9GcQAYcstkhqQ-6jP60QUaQN4jkIwKvxk43RYhw&usqp=CAU.jpg
https://twitter.com/5chan_nel (5ch newer account) >>50 >>89
7/24
最高性能の新スーパーコンピューター AI開発企業に経産省が開放
https:
//www.nikkei.com/article/DGXZQOUA145IC0U3A710C2000000/
産総研が新スパコン設置、性能は「ABCI」の2倍以上に
https://xtech.nikkei.com/atcl/nxt/news/18/15640/
7/29
文部科学省が生成AI開発、仮説や実験立案 技術流出防ぐ
https://www.nikkei.com/article/DGXZQOUC268DF0W3A720C2000000/
https:
//encrypted-tbn0.gstatic.com/images?q=tbn:ANd9GcRh0Yuv1RFknio7yS5vD5MIzks-q84xir0d9w&usqp=CAU.jpg 4/5
ChatGPT、情報漏洩を防ぐには? データ専門家に聞く
https://www.nikkei.com/article/DGXZQOUC229FO0S3A320C2000000/
5/20
Apple、ChatGPTの社内利用を制限 機密流出を懸念
https:
//www.nikkei.com/article/DGXZQOGN19EDX0Z10C23A5000000/
7/27
ChatGPT、社外秘丸見えのリスク 日本からログイン情報漏洩
https://business.nikkei.com/atcl/gen/19/00132/072100027/ ここで言われてるSIerってどこだろうね
ttps://rio2016.5ch.net/test/read.cgi/recruit/1621328163/250-n >>39>>93
7/14
【AI】韓国ネイバーが生成AI開発 検索シェア低下に危機感 [田杉山脈★]
https:
//egg.5ch.net/test/read.cgi/bizplus/1689325524/14
8/26
【AI】ChatGPTの6500倍多く学習した…ネイバーの韓国語AI公開 [田杉山脈★]
https://egg.5ch.net/test/read.cgi/bizplus/1693058260/111
総務省がヤフーに行政指導 756万ID分の位置情報データなどを韓国のネット企業「NAVER社」に提供 [8/30] [昆虫図鑑★]
https://lavender.5ch.net/test/read.cgi/news4plus/1693386638/258-259 >>101
8/19
【AI】東大松尾研、日英対応の大規模言語モデル公開 100億パラメータ、精度は「国内オープンソース最高水準」 [すらいむ★]
https://egg.5ch.net/test/read.cgi/scienceplus/1692453618/ 2023/08/20
【AI】ChatGPT開発に必要なGPUは3万基、日本の国策AI基盤は1千基。目前に迫る日本のAI敗戦 [すらいむ★]
https://egg.5ch.net/test/read.cgi/scienceplus/1692526425/
9/12
【計算機科学】なぜ日本はGPUのない「富岳」でLLMを研究するのか 外国に後れを取らないための“現実的な理由” [すらいむ★]
https://egg.5ch.net/test/read.cgi/scienceplus/1694520939/ 10/15
【セキュリティ】情報ダダ洩れ…あまりにお粗末な日本企業の情報管理、国産AIが喝を入れる! [すらいむ★]
https://egg.5ch.net/test/read.cgi/scienceplus/1697375583/12 大規模なモデルの構築には高い計算能力を持つスパコンが必要だが、日本の民間企業は世界的な競争力のある機種を保有していない。世界ランキング2位の富岳を運営する理研などは新たに生成AIの開発を重点テーマと位置づけ、開発した大規模言語モデルは産業界や研究機関が活用できるよう公開する。 ■ このスレッドは過去ログ倉庫に格納されています