【AI】東大松尾研、日英対応の大規模言語モデル公開 100億パラメータ、精度は「国内オープンソース最高水準」 [すらいむ★]
■ このスレッドは過去ログ倉庫に格納されています
東大松尾研、日英対応の大規模言語モデル公開 100億パラメータ、精度は「国内オープンソース最高水準」
東京大学院工学系研究科・松尾研究室(主宰:松尾豊教授)は8月18日、日英の2カ国語に対応した100億パラメータサイズの大規模言語モデル(LLM)「Weblab-10B」を、事前学習と事後学習(ファインチューニング)により開発し、非商用ライセンスでモデルを無料公開した。
(以下略、続きはソースでご確認ください)
itmedia 2023年08月18日 11時21分
https://www.itmedia.co.jp/news/articles/2308/18/news097.html モデル公開より
サービスを利用出来るようにして欲しい ネット上でブラウザで動く状態のないの?
誰かやらないの? でもどうせ数学弱いんだろうな。
2^2^2^2^2^2の先頭から100桁はすでに計算結果が出ている計算だが、ChatGPTとかは大きく間違う。
これも正しく答えられないんだろ? google colaboで使えるようにしてからでかい声出して Bingのバランスとかバカだから、
四角形ABCDはAD〃BCの台形, Eは線分ACとDBとの交点である。
AD=6cm, AE=3cm, EC=7cmのとき, BCの長さは何cmか求めなさい。
という高校入試の問題が正しく解けない。 日本語と英語の文章を並べた対照表がなくて学習しても、自動翻訳ができるのでしょうか?なんだか不思議な
気がしますが。 こういうのを利用するスキルってPython書けるくらいで行けちゃうの? グーグルがリアルタイム翻訳機作ってるのに日本はコレだ なんか10年遅れてんだよな 一般公開で使えるんだと思ったら、、、、、。
そもそも、使い方すら分からない。
どこから始めていいかすら分からない。 海外のは英語びいきと聞くからな。
日本発が欲しかった。 何を研究してもNvideaが儲かるだけだよね。
ただのグラボの会社が偉くなったもんだ >>19
昨今はあえてAMDのグラボで人工知能を動かしている会社もある
同じような性能でグラボそのものは安い
特にVRAM容量が大きいからだと
だがCUDAでなくROCmなのでプログラムの大幅な書き直しが必要になり
その人員確保が大変だという gpt-4のパラメータ数は1兆を超える
なんでこんなおもちゃみたいな物を作るのか アメリカはプラグインみたいに第三者がどんどん拡張していくのが強いよな。
日本はなにか作ってもそこから発展しない。 >>20
GPUが2社で寡占されてるのがどうにもならないな
あと両方アメリカの会社なのがポイントだ >>8
機械翻訳のシステム開発にはランゲージペアと呼ばれている日英対訳ファイルを
使って機械学習を行う。
ランゲージペアのデータがないとその言語間の学習モデルは生成できない。
機械翻訳 京都文書で検索するとランゲージペアの教材データがみつかる。
通常、大学の理工学部でNLPを専攻すると最終段階で京都文書を使った機械翻訳
システムの開発を行うこととなる。NLPの100本ノックでは第99章と100章が
この例題にあたる。 へー
実際には翻訳変換してるんだね
知らなかった
日本語ベースはないんだね >>21
gpt3.5でも一兆超えてるみたい
劣化版にも程があるな
アカデミックな研究ってやつ?だったら構成変えてやらないと意味がない
この分野は企業が金ぶっこまないと無理だろ
まあベンチャーでない日本の企業では劣化版コピーになるだけだろうけど >>22
アメリカだと第三者というかサードパーティが開発する
日本だと三国人 LLMのモデルはいくつか触ったけど、比較的マシな応答を返すのはvicuna-13bくらいだったなぁ。 >>21
未だにパラメータ数と性能が比例していると思ってるやつ 松尾研の博士課程の学生が研究の一環で生成モデルを公開しただけなのに
OpenAIがマイクロソフトと共同で開発した開発費数百億円をかけたAI
と比べてパラメーター数が貧弱とか、学生とマイクロソフトの開発能力を
比較しても意味ないだろ まだ誰もテスト利用してないの?
使ったことがあるのなら使用感をよろしく。 この件についての続報があります。
新スレ立てるほどの話でもないと思うのでスレ内での案内だけ
ーーー
松尾研、公開したLLMの「オープンソース」記述を削除 X(Twitter)で指摘相次ぐ
東京大学院工学系研究科・松尾研究室(主宰:松尾豊教授)は8月22日、「オープンソース」として18日に公開した大規模言語モデル(LLM)「Weblab-10B」について、「商用利用不可のため定義に当てはまらない」としてオープンソースの記述を削除した。
(以下略、続きはソースでご確認ください)
ITmedia 2023年08月22日 14時45分
https://www.itmedia.co.jp/news/articles/2308/22/news146.html >>1
ダウンロードボタンがないので公開していない。 これで、俳句や和歌がバリバリ生成できるようになると良いね。 最近、スパム・詐欺メールの日本語の質がかなり向上して、人間が書いたものや
本物の組織が書いているのと区別するのが難しくなったと感じる。 ■ このスレッドは過去ログ倉庫に格納されています