東大松尾研、大規模言語モデルの研究者&開発エンジニアを募集 「LLM研究をさらに加速させる」
東京大学松尾研究室は12月26日、大規模言語モデル(LLM)の研究者や開発エンジニアを募集するとX(旧Twitter)で発表した。
同研究室は日本のAI研究の権威として知られる松尾豊教授の研究室。
2024年、LLMの研究をさらに加速させるためチームを拡大するという。
(以下略、続きはソースでご確認ください)
itmedia 2023年12月26日 14時11分
https://www.itmedia.co.jp/news/articles/2312/26/news140.html
探検
【大学】東大松尾研、大規模言語モデルの研究者&開発エンジニアを募集 「LLM研究をさらに加速させる」 [すらいむ★]
■ このスレッドは過去ログ倉庫に格納されています
1すらいむ ★
2023/12/26(火) 22:06:37.47ID:4+dAvFpE2023/12/26(火) 22:52:16.27ID:8xD4zZof
tensorflowとか4割くらいしか分かってないけど
何とかpython弄り倒して人工知能関連の仕事が出来まーすって人も
世の中に多いが
そんなポンコツは松尾研には無用だからなあ
研究室配属直後の学生の方が出来るだろうし
何とかpython弄り倒して人工知能関連の仕事が出来まーすって人も
世の中に多いが
そんなポンコツは松尾研には無用だからなあ
研究室配属直後の学生の方が出来るだろうし
3名無しのひみつ
2023/12/26(火) 23:02:04.89ID:l6BLHFjp 東大終わってるな
2023/12/27(水) 20:52:30.57ID:s11MYHcX
ポスドク招集案件?
5名無しのひみつ
2023/12/27(水) 20:53:26.56ID:s11MYHcX 何気にスタートアップに絡めて富豪になれるかもしれないw
6名無しのひみつ
2023/12/27(水) 22:36:01.89ID:ObYw2IAk 新卒ならいざ知らず経験者は550~1400万円では来ないだろ。
有力企業では年収2000万円とかじゃね?
有力企業では年収2000万円とかじゃね?
7名無しのひみつ
2023/12/27(水) 22:50:24.65ID:ObYw2IAk 東京大学 松尾研究室 求人一覧2.2_LLM研究者(特任研究員・特任助教・特任講師)
https://herp.careers/v1/weblab/j2i2oZtd_tBq
必須スキル
※下記の4点の条件を満たしている方
・Computer Science,自然言語処理などの関連領域での修士以上の学位を有する方(あるいは取得見込みの方)
・言語モデルに関する直近2年以上の研究経験(もしくはそれ相当のスキル)
・国内会議(下記は例)での自然言語処理分野の主著論文を含む研究業績
JNLP,JSAI,IBIS
・日本語および英語でのコミュニケーション及び文章作成能力を有すること.
https://herp.careers/v1/weblab/j2i2oZtd_tBq
必須スキル
※下記の4点の条件を満たしている方
・Computer Science,自然言語処理などの関連領域での修士以上の学位を有する方(あるいは取得見込みの方)
・言語モデルに関する直近2年以上の研究経験(もしくはそれ相当のスキル)
・国内会議(下記は例)での自然言語処理分野の主著論文を含む研究業績
JNLP,JSAI,IBIS
・日本語および英語でのコミュニケーション及び文章作成能力を有すること.
8名無しのひみつ
2023/12/27(水) 22:55:05.72ID:ObYw2IAk 東京大学特定有期雇用教職員の就業に関する規程
https://www.u-tokyo.ac.jp/gen01/reiki_int/reiki_syuki/syuki10.pdf
(契約期間及び契約の更新)
第5条 特任教員の契約期間及び契約の更新については、次の各号に定めるところによる。
この場合の契約の更新は、予算の状況及び当該特任教員の勤務成績の評価に基づき行う
ものとする。
(1) 一の会計年度(4月1日から翌年の3月31日までをいう。以下同じ。)を限度とす
る契約期間とする。この場合の更新については、一の会計年度を限度として契約の更新
をすることができる。
(2) 必要に応じ、3年を限度とする契約期間とすることができる。この場合の更新につ
いては、3年を限度として契約の更新をすることができる。
(3) 労働基準法第14条第1項第1号に規定する高度の専門的知識等を有する者(当該
高度の専門的知識等を必要とする業務に就く者に限る。)については、5年を限度とす
る契約期間とすることができる。この場合の更新については、5年を限度として契約の
更新をすることができる。
https://www.u-tokyo.ac.jp/gen01/reiki_int/reiki_syuki/syuki10.pdf
(契約期間及び契約の更新)
第5条 特任教員の契約期間及び契約の更新については、次の各号に定めるところによる。
この場合の契約の更新は、予算の状況及び当該特任教員の勤務成績の評価に基づき行う
ものとする。
(1) 一の会計年度(4月1日から翌年の3月31日までをいう。以下同じ。)を限度とす
る契約期間とする。この場合の更新については、一の会計年度を限度として契約の更新
をすることができる。
(2) 必要に応じ、3年を限度とする契約期間とすることができる。この場合の更新につ
いては、3年を限度として契約の更新をすることができる。
(3) 労働基準法第14条第1項第1号に規定する高度の専門的知識等を有する者(当該
高度の専門的知識等を必要とする業務に就く者に限る。)については、5年を限度とす
る契約期間とすることができる。この場合の更新については、5年を限度として契約の
更新をすることができる。
9名無しのひみつ
2023/12/27(水) 23:25:19.13ID:aOaSPxAp つまり
お手上げです
といってるわけだよ
お手上げです
といってるわけだよ
10名無しのひみつ
2023/12/27(水) 23:49:10.99ID:ObYw2IAk Weblab-10Bなんて名前で東大版LLMを一般公開しているけれども、Web稼働させてないじゃん。
Pythonからプログラムを組まないと使えないなんて面倒くさい。
Pythonからプログラムを組まないと使えないなんて面倒くさい。
11名無しのひみつ
2023/12/27(水) 23:58:52.60ID:ObYw2IAk 東大LLMのソースはココの中でダウンロード可能
https://huggingface.co/matsuo-lab
Pythonにpipでインストールして使用するらしい。
ネット検索で出てくる使用方法のサンプルページはGoogleColabProとか有料環境でやっているものしかない。
至ってマイナー。
https://huggingface.co/matsuo-lab
Pythonにpipでインストールして使用するらしい。
ネット検索で出てくる使用方法のサンプルページはGoogleColabProとか有料環境でやっているものしかない。
至ってマイナー。
12名無しのひみつ
2023/12/28(木) 00:10:42.33ID:J/VF9mKm ちなみにChatGPTは有料版でGPT4.5Turbo-128kが稼働しており、
無料のpoeでもGPT3.5Turbo-32kが稼働している。
東大LLMは何トークンまで対応しているの?
使える人、教えて!
無料のpoeでもGPT3.5Turbo-32kが稼働している。
東大LLMは何トークンまで対応しているの?
使える人、教えて!
13名無しのひみつ
2023/12/28(木) 00:14:12.87ID:J/VF9mKm 2024/4になったらOpenAIはGPT5.0-256kとかやってそう。
大丈夫か?追いつけるのか東大は?
大丈夫か?追いつけるのか東大は?
14名無しのひみつ
2023/12/28(木) 00:32:33.91ID:9au8s8Sg > 大規模言語モデルの研究者&開発エンジニアを募集
今更募集を開始するところに、駄目だこりゃ感を感じる。
だめだろ、これ。
今更募集を開始するところに、駄目だこりゃ感を感じる。
だめだろ、これ。
15名無しのひみつ
2023/12/28(木) 00:46:56.86ID:SyB2tlCg 要求水準は最先端企業レベル
業績は松尾が独り占め
給料は薄給
誰が行くのさ?
業績は松尾が独り占め
給料は薄給
誰が行くのさ?
16名無しのひみつ
2023/12/28(木) 01:08:57.68ID:yqXnIKhs >>12
GPU環境に依存するんじゃないかな。
{3|4}090/24GBで多分、8Kくらいかな
GPT3.5クラスのLLMをまともに動かすならA100/80GBくらいのGPU環境が必要
東大がデモ環境公開してないのもそのため
GPU環境に依存するんじゃないかな。
{3|4}090/24GBで多分、8Kくらいかな
GPT3.5クラスのLLMをまともに動かすならA100/80GBくらいのGPU環境が必要
東大がデモ環境公開してないのもそのため
17名無しのひみつ
2023/12/28(木) 01:27:47.89ID:yqXnIKhs >>15
多分、AIの修士修了者で大学に残りたいって人で東大、京大、東工大クラスの
人材となると年30人もいないじゃないと思う。
基本的に大学残って生き残れる保証はないからね。
ただ、弱肉強食の世界なんで公募をかければ選考にかけるくらいの人数は集まると思う
もう一つの開発職っていうのはまあ、リサーチアシスタントになると思うんだが、
こっちは定期雇用の専門職で3年とかで切られる可能性が高いので
もとめる人材を集めるのはかなり難しいかなと思う。
多分、AIの修士修了者で大学に残りたいって人で東大、京大、東工大クラスの
人材となると年30人もいないじゃないと思う。
基本的に大学残って生き残れる保証はないからね。
ただ、弱肉強食の世界なんで公募をかければ選考にかけるくらいの人数は集まると思う
もう一つの開発職っていうのはまあ、リサーチアシスタントになると思うんだが、
こっちは定期雇用の専門職で3年とかで切られる可能性が高いので
もとめる人材を集めるのはかなり難しいかなと思う。
18名無しのひみつ
2023/12/28(木) 10:12:43.59ID:J/VF9mKm19名無しのひみつ
2023/12/28(木) 11:02:37.90ID:J/VF9mKm20名無しのひみつ
2023/12/28(木) 11:13:32.99ID:J/VF9mKm21名無しのひみつ
2023/12/28(木) 11:16:07.08ID:J/VF9mKm 将棋AIがGPUタイプとCPUタイプがあるように、
LLMもCPU利用タイプでも作れると、ハードウェアのパラダイムを変えられる。
LLMもCPU利用タイプでも作れると、ハードウェアのパラダイムを変えられる。
22名無しのひみつ
2023/12/28(木) 11:29:06.80ID:3nIpY/sp 自前でできんのかい
23名無しのひみつ
2023/12/28(木) 15:04:12.14ID:onnMjofT24名無しのひみつ
2023/12/28(木) 15:59:27.41ID:J/VF9mKm 東大LLMのソースは22GBくらい。
https://huggingface.co/matsuo-lab/weblab-10b-instruction-sft/tree/main
これで600B tokens(6000億トークン)らしいので、
10兆トークンになると、366GBくらいになるのか?
https://huggingface.co/matsuo-lab/weblab-10b-instruction-sft/tree/main
これで600B tokens(6000億トークン)らしいので、
10兆トークンになると、366GBくらいになるのか?
25名無しのひみつ
2023/12/28(木) 17:04:13.78ID:J/VF9mKm AI用マシンもAIの処理能力が搭載メモリの大きさに依存するという事がよく分かった。
学習量10兆トークンを最高速で処理させようとしたら、400GB程度のグラフィックメモリ搭載機が必要という事になる。
たぶんCPU使用のスパコンとは異なりグラフィックメモリをノード間で繋げて高速で利用するソフトウェア技術はまだないので、
GPU利用では単一のノードとしてそのメモリ量が必要という事だろう。
その点ではCPU利用のスパコンに一日の長があると言える。
国内のスパコンではGPUタイプのものでABCI、CPUタイプのもので富岳があるが。
ちなみにH100/80GB×8(グラフィックメモリ総容量640GB)のマシンが4800万円、PrimeHPC FX1000の48ノード(メインメモリ総容量1536GiB)が1億2000万円。
PrimeHPC利用だと、メモリ400GBは16ノードあれば達成できる。
学習量10兆トークンを最高速で処理させようとしたら、400GB程度のグラフィックメモリ搭載機が必要という事になる。
たぶんCPU使用のスパコンとは異なりグラフィックメモリをノード間で繋げて高速で利用するソフトウェア技術はまだないので、
GPU利用では単一のノードとしてそのメモリ量が必要という事だろう。
その点ではCPU利用のスパコンに一日の長があると言える。
国内のスパコンではGPUタイプのものでABCI、CPUタイプのもので富岳があるが。
ちなみにH100/80GB×8(グラフィックメモリ総容量640GB)のマシンが4800万円、PrimeHPC FX1000の48ノード(メインメモリ総容量1536GiB)が1億2000万円。
PrimeHPC利用だと、メモリ400GBは16ノードあれば達成できる。
26名無しのひみつ
2023/12/28(木) 17:12:19.84ID:J/VF9mKm ポスト富岳を作るとしたら、1ノードで10兆トークンが扱えるようにメインメモリ512GiBが望ましいな。
27名無しのひみつ
2023/12/28(木) 18:28:43.52ID:J/VF9mKm ちなみに来年発売されるというnVidia B100はA100の36倍以上の性能だそうだ。
しかしまだHBM3e止まりであり、1ノードあたり141GBメモリではないかと言われている。
現行のH100は80GBである。
HBM4ではHBM3eの4倍程度の512GB以上が望ましい。
DRAMもサムスンやSKハイニクスにばかり依存せず、国内でも開発研究を行うべきだ。
当面は10兆トークン・400GBという指標であるが、今後はもっと増えるだろう。
東大LLMの学習サンプルJSONを見ていると、どうでもいい事ばかり書いてあり、もっと重要な情報を大量に登録すべきであると思う。
たとえば2テトレーション7の10進数での先頭から100桁程度の値とか、素数の出現頻度とか、国内の大学入試過去問題の正答など。
簡単な事では国内の高校入試の問題の正答などだ。その程度は100%正答できないと困る。
しかしまだHBM3e止まりであり、1ノードあたり141GBメモリではないかと言われている。
現行のH100は80GBである。
HBM4ではHBM3eの4倍程度の512GB以上が望ましい。
DRAMもサムスンやSKハイニクスにばかり依存せず、国内でも開発研究を行うべきだ。
当面は10兆トークン・400GBという指標であるが、今後はもっと増えるだろう。
東大LLMの学習サンプルJSONを見ていると、どうでもいい事ばかり書いてあり、もっと重要な情報を大量に登録すべきであると思う。
たとえば2テトレーション7の10進数での先頭から100桁程度の値とか、素数の出現頻度とか、国内の大学入試過去問題の正答など。
簡単な事では国内の高校入試の問題の正答などだ。その程度は100%正答できないと困る。
28名無しのひみつ
2023/12/31(日) 18:50:31.27ID:4ULGkOgW これってAIだの人工知能とか言ってるけどー
擬似AIであって本当のAIじゃないよね
こんな回り道するのが本当にいいと思ってんの?
目先の実用性とかが目当てだけじゃないの
本当のAIは作り方が判らない
だったら人間の脳を模倣してみたらどうなの
人間脳レベルの神経回路をソフトで構築したら
あとは人間同様赤ちゃんから育てていく。
学習速度は人間の数十倍だから学習期間はかなり短縮できるはず。
擬似AIであって本当のAIじゃないよね
こんな回り道するのが本当にいいと思ってんの?
目先の実用性とかが目当てだけじゃないの
本当のAIは作り方が判らない
だったら人間の脳を模倣してみたらどうなの
人間脳レベルの神経回路をソフトで構築したら
あとは人間同様赤ちゃんから育てていく。
学習速度は人間の数十倍だから学習期間はかなり短縮できるはず。
29名無しのひみつ
2023/12/31(日) 20:46:19.20ID:0Ul/B0AQ AIやってれば、学部卒でも年俸300万ドルのオファーがくる
とか言ってたな。アメリカの話。それでも来る人材が居ないと。
IT業界は人使い荒いし使い捨てと言ってたな。日本の話
情勢が激変した今はどうなんだか・・・
とか言ってたな。アメリカの話。それでも来る人材が居ないと。
IT業界は人使い荒いし使い捨てと言ってたな。日本の話
情勢が激変した今はどうなんだか・・・
30名無しのひみつ
2023/12/31(日) 23:32:59.75ID:JYGkdlAM >>28
それって釣り?
それって釣り?
31名無しのひみつ
2024/01/01(月) 00:25:51.85ID:R17LoUpo 暗号通貨のマイニングって、もしかしてブロックチェーンの為と言いつつ裏で大規模Transformer実行時のハッシュを計算させてない?
32名無しのひみつ
2024/01/01(月) 05:48:48.68ID:knndK+go AIを作れない人たちを「日本のAIの権威」と呼ぶのは、日本のAI研究はレベルが低い、と言っているようなものだと思うが
AIの学習資料を作るんじゃなくて、そういう資料をすらすら作ってくれるAIを作れよって
それと研究者&技術者を募集の給料見ると、能力あったら東大じゃなくてOpenAIやMicrosoft、Googleに行くでしょ
東大の研究は何を目標にしてるのか、よくわからんな
世界のAI研究開発の目標はAGIだと思うけど、それだってOpenAIやMicrosoft、Googleの方が進んでるだろうし
AIの学習資料を作るんじゃなくて、そういう資料をすらすら作ってくれるAIを作れよって
それと研究者&技術者を募集の給料見ると、能力あったら東大じゃなくてOpenAIやMicrosoft、Googleに行くでしょ
東大の研究は何を目標にしてるのか、よくわからんな
世界のAI研究開発の目標はAGIだと思うけど、それだってOpenAIやMicrosoft、Googleの方が進んでるだろうし
2024/02/07(水) 16:15:45.58ID:kMXziBCz
オレも東大の研究者になれんの?
34名無しのひみつ
2024/03/23(土) 19:54:28.16ID:7yUQn2x035名無しのひみつ
2024/03/23(土) 20:01:28.28ID:7wDGqr/Q てか、あのスプリクトハゲを、ど素人のワイも分析して
AIを作って戦わせてみたいんだが、
どこから手をつけたら良いのかわからん!
iPadでも可能?
ワイのスキル
WindowsPCは持ってる
Pythonぜんぜん。C言語は、HelloWorldで挫折した
ググるのは得意
AIを作って戦わせてみたいんだが、
どこから手をつけたら良いのかわからん!
iPadでも可能?
ワイのスキル
WindowsPCは持ってる
Pythonぜんぜん。C言語は、HelloWorldで挫折した
ググるのは得意
36名無しのひみつ
2024/03/23(土) 20:14:19.98ID:6cTfvOdA そんなやつはアメリカ言ってるよ
カネが全然違う
カネが全然違う
37名無しのひみつ
2024/03/23(土) 20:15:36.39ID:6cTfvOdA >>34
あれ駆除にAI必要なしなのにアホしかいないの
あれ駆除にAI必要なしなのにアホしかいないの
38名無しのひみつ
2024/03/23(土) 20:18:15.72ID:5FhdY1Lc LLMは東工大のイメージが強いから、
もっと金出して優秀な人を引き抜かないとダメだと思う
もっと金出して優秀な人を引き抜かないとダメだと思う
39名無しのひみつ
2024/03/23(土) 20:22:00.28ID:lcHeBzjC 学生を訓練して使える人材になるよう教育するのが研究室のオヤカタの仕事だと思うが。
40名無しのひみつ
2024/03/23(土) 20:46:08.95ID:+BWK+JH8 AIのニュースで解説するくらいしか仕事してないのかと思った
41名無しのひみつ
2024/03/23(土) 20:50:47.93ID:MsvpesUy えっ?今から集めるのかw
車輪の再発明でもするつもり?
車輪の再発明でもするつもり?
42名無しのひみつ
2024/03/24(日) 11:54:10.49ID:X758EMgh >学生を訓練して使える人材になるよう教育するのが研究室のオヤカタの仕事だと思うが。
使えるようになったら、賃金の高い企業特に外資系に就職してしまうから、手元には残らないだろう。
大学博士出たてで助手だと採用はせいぜい600万以下、1から3年の任期付き。その後の保証無し。
使えるようになったら、賃金の高い企業特に外資系に就職してしまうから、手元には残らないだろう。
大学博士出たてで助手だと採用はせいぜい600万以下、1から3年の任期付き。その後の保証無し。
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 米国の攻撃にベネズエラ副大統領「我々は二度と帝国の植民地にならない」と抵抗宣言…トランプ氏の狙いは「資源の掌握」と強調 [★2 [ぐれ★]
- 【中国】マドゥロ氏の解放要求 ベネズエラ産石油大半を輸入 ★4 [煮卵★]
- 50代が選ぶ、最強だと思う「1990年代に活躍した音楽アーティスト」ランキング 2位は「サザン」と「ミスチル」 [muffin★]
- 【新日本】ウルフアロン プロレス初陣で一本勝ち!三角締めでEVIL失神 NEVER奪取に会場大熱狂 ★2 [muffin★]
- 教科書、やっぱり小説必要? 高校「現代の国語」で続々復活 ★3 [少考さん★]
- 「金曜ロードショー」いつから“アニメ放送”が増えた? 実は40年前は9割が邦画・洋画だった [muffin★]
- 【DAZN/U-NEXT】ラ・リーガ ★32
- NFL 2025/26 week18 part 1
- 【ATP】テニス総合実況スレ2026 Part 1【WTA】
- はません
- おりせん
- ネットでサッカー観戦◆2025-33
- ほら、もう「男は夏汗臭い」と言ってネットで大炎上した自称フリーアナウンサーのこと忘れただろ? [412920772]
- 【万博悲報】ウクライナ副首相、生まれてきた子どもに「大阪」って名前を付けてしまう🥹 [616817505]
- ゲーム考察系YouTuberさん、クラファンで5000万円集めてゲーム開発するも完成できず炎上 [745885914]
- 霧の都ロンドン・花の都パリ 東京は?
- 渋谷、崩壊wwwwwwwwwwwwwwwwwwwwwwwwwwwwwww [329329848]
- 米国、強すぎる 南米最強のベネズエラの防空網を完全に無力化し、余裕で大統領邸宅を強襲、マドゥロ大統領を拘束、実質瞬殺した模様 [689851879]
