X



【PC】M1 Mac、「TensorFlow」の新Mac版でのトレーニングが従来の7倍速 [田杉山脈★]
■ このスレッドは過去ログ倉庫に格納されています
0001田杉山脈 ★
垢版 |
2020/11/19(木) 22:28:52.89ID:CAP_USER
米Appleは11月18日(現地時間)、Macに最適化した「TensorFlow 2.4」のmacOS向けフォークのプレリリース版をGitHubで公開したと発表した。

 TensorFlowは米Googleが2015年にオープンソース(Apache License 2.0)で公開した機械学習プラットフォーム。ツール、ライブラリ、コミュニティリソースを備え、Linux、Windows、macOS、Android、iOSをサポートする。

 これまでのMac版TensorFlowは、MacでのトレーニングでCPUのみを使っていたが、新バージョンは「ML Compute」を活用することで、CPUだけでなく、GPUも最大限に活用する。これはIntel Macだけでなく、M1搭載の最新モデルでも可能だ。

 例えば、M1搭載の13インチMacBook Proでのトレーニングは、ベンチマークで従来の最大7倍高速という結果だった。

ML ComputeをTensorFlowおよびそのアドオンのバックエンドとして使うために、既存のスクリプトを変更する必要はない。新バージョンを使うには、AppleのGitHubリポジトリからTensorFlow 2.4フォークをダウンロードし、インストールするだけだ。

 Googleは、この新バージョンをTensorFlowのマスターブランチに統合する予定だ。
https://www.itmedia.co.jp/news/articles/2011/19/news089.html
0002名刺は切らしておりまして
垢版 |
2020/11/19(木) 22:32:35.18ID:fAPwE4fF
CPUしか使ってなかったのを、GPU使うようになったら速くなったって
そらそうだろうねとしか言いようがない
0003名刺は切らしておりまして
垢版 |
2020/11/19(木) 22:33:26.77ID:abwZG1lQ
なんの話?
ネット記事がIT関連ばっかだった頃はこういう記事で埋めつくされていたことを思い出したよ
キングストンの512MBメモリが出たとかそんなの
0004名刺は切らしておりまして
垢版 |
2020/11/19(木) 22:38:08.54ID:0rBdG3Vf
「7倍高速」と聞くと、耳をそばだてる価値があるが、
「最大7倍高速」だと、ちょっと疑義も入る。
0005名刺は切らしておりまして
垢版 |
2020/11/19(木) 22:44:14.79ID:VxFTWse2
>>1
おれのWin10RTX3080マシンより早いのか?
0006名刺は切らしておりまして
垢版 |
2020/11/19(木) 22:45:21.54ID:ohab2tpJ
>>4
その程度の理解で良いよ。

深層学習の計算効率は大体予想とは異なる。
0007名刺は切らしておりまして
垢版 |
2020/11/19(木) 22:45:49.95ID:ohab2tpJ
>>5
3090と出来なかったところでダメだな。
0009名刺は切らしておりまして
垢版 |
2020/11/19(木) 23:00:07.08ID:M+L3PPtG
>>2 Intel版は2〜3割くらいしか早くなっていないぞ。
M1 版は多分Nural CPUも使う様になってるのでは?
0010名刺は切らしておりまして
垢版 |
2020/11/19(木) 23:12:44.98ID:y3bLhAMS
M1チップは画期的だよ
なぜかというと光(電子)の速度の物理限界からくる制約を乗り越えたからだ
そもそもなんでクロックは3GHz程度までしか上がらないのかというと電子が遅いからだ
3GHzにもなると1クロック時間で電子は配線の中を10センチしか進めない
CPUとメモリなどの他のデバイスとの配線は往復10センチでは済まないので1クロックでは電子が届かず、応答があるまで何クロックか待たされることになる
だから高速化する手っ取り早い方法は配線を物理的に短くすることだ、これはずっと前から言われていた
そこでM1チップはCPUの上に3次元積層でメモリを載せてワンチップにしてしまった、だからクロックの無駄がないし短時間なら3GHz以上に上げることもできる
0011名刺は切らしておりまして
垢版 |
2020/11/19(木) 23:13:40.19ID:L7gCWzq+
>>5
intelアーキってもうほとんど意味なさない95以前のソフト動かすためななあるよーなアーキばっかだから

全廃したらそりゃ軽くなる罠と。
(アポーはとにかく使わなくなった旧仕様のデバイスに関してはひたすら削りにくるのが20年前からの仕様だから。
0012名刺は切らしておりまして
垢版 |
2020/11/19(木) 23:16:31.03ID:L7gCWzq+
尚、アポーは削った分以上は絶対に盛ってくるので体感速度は速いと感じるヤツほとんどいないんだがな。

セレロン企業用使ってて窓使ってるとある時期から無茶苦茶重くなってタイピングすらついてこなくなる、なんて事は流石に無いが。
0015名刺は切らしておりまして
垢版 |
2020/11/19(木) 23:26:09.45ID:G/oQgOhH
シネベンでもGPU使われるのか? Rosseta2は魔法か?

501 Socket774 2020/11/18(水) 22:50:21.99 ID:6TRA5vTp0
AMDユーザーによると、M1はCinebench R23シングルコア測定時にGPUも使用するからスコアが跳ね上がるらしいぞ
0016名刺は切らしておりまして
垢版 |
2020/11/19(木) 23:26:59.87ID:Gb2WX0ak
M1をターゲットにコンパイルす場合のアーキテクチャ指定って
X86_64でもなくarm64でもなくM1みたいな新しい識別子があるの?
0017名刺は切らしておりまして
垢版 |
2020/11/19(木) 23:28:31.33ID:+4E8pw2I
>>9
今度のマックはKPUも積んでるんだ
これからAMDやインテルも積んでくるかGPUの外付けみたいな感じで乗っけてくるんじゃ無いかなぁ
0018名刺は切らしておりまして
垢版 |
2020/11/19(木) 23:31:11.84ID:zLMl2XU4
比較してるCPUだけの機械学習とか元々使い物にならないだろ
信者とエアプだけが盛り上がる提灯記事
0019名刺は切らしておりまして
垢版 |
2020/11/19(木) 23:44:53.52ID:N493iC0M
クソ雑魚のインテルとは比べるけど
強敵のAMDとは比べないのですね
わかります
0021名刺は切らしておりまして
垢版 |
2020/11/19(木) 23:56:17.42ID:VR85v9tr
インテルじゃなくてNVIDIAでしょ比較対象は
マックは今までAMDのGPUしか使えなかったので、、、
0022名刺は切らしておりまして
垢版 |
2020/11/20(金) 00:02:11.75ID:Xu3tcUnY
モバイルCPUの7倍速はガッカリ速度だぞ
まぁ非CUDAの学習ライブラリが増えるのは良いこと
0024名刺は切らしておりまして
垢版 |
2020/11/20(金) 00:15:18.70ID:WCeYubLO
専用の計算機が入ってるんだから
もうちょい速くてもいいんじゃね?って言いそうになったんだが
GTX2080とかのCUDA勢と比べて速いのかな
0026名刺は切らしておりまして
垢版 |
2020/11/20(金) 00:19:43.88ID:1gEnurYY
>>3
記事の意味分かってないだろ
0027名刺は切らしておりまして
垢版 |
2020/11/20(金) 00:22:42.97ID:sndPZlZF
来年のiMacに期待するわ
0028名刺は切らしておりまして
垢版 |
2020/11/20(金) 00:39:37.51ID:LkT5RcmK
>16
で、現状でのメモリは16GBまでなんだって?
0029名刺は切らしておりまして
垢版 |
2020/11/20(金) 00:40:27.67ID:LkT5RcmK
間違った
>10
16ごめん
0031名刺は切らしておりまして
垢版 |
2020/11/20(金) 01:33:07.23ID:LAFis7/l
そもそもnVidiaに見捨てられたMacで機械学習やる馬鹿なんていないと思ってたんだが、違うのか?
GeForceがないとCudaもネイティブ動作しないんだろ?
0034名刺は切らしておりまして
垢版 |
2020/11/20(金) 09:38:14.22ID:sUuyHk3T
>>30
ソース見に行くとお望みのグラフがある
>>1 が手抜きでグラフ貼ってないだけ
0035名刺は切らしておりまして
垢版 |
2020/11/20(金) 09:59:16.83ID:WhqXJ8pZ
なんなのこれよく分かんない測定で早い早いって
アドビでもハンドブレイクでもいいから
どっちがどうなのか同一ソフトのエンコで調べて!
0036名刺は切らしておりまして
垢版 |
2020/11/20(金) 10:15:04.22ID:/+V7yE4D
記事を読む限り、あくまでM1のGPUをさらに活用した場合となってるんで、M1のニューラルエンジン使うようにさらに最適化したらさらに早くなるんじゃない?
0037名刺は切らしておりまして
垢版 |
2020/11/20(金) 10:18:41.96ID:/+V7yE4D
>>23
現行のモバイル用Core iシリーズでも4GHzは超えてる(デスクトップ用は5GHz超もある)
そもそも>>10はパイプラインすら理解してないんじゃ。。。
0038名刺は切らしておりまして
垢版 |
2020/11/20(金) 10:21:29.33ID:F1K9KOg8
>>28
そこがいただけなかった
32積んでたら公式でスペック全盛りにして、真っ先に買ってたわ
0039名刺は切らしておりまして
垢版 |
2020/11/20(金) 10:26:15.24ID:FHFaOmiI
>>32
CUDAと性能比較してくれないとまったく意味なし!
0041名刺は切らしておりまして
垢版 |
2020/11/20(金) 10:58:32.73ID:p9SOjTnF
これMacBookProでやってるけど
CPUもGPUもフル活用するなら
ファンレスのMacBookAirだとさすがにアッチッチになったりしない?
0048名刺は切らしておりまして
垢版 |
2020/11/21(土) 05:45:46.93ID:ZK8d4LtD
演算性能は演算器数 x 動作周波数で決まる
昨今は最適化が進んでアーキテクチャが違っても極端な差は出ない

どれだけ演算器を効率良く使えるかはライブラリ次第だが、TensorFlowに固定すればその辺りも限定できてベンチマークには良かったりする

2080Tiは13.45TFLOPSだが、この100〜1000倍の性能をモバイルSoCに埋め込むのは物理的に無理なんだ
0050名刺は切らしておりまして
垢版 |
2020/11/21(土) 10:23:08.36ID:Wps9ODra
当社比七倍じゃなくてGeForceとガチで同じデータセット同じライブラリで勝負したベンチ記事がでるまで分からんな
0053名刺は切らしておりまして
垢版 |
2020/11/21(土) 11:24:44.42ID:OCP0O1e4
>>14
もともとML界隈の人はMacと必要に応じてLinux
0054名刺は切らしておりまして
垢版 |
2020/11/21(土) 11:37:09.63ID:4wUiaWO4
テンソルフローに最適なのって8bit演算器が大量にあるチップよね
GPUもFPU(半精度くらい?)をSIMDすればそれに近い効率が得られると思うが実際やってるの?
RADEON系でそういう実装見たことあったが
0056名刺は切らしておりまして
垢版 |
2020/11/21(土) 11:43:22.00ID:N0elhU4r
学習と推論で違う
学習は基本FP32で推論する時に学習モデルをFP16やUINT8に量子化する(しない場合もある)
0059名刺は切らしておりまして
垢版 |
2020/11/21(土) 21:27:16.40ID:ZK8d4LtD
何処かでGTX 1050相当だと言う記事を見た記憶
モバイルGPUとTGP 220WとかのディスクリートGPUは同次元では語れない
0060名刺は切らしておりまして
垢版 |
2020/11/22(日) 05:22:15.24ID:fZNI1RQ4
NVIDIAと縁切っちゃったのにその後ディープラーニング大流行が誤算だったな
まあMacでローカルで大規模なディープラーニングは無理だから大人しくAWSとか使っとけと
0062名刺は切らしておりまして
垢版 |
2020/11/24(火) 11:46:43.18ID:6fu6oN3s
>>61
Google TPUはv2までは16ビット演算しかやってない。
これは既存の強化学習方式の場合、ニューロン同志の結合は重みでしか判定していない
ため、厳格な演算結果を導出する必要はないことに理由がある。
また、推論だけなら、精度を8ビットまで落としても実行は可能。
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況