X



【IT】データサイエンティスト職に求められる言語のトップに「Python」--「R」を上回る
■ このスレッドは過去ログ倉庫に格納されています
0001田杉山脈 ★垢版2019/01/12(土) 18:37:50.17ID:CAP_USER
「Python」と「R」はデータサイエンティスト職の求人で最も多く要求されるスキルに数えられている。ところが、こうしたプロフェッショナルの仕事で最も頻繁に使用されているプログラミング言語について調査した複数の報告書によると、実際は評価が分かれるという。Cloud Academyの米国時間12月27日付の報告書で明らかになった。

 まず、TIOBE Programming Community Indexによれば、2018年の検索エンジンのリクエスト数でみたRの順位は下降気味だったという。だが、データプロフェッショナル1万6000人を対象に実施したKaggleの調査では、全体で最も人気の高いプログラミング言語はPythonであるものの、統計およびデータサイエンティストは他のどの職務よりも業務でRを使用している割合が高いことが分かった。データサイエンティストの87%はPythonを、71%はRを業務で使用していると回答していると、同報告書に記
以下ソース
https://japan.techrepublic.com/article/35131060.htm
0003名刺は切らしておりまして垢版2019/01/12(土) 18:42:18.85ID:b9qRj+KZ
ピソン
0004名刺は切らしておりまして垢版2019/01/12(土) 18:55:36.17ID:K7woRKwy
 
Rは統計データを扱うのに特化した言語であって
システムを組むには不向きなだけだろ
0006名刺は切らしておりまして垢版2019/01/12(土) 18:57:58.43ID:dibLf/yi
Python 遅いけど、、

使いやすいし、便利なライブラリも多い。
0007名刺は切らしておりまして垢版2019/01/12(土) 19:05:32.54ID:XHrLj9Fn
基本をC、ライブラリは都合のいいもの。今はたしかにPython。
Rは統計というかデータベース用だとおもう。
0008名刺は切らしておりまして垢版2019/01/12(土) 19:09:51.27ID:hEuBy7aA
Rubyは流行ることなく終わったな
0009名刺は切らしておりまして垢版2019/01/12(土) 19:11:30.41ID:WUJUgZ1h
なぜ Rだと思う? 記者の取材不足?
0010名刺は切らしておりまして垢版2019/01/12(土) 19:15:41.63ID:ephSBmTY
最近は機械学習系のライブラリがみんなPythonだからな
イヤでも使うしかない
0011sage垢版2019/01/12(土) 19:24:51.91ID:OWQfCzk/
>>10
>最近は機械学習系のライブラリ
プログラマー全体の何パーセントが,「機械学習系のライブラリ」を
使用するのか? これがPythonの人気の主な理由とは思えない!
0012名刺は切らしておりまして垢版2019/01/12(土) 19:27:11.26ID:H29X4LK5
いよいよボッキデータの真髄、といったところか
0013名刺は切らしておりまして垢版2019/01/12(土) 19:32:17.23ID:b4p6ouCE
2chでも変なところで改行してると気になる
0015名刺は切らしておりまして垢版2019/01/12(土) 19:34:39.49ID:H9+KMJVU
その辺の言語は文法が少し違うだけで
どれも同じだよ
0016名刺は切らしておりまして垢版2019/01/12(土) 19:41:12.41ID:ephSBmTY
>>11
この記事はデータサイエンティスト限定の話だし
もちろん他の用途では事情は変わってくるだろうね
機械学習いらんってことなら、別の言語でも全然構わないだろう

ちなみにPythonでプログラム書いてWebサイトを立ち上げようとすると
素のApacheですぐに動かないから微妙に面倒くさい
Djangoとかのフレームワークを使う手もあるけど、
それぞれにクセがあって多少手間がかかる

最後は何を作りたいかで決まるでしょう
0019名刺は切らしておりまして垢版2019/01/12(土) 19:55:26.28ID:SD42/tYe
assembler, bash, basic, c, cobol, java, perl, php, python, PL/M

人生最後の言語はrustだと思いたい
0020名刺は切らしておりまして垢版2019/01/12(土) 19:59:05.68ID:q+VwURUA
データ解析といえばSASじゃないの?時代は変わったな
0022名刺は切らしておりまして垢版2019/01/12(土) 20:11:46.83ID:PAeBiU62
でもモジュール作る人はc/c++じゃないの?
データサイエンティストと言う人らはフロントだけを作るの?
0024名刺は切らしておりまして垢版2019/01/12(土) 20:16:59.67ID:sJf3fT7h
Rはデータ処理しやすいから好き
書き方も好き
0025名刺は切らしておりまして垢版2019/01/12(土) 20:17:56.46ID:7pg+voxm
これはおかしい
Pythonが言語として優れてるわけでなく、グーグルとか多数企業が
数値計算、AI関連のモジュールもあとから追加したからだろ。
Javascriptでもよかった
0026名刺は切らしておりまして垢版2019/01/12(土) 20:24:06.33ID:7pg+voxm
なぜ機械学習にPythonが選ばれるのか

Google AppEngineの開始当初(2008年4月)にPythonをサポートしていた際には、なんでPythonなんだろうと軽く調べ、教育用として海外では普及しているという認識だった。
2012年〜2013年頃にデータサイエンスがバズワードとなり機械学習する上でR言語と次点でPythonという感じだったと思う。

そして昨今はPython一色になってきている。
私としては何故このように科学計算分野のライブラリが作成され強化されるように至ったのかを知りたくなり歴史から調べてみました。

RubyがRailsにより注目されたように、Pythonでは当初数値コンピューティング用に設計されたものではなかったがリストの概念や関数型言語の基本機能を実装したこと、
Jim Fulton氏(元ZOPE社CTO)が多次元配列・行列ライブラリ「Matrix Object in Python」を開発したことで、
早い段階(Python 1.0から1年後)で科学/エンジニアリングコミュニティに注目され「Matrix-SIG」が設立、
後の「NumPy」が紆余曲折(Numeric(1995年)とNumArray(2001)を統合)を経て2005年にリリースされた。

また幾つかの科学計算用ライブラリをパッケージ化した「SciPy」が2001年にTravis Oliphant氏らによりリリースされた。
その後はEnthought社が2001年に米国で設立され、SciPyをベースにツールやパッケージやサポートを提供、また科学技術計算向けの「SciPy Conference」と呼ばれる会議の開催を支援して行く。

Pythonが、科学技術計算で使われるようになるであろう理由のもう一つに着目した。
オープンソースプロジェクトは開発リソースが限られ、開発の中心メンバーが何らかの理由で参加しなくなった場合、一気にそのプロジェクトが衰退する場合があるが、
特に科学技術計算関係のパッケージについては民間企業が本格的にサポートとしており、オープンソースソフトウェアとして公開する体制が整っている。

民間企業の代表的なのが、Enthought社とContinuum Analytics社である。
Enthought社は科学技術計算用パッケージ群「Scipy Stack」を提供し、科学技術計算向けの「SciPy Conference」と呼ばれる会議の開催を支援している。
Continuum Analytics社はPythonディストリビューション「Anaconda」を提供し、データ分析向けの「Py Data」と呼ばれる会議の開催を支援している。

また、GoogleもPython作者のGuido van Rossum氏を2005年に雇用したり、「Google Summer of Code」というオープンソースの開発に資金を提供するプロジェクトを2005年に作成し、
機械学習ライブラリの「scikit-learn」や多変量回帰分析・時系列分析ライブラリ「statsmodels」がリリースされています。
科学技術計算分野のキーマンは、「SciPy」と「NumPy」の作者でもあるTravis Oliphant氏であろう。
http://qiita.com/yaju/items/5502115d7e3d06e6bbdd
0028名刺は切らしておりまして垢版2019/01/12(土) 20:33:18.62ID:FyOIkd6T
>>27
別に日本でも使うだろ。
研究者やデータサイエンティストとかなら。
ITドカタだけが仕事でプログラミングしてるわけじゃねーんだぞ
0030名刺は切らしておりまして垢版2019/01/12(土) 20:39:23.01ID:FyOIkd6T
>>22
機械学習とかはサーバサイドだろ。
サーバでPythonが動き、C/C++で書かれてコンパイルされたライブラリーを呼び出す。
サーバサイドのフレームワークはPHP/Ruby/Pythonあたり。
フロントエンドではJavascript/HTML/CSSが動き、
C#とかJava書かれたソフトも動いてるかもしれん。

今時1つの言語じゃ大したことできねーぞ。
0031名刺は切らしておりまして垢版2019/01/12(土) 20:41:28.24ID:FyOIkd6T
>>29
仕事で使ってるんだぞ?立派な業務使用。
商用ソフトのクオリティではないだけの話。
そこは目的が違うだけ。

英語で言ったら「英語は通訳しか仕事で使わない」
と言ってるようなもん
0032名刺は切らしておりまして垢版2019/01/12(土) 20:43:09.54ID:FyOIkd6T
日本のプログラマに多い、
SIとかでクライアントの社内システムしこしこ作ってるようなのが、
むしろプログラマーの中では底辺だからな。
0033名刺は切らしておりまして垢版2019/01/12(土) 20:51:34.47ID:RxXl9REQ
Rかじった程度の統計の人やプログラム未経験だけどとにかくクエリは自力でかけますみたいな人たちにとっては取っつきやすいみたいですね
純粋なプログラマーにはクソ言語にしか見えない
0034名刺は切らしておりまして垢版2019/01/12(土) 20:55:54.96ID:FyOIkd6T
純粋なプログラマーって言い方が謎だが、
プログラミングそのものでお金をもらってるのと、
何か成果を出すためにプログラミングをツールとして
使ってる人ではそりゃ見方が違うだろ。
0035名刺は切らしておりまして垢版2019/01/12(土) 21:04:11.03ID:7pg+voxm
>>30
全体でみればそうかもしれないが。
データサイエンティストとして要求されるのはPythonにほぼ限定されるかと。
機械学習とかAIはPythonでやって結果は別人、グループへ。
0036名刺は切らしておりまして垢版2019/01/12(土) 21:23:54.55ID:4kOuee7Y
システム化にこそ価値が宿る
0037名刺は切らしておりまして垢版2019/01/12(土) 21:44:28.59ID:bl6GrAb2
Python簡単で便利だしな
情報工学の基礎を学んでない人でも扱える
0038名刺は切らしておりまして垢版2019/01/12(土) 22:03:11.01ID:PAeBiU62
じゃあなに、偉そうに書いている割に俺らと一緒でAPIをぽちぽち叩く人らなんだ
なんだそれ
0039名刺は切らしておりまして垢版2019/01/12(土) 22:12:15.59ID:03hknbTV
>>38
プログラミング環境はただの道具
実現したいことがさくっと実現できればそれでおk
と通りすがりのScheme使いが言ってみる
0040名刺は切らしておりまして垢版2019/01/12(土) 23:05:12.35ID:or34q7p2
>>11
主な理由の1つだな
もう1つは非常にとっつきやすくて、昔でいうperl的なニーズなんだと思う
0041名刺は切らしておりまして垢版2019/01/12(土) 23:06:28.94ID:or34q7p2
>>38
勝手に偉そうに感じてるだけだろ
単純な関数みたいには使いこなせんよ
0042名刺は切らしておりまして垢版2019/01/12(土) 23:21:51.98ID:Jk8z6VDP
お前らプログラムやってるのか知らんがデータサイエンティストはお前らと全く違う職種だから
言語ってスレタイで自分の領域だと勘違いして入るのはクルマの免許しかないやつがバイクスレに入るようなもん
0043名刺は切らしておりまして垢版2019/01/12(土) 23:37:58.42ID:yTAZ7IAR
Rの女
0045名刺は切らしておりまして垢版2019/01/12(土) 23:59:40.74ID:HhxoKhz8
>>11
何パーセントとか関係ないでしょ。
CにしろJavaにしろPythonにしろ言語作ったのは数人〜数十人とか。
それを何百万人ものプログラマが使ってる。

人数の多寡ではなく影響力。
影響力ある人が数人でも始めればそれが波及する。

アメリカで機械学習をやってる人たちってのは影響を与える側。
その人たちがPythonを使い出せば、新しいアルゴリズムの
ライブラリや機械学習の教科書のコードがPythonで書かれるようになる。
やがて他国の研究者もそのライブラリを使うためにPythonに乗り換える。

日本のITエンジニアが何言語使おうと世界に影響は殆どないけどね。
0046名刺は切らしておりまして垢版2019/01/13(日) 00:02:49.29ID:cXFUuuq3
>>42
ワロタ

確かに、
「車のほうが値段高いから俺のほうが偉い」
とか無意識に思ってそう。
0047名刺は切らしておりまして垢版2019/01/13(日) 00:07:23.78ID:wx3Zu4C3
>>42
データサイエンティストと組んで仕事してるけど
今時は理論だけじゃ仕事にならんよ
システムに組み込める形にできないと
0048名刺は切らしておりまして垢版2019/01/13(日) 00:12:37.48ID:GObm6Thu
python は perl5 の次のステップアップで覚えた言語
データ処理は出力がある程度まとまっている Rに任せてる
0049名刺は切らしておりまして垢版2019/01/13(日) 00:13:11.03ID:tG0QmgRX
クルマに例えるなら、日本でプログラマといって連想する人たちはタクシーやトラックの運転手に当たる。

で、日本に自動車メーカーがないようなもんだな。日本のIT業界を例えると。
クルマに関わる人は本来、メーカーの社員、大学の社員、レーサーとか色々いるけど、
タクシーやトラックの運転手しかないから国民は
「将来は車を扱うんだというと、トラックやタクシーの運転手しか連想できない」

あろうことか、そのトラックやタクシーの運転手たちが
「俺たちが車を一番運転してるから、車のことを一番分かってるんでい。
 トヨタの開発者?俺たちより運転してないだろ」
とメーカーの社員よりえらぶってる状況。それが日本のIT業界。
0051名刺は切らしておりまして垢版2019/01/13(日) 00:34:59.99ID:T2tvEFxv
>>49
分かる。
データサイエンティストとか聞いて、てっきり計算科学やってる人の事かと思ったら、
只の技術屋じゃん。
サイエンティストって。。。
0053名刺は切らしておりまして垢版2019/01/13(日) 00:53:09.41ID:Ci4YzD6F
>>52
AIやらディープラーニングやら目的が細分化して、その用途に合わせるためだったり、
プログラミングのパラダイムが変遷して、その変化に合わせたりとか、
プラットフォームの多様化して、固有のプラットフォームに特化したりとかで様々。

ただpythonは結構古い。もうすぐ30年になる。
0054名刺は切らしておりまして垢版2019/01/13(日) 00:59:43.61ID:6q6Qw5AL
Rってソフトウエアってイメージあったわ
0055名刺は切らしておりまして垢版2019/01/13(日) 01:00:22.03ID:yQoop5da
いやだからさ、アセンブラレベルで最適化したCモジュールやフレームワークを提供する側の人間かと思ったら
そのへんのプログラマ同様、pipかなんかで引っ張ってきたのをしょーもないプログラミング能力でAPIをぽちぽちだろ
これでサイエンティストとか名乗られても、ただのプログラマじゃん
0056名刺は切らしておりまして垢版2019/01/13(日) 01:02:03.59ID:rs+IoQeE
うちはブルジュアだからSAS
0058名刺は切らしておりまして垢版2019/01/13(日) 01:06:10.32ID:rk6nPjSo
>>55
一行目がプログラマで、サイエンティストはエンドユーザーかと
0059名刺は切らしておりまして垢版2019/01/13(日) 01:28:48.85ID:13OGwtBI
python自体は遅いけどnumpyのようなライブラリは早いじゃん
0061名刺は切らしておりまして垢版2019/01/13(日) 01:33:54.48ID:LP8DwHKq
>>55
> アセンブラレベルで最適化したCモジュールやフレームワークを提供する
これはエンジニアの仕事。サイエンティストの仕事では無い。

> pipかなんかで引っ張ってきたのをしょーもないプログラミング能力でAPIをぽちぽちだろ
サイエンティストはプログラミング能力で評価されるわけでは無い。
データサイエンティストならデータから有用な結果を引き出せるかどうかが評価のポイントだろ。
0062名刺は切らしておりまして垢版2019/01/13(日) 01:45:45.24ID:LP8DwHKq
ややこしいのは、新しい機械学習のアルゴリズムを作る
例えばヒントンのような人はコンピュータサイエンティストの
くくりの方が適切(多分)ってこと。

そういう意味でデータサイエンティストよりデータアナリストとか
統計技術者という言い方の方が適切なのかもしれない。
0063名刺は切らしておりまして垢版2019/01/13(日) 02:02:49.47ID:Xagx+4Vu
データサイエンティストとデータアナリストは別な
データアナリストはExcelでグラフ作ってプレゼンしたりする奴ら
データサイエンティストはRやPythonで予測モデルを作る奴ら
0064名刺は切らしておりまして垢版2019/01/13(日) 02:17:11.65ID:BC+9xAcO
データサイエンティストはエクセルも作るし、プレゼンもするぞ。モデルも作る

てか、エクセル作るためにモデル必要だし
エクセル作るだけの仕事なんてまずないだろ。それじゃただのコンサルじゃないの?

クライアントに寄り添ってデータ分析するのがデータサイエンティスト
彼らの実装をよりエレガントにエフェクティブにするのが機械学習エンジニア
その実装や必要なデータ整備を分散化、自動化するのがデータ基盤エンジニア

実際ははっきりとは分かれず
兼務してることが大半だと思う
特にデータサイエンティストと機械学習エンジニア
0065名刺は切らしておりまして垢版2019/01/13(日) 02:29:01.95ID:caw1iggm
 
データアナリスト = データを分析して傾向を割り出す
データサイエンティスト = データを分析して予測を立てる
機械学習エンジニア = 鑑別器の正解率を高めるように特徴量を際立たせる

こんな感じか?
0066名刺は切らしておりまして垢版2019/01/13(日) 02:34:11.89ID:yQoop5da
ヘボい
こんなんで年収がいいんだ、おれもデーターサイエンティスト()目指そうかな
0067名刺は切らしておりまして垢版2019/01/13(日) 02:47:16.83ID:BC+9xAcO
>>66
人間性スキルが必要だから
君には無理だよ
0069名刺は切らしておりまして垢版2019/01/13(日) 04:03:21.73ID:w+vTZU2B
>>14
なんか、いろいろとバカが滲み出ている発言だなw
0070名刺は切らしておりまして垢版2019/01/13(日) 04:08:52.57ID:YYj9J9ni
技術スレ特有の
上から目線のきもいヤツ湧きすぎ
0071名刺は切らしておりまして垢版2019/01/13(日) 04:26:14.26ID:PCzZ6H6e
π損もやっといた方がいいかなー
色んな言語に手を出すには日本人エンジニアの余暇は少なすぎるのだけど
0072名刺は切らしておりまして垢版2019/01/13(日) 04:31:17.45ID:k4IKoDS7
>>67
人間性スキル(爆笑)
0074名刺は切らしておりまして垢版2019/01/13(日) 08:25:50.71ID:QussHjZD
ライブラリ頼みでPython使ってるだけでデータサイエンティストとかw
0077名刺は切らしておりまして垢版2019/01/13(日) 09:19:31.15ID:4qHb4AL0
>>60
統計ではなくパターン化がデータサイエンティストの仕事

将来こうなるorこうするだろう、
っていうのが、データサイエンティストには読める
0078名刺は切らしておりまして垢版2019/01/13(日) 09:23:52.78ID:4qHb4AL0
>>69
おまえが無知なだけですよ

数字を読んで傾向を割り出すのがAIの仕事

傾向からパタン認識して未来予測するのがデータサイエンス
0079名刺は切らしておりまして垢版2019/01/13(日) 09:28:44.13ID:R/3igTmB
言語、言語言ってる連中は間違いなく素人。
プロのこだわりはドメイン設計とメッセージングとデザインパターン
これに尽きる。
0080名刺は切らしておりまして垢版2019/01/13(日) 10:18:03.32ID:VSzeClV0
>>18
実務経験ないんだろうけど。
海外じゃ理系だの文系だのといった馬鹿な区分けはないんだよ。

PythonもだけどR使ったことない学生なんて
勉強してないって自分から言ってるようなもんだし
外資じゃ絶対雇わないよ。
0083名刺は切らしておりまして垢版2019/01/13(日) 12:40:47.79ID:4VcpaMum
今メインはMatlab+Statistical Toolboxで計算してて,たまにR使うくらいなんだけど,
Pythonに置き換えるってのはなんかメリットある?
やってるのはMCMCとかの1000行くらいから10000行くらいの計算。
Matlab使いやすいからずっと使ってるんだけど,最近Pythonをよく聞くのでちょっと気になってる。
0084名刺は切らしておりまして垢版2019/01/13(日) 12:56:12.84ID:BC+9xAcO
論文読んでアルゴリズムを拝借するだけの
データサイエンティスト馬鹿にしてるくらいなんだから

きっと著名なアルゴリズムを生み出して
社会に貢献をしてるんだろうなあ
0085名刺は切らしておりまして垢版2019/01/13(日) 12:57:35.18ID:pSQYDZ7L
>>25
言語としても優れてるよ

実装したいアルゴリズムをコンパクトに記述できる
型定義や型変換など、アルゴリズムとは関係ない余計な記述が殆どいらない
インデントで構造が明確で、閉じカッコの様な余計な行が不要

pythonだと、人間はアルゴリズムに集中できる
他の言語ではコンパイラやインタープリターを支援する為に、どれだけ余計な記述を強いられているかがわかる
コードが読みやすいので、仕様書は要らず、数カ月前に書いたコードでも動作を思い出せ、改造が楽

職業プログラマーではない、サイエンティストにとって、最適な言語だ
0086名刺は切らしておりまして垢版2019/01/13(日) 13:07:38.53ID:4VcpaMum
>>85
そうかー,今MATLABで計算しているので,できるだけFORループを使わないように行列演算だけでなんとかならないかと苦戦してるんだけど,それもなくなるのか。
まあ,MATLABは関数の型宣言が全くいらず,いきなり行列を代入することができるのがむちゃくちゃ楽なんだけど。
でもアルゴリズムに集中できるというのはいいね。ちょっとインストールしてみようかな。
0087名刺は切らしておりまして垢版2019/01/13(日) 13:10:05.47ID:pSQYDZ7L
>>78
逆だろ

数字を読んで傾向を割り出すのはデータマイニングで、AIじゃない

また、データマイニングも、数字をそのまま入力して良い結果が得られるケースは殆ど無く、人間が数字を読んで前加工して、適切なマイニングツールを選ばなきゃならない
それがデータサイエンティスト

データサイエンティストが組んだ前処理とマイニングツールの組み合わせを使って、新たなデータから傾向を見出して、何かのアクションを自動化するのがAI
0088名刺は切らしておりまして垢版2019/01/13(日) 13:26:16.43ID:Ev0OzgOy
>>86
for loop使わずに行列計算したほうが早いのはpythonも同じ。
裏でどういう処理してるか考えれば分かると思うが。

pythonのnumpyっていう実質的な標準ライブラリを入れると、
MatlabやRと同じ行列演算ができるようになる。

matlab、R、python一通り使ってきたけど、
計算するだけならmatlabが一番楽だね。
環境が製品として閉じてるから。
pythonはプログラミングより環境構築が難しい。
0089名刺は切らしておりまして垢版2019/01/13(日) 13:31:25.77ID:Ev0OzgOy
>>83
別にMatlabで何の問題なくできてるなら、問題はない。

Pythonが好まれてるのはオープンだから。
Matlabは商用ソフトなんで誰でも使えるわけじゃない。
あなたが書いたコードを共有するときに問題になる。

新しいアルゴリズムがデファクトで、
pythonで実装されるようになりつつあるから、
次第にpythonを使わざるをえなくなる機会は増えていく
0090名刺は切らしておりまして垢版2019/01/13(日) 13:57:47.62ID:D4GElc6G
全部VBでできるだろ
VB.NETを使えっての
てか、データサイエンティストって何なんだよ
0091名刺は切らしておりまして垢版2019/01/13(日) 14:06:41.60ID:4VcpaMum
>>88
>>89
ありがとう。つまり年間10万くらいMathworksにお布施してるのは意味があるってことか。
まあ,俺が作ったFFTのCのプログラムよりインタプリタのMatlabのFFTのほうが速かったときは
びっくりしたもんな。やっぱり売り物はよくできてるってことか。

>>90
お前はマシン語でもやってろ。何でもできるぞ。
0092名刺は切らしておりまして垢版2019/01/13(日) 15:03:08.00ID:YWud//Y+
dplyrが出てからpythonでなくてもRは前処理楽になったよ。
Rとpython両方できてないと他人のコード読めないので、片方だけという
人は少ない
0093名刺は切らしておりまして垢版2019/01/13(日) 15:07:18.43ID:K7d3Qawg
では、>>90は我々低レベルプログラミング勢が貰い受ける
まずIntelの仕様書を渡すところから始める
0094名刺は切らしておりまして垢版2019/01/13(日) 15:39:11.20ID:pSQYDZ7L
>>89
計算するだけならmatlabやRで良い事に同意

その計算モジュールをWebAPIやMQ等で他のモジュールと連携させたり、MongoDBやRedis等のDBを読み書きしたりと、システム化してAIにするには、pythonの方が便利

要は、バッチでデータ処理してた時代から、クラウドでAIする時代に変わり、pythonがトップになったんだと思う
0095名刺は切らしておりまして垢版2019/01/13(日) 15:46:50.50ID:RuWdLfwG
ExcelとRで回帰分析しかできないようなのはなんちゃってデータサイエンティスト。
それでもデータで経営層を動かせるからプログラマーより評価されるだけ。
0096名刺は切らしておりまして垢版2019/01/13(日) 16:45:22.54ID:maVCz2LA
なんだよ
回帰分析って
そんなの知らねーよ
0097名刺は切らしておりまして垢版2019/01/13(日) 16:46:48.10ID:4VcpaMum
>>95
違う。ExcelとRで経営層を動かせるほどの結果が出せる奴がすごい。
あくまでも統計的手法は道具であり,よい道具を使ったらよい結果が出るわけではない。
すごいデータサイエンティストは,道具がすごいのではなく,データを見抜く力がすごい。
思ってもみなかったものに,ものすごく単純な統計的手法を適用して,びっくりする結果を出す。
これがほんとのデータサイエンティスト。
0099名刺は切らしておりまして垢版2019/01/13(日) 17:09:33.65ID:d2U21Etj
>>61
>データから有用な結果を引き出せるかどうか

ホントにな
言語とか正直どうでもいいだろ
カンタンにミスなく書けてデータが取り回せれば
・・・行きつくとpハックの話もあるけど(白目
0100名刺は切らしておりまして垢版2019/01/13(日) 17:13:09.10ID:kxpdShTD
データオナニスト職にはどんな言語が求められるの?
0102名刺は切らしておりまして垢版2019/01/13(日) 17:32:33.57ID:rhsezMRT
>>100
すごいH本を読んでマサカリマスターになることが求められる
パイソンのインデントが好きならオナニストへの道はおのずと開けよう
0105名刺は切らしておりまして垢版2019/01/13(日) 19:23:23.14ID:+BOauHG8
Rは時代の敗北者じゃけえ
0107名刺は切らしておりまして垢版2019/01/13(日) 19:47:59.32ID:V2X5Wl0W
>>100
ヘブライでヤハウェ様にオナンの罪を詫びる
0109名刺は切らしておりまして垢版2019/01/14(月) 01:07:16.91ID:ANYUp8A4
抽象的な話じゃなくてデータサイエンティストのすごい論文って具体的にどれよ
0110名刺は切らしておりまして垢版2019/01/14(月) 02:56:00.78ID:DWDpj2yF
>>6
R は Pythonに輪をかけて遅い。
Python自体はスクリプト言語だからメチャ速くはないけどCで書かれたnumpyやpandasをうまく活用してPythonはそういった外部ライブラリを繋ぐ糊だと考えればいい。
0111名刺は切らしておりまして垢版2019/01/14(月) 09:11:53.57ID:VFbIvcx/
>>110
思うんだけど、matlabとかR使ってる研究者って
競争に負けないように、GPGPUとか3Dハードウェアアクセラレーションを使える
高度なソフトを勉強しようとは思わないのかね?
0112名刺は切らしておりまして垢版2019/01/14(月) 09:45:33.15ID:+vGczbyk
>>111
matlabとかRってGPU使えないの?
0114名刺は切らしておりまして垢版2019/01/14(月) 10:43:03.42ID:DXceOEIq
>>103
人工知能を研究している人間の中には、マジでそういう能力持ってるやついるらしいな。
0115名刺は切らしておりまして垢版2019/01/14(月) 10:44:03.49ID:DXceOEIq
>>113
無料じゃないなら意味なし。
片手落ちだよ。
0116sage垢版2019/01/14(月) 10:53:44.11ID:GZJXSzNG
>>115
>無料じゃないなら意味なし。
年収2000万ごえのプログラマーの意見ではないな?
0117名刺は切らしておりまして垢版2019/01/14(月) 10:56:34.57ID:YEh02L37
>>111
CPUとGPGPUで計算結果に相違が出るなんてしょっちゅうだし
GPGPU上で使えるライブラリ激減するし
使えるメモリ明らかに減るしで
使い所がかなり限定されるものに大金出すアホはそうそういないw
0118名刺は切らしておりまして垢版2019/01/14(月) 11:04:30.82ID:12jd86v2
>>110
別に研究者全員がごりごりの計算屋じゃないんだって。
MATLABだと10秒かかる計算をCだったら1秒以内だからって,
わざわざコンパイラ通すプログラム作るより楽でしょ?
俺の場合はMATLABで10時間以内で計算できるんだったら,MATLAB使うかな。
プログラムできてしまえば,一晩置いとけばいいからね。
CはMATLABじゃ数日かかってしまうようなものオンリーだな。
俺はプログラマーとしては素人同然なので,配列の面倒くさいポインターとかを考えるの嫌なんだよ。
0119名刺は切らしておりまして垢版2019/01/14(月) 11:09:59.92ID:ILDDor57
データサイエンスに求められるレベルが違うんだよなあ
pythonができる人がただ、データーを半分にして重回帰しただけのものを機械学習って言われてもただ、条件分岐を数学的にやってるだけ
Rは統計ができる人が使うからデータサイエンスとしてのレベルが違う
0120名刺は切らしておりまして垢版2019/01/14(月) 11:11:09.30ID:VFbIvcx/
>>118
時代はGPUからFPGAに代わってきているし、Cみたいな高級言語覚えてもあんま意味ないよね
そう思ったとき、色々手早く動作テストするのには、適当に使える楽なPythonがいいという話になる
0121名刺は切らしておりまして垢版2019/01/14(月) 11:14:59.42ID:vGJIuwdy
R使う研究者とか、Python使う研究者とかそういうのはいないよ。
俺は研究者だけど、R, MATLAB, Python, C/C++, Java この辺は一通りできる。
周りもだいたいそう。
その時その時で使うライブラリによって使い分けてるだけ。
0122名刺は切らしておりまして垢版2019/01/14(月) 13:18:02.39ID:GDo+WvWK
底辺が大好きな言語やん
0123名刺は切らしておりまして垢版2019/01/14(月) 13:20:30.55ID:Z9j0/HNp
そりゃあそうだろ
研究者ならそれで別にいいけど
ビジネスでは全く違うから

研究者の世界を
ビジネスに持ち込まれても困るし
逆もまた然り
0124名刺は切らしておりまして垢版2019/01/14(月) 13:30:33.41ID:vGJIuwdy
>>123
ビジネスって言ったら全部ビジネスだよ。研究もビジネス。
プログラミングが関わってくる仕事は、
基礎研究、統計解析、商用開発、委託開発などなど色々あるってだけの話。
0125名刺は切らしておりまして垢版2019/01/14(月) 13:58:50.84ID:+vGczbyk
>>117
CPUとGPUの計算結果が異なることが問題になるって、
アルゴリズムがピーキーすぎんか?
0126名刺は切らしておりまして垢版2019/01/14(月) 14:12:44.47ID:MQZICMLT
>>2
それでいうと、現場を知らないと問題意識が芽生えないので、データの関係だけを明らかにはできるかもしれないが、意味のある分析はできない
0127名刺は切らしておりまして垢版2019/01/14(月) 16:19:26.23ID:cVDGiTvv
>>90
ワロタ
0128名刺は切らしておりまして垢版2019/01/14(月) 16:27:07.46ID:YEh02L37
>>117
アルゴリズムじゃなくてハードウェアの構成の違い
CPUとGPGPUとじゃ内部の加減乗除の計算順も
変わってくるから下数桁の違いなんてザラ

そんなもんだと割り切れる分野なら良いけど
カオス現象みたいに違いが深刻になる分野じゃ使えない
0130名刺は切らしておりまして垢版2019/01/14(月) 16:50:56.68ID:/UEfQiSk
日本語で会話しろよ。
さっぱりわからんぞ…
0131名刺は切らしておりまして垢版2019/01/14(月) 17:16:03.31ID:nQ4YlO+g
カオス現象は微細な数値の差で全体の挙動が歴然と違ってしまうから桁処理とかちゃんと揃えないとダメですって話だと思われ。。。
0132名刺は切らしておりまして垢版2019/01/14(月) 17:31:27.77ID:CoKRUuad
ハード、特にセンサーをいじれないからデータサイエンティストなんてクソ。
0133名刺は切らしておりまして垢版2019/01/14(月) 18:28:34.70ID:M0b3RSoy
R言語はデータ整形に使ってるけど
エクセル以上Python未満で使い所よく分からないイメージ
0134名刺は切らしておりまして垢版2019/01/14(月) 19:41:19.60ID:12jd86v2
>>132
あのね。ハード,特にセンサとか言ってるけど,話してるレベルが全然違うの。
センサっていうのはどのようにしてデータ取るかって手法なんだよ。
データ取得まで解析者がかかわれるなら,解析手法に合ったデータとりゃいいだけなの。
データサイエンティストってのは,ありもののデータをどうやって料理するのかっていう仕事なんだよ。
データはもうそこにあるんだよ。解析に向いていないノイズだらけのデータからいかにして
情報取り出すかって仕事なの。
0135名刺は切らしておりまして垢版2019/01/14(月) 20:04:54.12ID:+vGczbyk
>>128
カオスならそんなに神経質にならなくても良いんじゃ無い?
結果がカオスなのが当然なんだから。
そもそも、CPUだって仮数部52bitとかで切り捨ててるんだし。
0136名刺は切らしておりまして垢版2019/01/14(月) 20:34:40.84ID:hHdDfb9c
>>135
カオスだから滅茶苦茶でも良いわけじゃないよ?
初期値鋭敏性で結果が大きく変わって行くってだけで、それでも決定論的なのがカオスなんだから
同じ初期値なら一定時間後の結果は同じものが計算されてるって前提で計算出来なきゃ
計算してる意味無いよ
0137名刺は切らしておりまして垢版2019/01/14(月) 20:51:57.16ID:+vGczbyk
>>136
それ、CPUが変わったら結果変わりました
じゃ意味なくね?
0138名刺は切らしておりまして垢版2019/01/14(月) 21:16:36.93ID:hHdDfb9c
>>137
そうならないように精度保障とか使うんだけどさw

精度保障とかやってもCPUとGPGPUはアーキテクチャの違いが大きいから
同じ初期値でCPUかGPGPUかで違う結果が出てくる可能性がある事が問題なわけよ
0139名刺は切らしておりまして垢版2019/01/14(月) 21:18:03.41ID:CoKRUuad
>>132
そんなこと言ってるから仕事にならない。
0140名刺は切らしておりまして垢版2019/01/14(月) 21:20:14.98ID:CoKRUuad
システムを考えられない下請け屋がデータサイエンティストじゃん。
0141名刺は切らしておりまして垢版2019/01/14(月) 21:25:28.19ID:CoKRUuad
>>90
言いたいことはわかる。CかアセンブラでDLL作らないと悲惨なほどに遅い。
PythonもDLLを作ったほうが速い。
同じようなもんだよ。
0142名刺は切らしておりまして垢版2019/01/14(月) 21:39:45.26ID:U/LfWCmZ
RとPythonじゃちょっと用途が異なるんじゃ?
0143名刺は切らしておりまして垢版2019/01/14(月) 21:41:43.69ID:U/LfWCmZ
じゃあJuliaで。
0145名刺は切らしておりまして垢版2019/01/15(火) 00:19:23.55ID:vnQAN2JM
>>134
捏造ですね。わかります by 厚生労働省
0146名刺は切らしておりまして垢版2019/01/15(火) 05:20:40.65ID:onYs7G8q
ロシアとか韓国のような弱小国を相手にするときは
 (ロシアのGDPは、韓国より少ない)
相手国のトップ(プーチン)以外は無視でいい!
  決済権限の無い下っ端ペーペーの 
  ふんどし担ぎのすっとこどっこいの
  何も知らない馬鹿な小役人(外相)
なんか相手にしても、時間の無駄である!
かまってやれば、付け上がるだけだ
0148名刺は切らしておりまして垢版2019/01/15(火) 22:28:57.64ID:1NZLSlBE
データサイエンティストに将来がないと思いますよ。
GAFAのような起業をできなければプログラマと同じような労働者としてこき使われる事になるでしょう。
システムやビジネスがわからないからこそデータサイエンティストでいるわけでしょう。
0149名刺は切らしておりまして垢版2019/01/16(水) 01:32:25.24ID:5qfxudTu
>>48
プログラマもピンキリ,データサイエンティストもピンキリ。
単にそれだけ。
0150名刺は切らしておりまして垢版2019/01/16(水) 02:59:29.33ID:NnhXOF4C
>>120
Cはpythonと比べたら低級言語だろw
0151名刺は切らしておりまして垢版2019/01/16(水) 09:32:24.97ID:m7SIPnwH
>>148
データサイエンティストという肩書の人は上流で仕事をしてるから奴隷にはならない。
PGに例えると、大企業に入ってパワポ職人をしてる高学歴と同じ
0152sage垢版2019/01/16(水) 17:37:01.45ID:Yetqe6QR
>>151
>大企業に入ってパワポ職人をしてる高学歴
ウチの会社には,そんな奴はいないぞ。
今の世の中,それが許される会社があるのかい?!
0153名刺は切らしておりまして垢版2019/01/17(木) 01:07:03.23ID:9SsBocjv
世の中のこと
何もわかってない奴ばかりだね

そりゃ薄給にもなるわな
0155名刺は切らしておりまして垢版2019/01/17(木) 19:33:46.76ID:0ujw0n2R
データサイエンティストって楽?
0156名刺は切らしておりまして垢版2019/01/18(金) 00:35:34.99ID:yJ75/y2S
>>154
進化っていうかS言語をフリーで使えるように実装したのがRだよ
0157名刺は切らしておりまして垢版2019/01/18(金) 04:10:15.01ID:vMeDuAr6
言語としてはどちらもフリーだろ。
Sのフリー実装がRではなく進化してるんだろ。劣化もしてる部分あるかもしれないが詳しく知らない。
0159名刺は切らしておりまして垢版2019/01/18(金) 20:52:26.94ID:P0xSJ0wO
データサイエンティストとか、ゴリゴリの下流PGでしょ
0160名刺は切らしておりまして垢版2019/01/18(金) 21:25:05.11ID:ATQ6JO0O
>>1 >>2 >>3 >>4 >>5 >>6
>国家運営のシミュレーションゲームとして考えると、
>構成員を決める場面では日本の人口・国土の規模から言って
>単純な力仕事を担う低コスト労働力は必ず大量に要るんだから

日本は典型的な国内産業に依存する重商主義国だからそういう偏った思考法となる
国内に優秀な人材プールを持つことで、人材不足の成長中の外国企業に進出させ、そこから雇用を生まれさせるという考えがない

https://en.wikipedia.org/wiki/List_of_countries_by_received_FDI

1 Netherlands   4,888,000
2 United States   4,084,000
3 United Kingdom 2,027,000
— Hong Kong    1,901,000
4 China       1,514,000
5 Ireland      1,477,000
6 Germany     1,455,000
7 Singapore    1,285,000
8 Switzerland   1,230,000
9 Belgium     1,093,000
10 Canada     1,045,000
11 France      842,500
12 Brazil      778,500
13 Spain      772,100
14 Australia     647,700

日本にインド並にコンピューターサイエンス科、電子工学科卒のプログラマーがいたら
もしくは機械工学、制御工学、ロボット工学でも良いが人材が多くいるのであれば
国内にソフトウェア産業やロボット産業、プラットフォーマーが無くとも、外資が進出してくれるので雇用が生まれて税収や福祉財源も増える

もちろん輸出企業は維持すべきではあるが、外資の雇用が増えれば日本企業の盛衰に対する完全な依存はなくなり、
国内産業が敗北・衰退しても破滅的なリスクの回避ができる
実際のところ、欧州のアメリカの同盟国はこうした戦略で自国産業に過度に依存せずに、それなりに繁栄してきた

英語というバリアーもあるが、理系の使う英語は現実問題大したものではないし、国内に対する開発拠点を外資が投資するなら全員が英語を流暢に話せる必要はない
最大の問題は解雇規制・解雇法理による大企業のぬるま湯と、専門家になることによって著しく損となる文化によって知識集約産業に人材がいないことと、文系が多すぎて工学系の絶対数が少ないことだ
0161名刺は切らしておりまして垢版2019/01/18(金) 21:50:00.13ID:ATQ6JO0O
https://investinholland.com/foreign-direct-investment-accounted-for-more-than-12500-jobs-in-2017/

US companies lead employment creation
As in 2016, the majority of ‘foreign’ jobs were created by companies from the United States. NFIA results for 2017 indicate some 2,516 jobs created by US companies, bringing 110 million euros in investments.
Companies from within Europe also provided a substantial number of jobs (2,879), including the UK (872). Japan and India provided 655 and 423 jobs, respectively.
Majority of jobs from foreign investments in 2017 came from creative industries such as fashion and entertainment & media (2,126).
Additional jobs by sector include agrifood (1,788), IT (1,219), life sciences & health (600) and business services (457).
0162名刺は切らしておりまして垢版2019/01/19(土) 00:58:40.79ID:c3WkFCgj
>>159
そう?
あまりハードよりではないと思うが
0163名刺は切らしておりまして垢版2019/01/19(土) 04:10:44.61ID:6xlfY5b3
データサイエンティストって相撲は八百長って言ってる人だと思ってたw
0164名刺は切らしておりまして垢版2019/01/19(土) 17:11:13.43ID:bHr/hZG3
C++とRとLABVIEWだけで生きて行きたい
0166名刺は切らしておりまして垢版2019/01/19(土) 17:25:01.27ID:Y7OxPwcj
改竄省みたいに関数間違えてオッケー
0167名刺は切らしておりまして垢版2019/01/19(土) 17:36:58.93ID:xUyOZKql
>>152
大企業の話だよ。
0168名刺は切らしておりまして垢版2019/01/19(土) 17:37:50.24ID:xUyOZKql
>>163
相撲は興行だよな。
0169名刺は切らしておりまして垢版2019/01/19(土) 17:38:11.59ID:DHeB5QwE
自称データサイエンティストがマウントしあう会場はこちらですか?
0170名刺は切らしておりまして垢版2019/01/19(土) 17:54:28.01ID:yUKonLxz
今データサイエンティスト増やし過ぎて資質ないやつが死ぬほど多いな
定量論だけで速攻で論破できてしまうから全くビジネスにならん
0171名刺は切らしておりまして垢版2019/01/19(土) 18:02:02.02ID:0/YJEt+5
データサイエンティストの世界の話ですからね
勘違いして一般的にソフト開発のスタンダードだと思わないようにw

目的がアプリなのにアセンブラ勉強してしまうようなもの
確かに同等の事は出来るけどね。
でもそれを言ってしまえば、どの言語だって同じw
0172名刺は切らしておりまして垢版2019/01/19(土) 18:09:27.90ID:HXhwnV9F
>>164
あなたは評価エンジニアですか?
それで充分ですよ

コードが書けるなんてのはプログラマーであって
データサイエンティストじゃない
0173大島榮城 ◆n3rBZgRz6w 垢版2019/01/19(土) 18:17:49.88ID:xvzzCjG0
なんでπ損なのか
0174名刺は切らしておりまして垢版2019/01/19(土) 18:34:51.23ID:fpW9vzyg
PypeR でPythonからR使えるという話を聞いたけど
多分制約があるんだろうなということでやらない
0175名刺は切らしておりまして垢版2019/01/20(日) 09:33:21.17ID:M+ISAwcn
いわゆる"職業プログラマ"の使うものじゃない
科学者はPythonやFortranなどの超高級言語を使う
成果物アプリやソフトとして売るわけではない

(Pythonは多次元配列に事実上ライブラリ必要だけど)
0176名刺は切らしておりまして垢版2019/01/20(日) 09:44:59.11ID:M+ISAwcn
numpyは冗長な機能を削ればコンパクトだし取り込んでもいいと思うけどな
FortranやMatlabライクな部分配列指定やufunc演算を模倣できて便利

まだスライスとufuncがFortranに比べれば物足りない、
CoArr(始:終:刻,…)[プロセス始:終:刻,…]
ユーザー定義のスカラー関数に配列を渡せるufuncもまだ限定的なサポート(Fortranではelemental宣言)
0177名刺は切らしておりまして垢版2019/01/20(日) 09:46:42.94ID:M+ISAwcn
ポスドクだけど周りではPython、Matlab、Fortranが三強
0178名刺は切らしておりまして垢版2019/01/20(日) 09:50:15.98ID:M+ISAwcn
Pythonは小回りが効くのが買われている、速度や機能で踊るFortranとMatlabと張り合えるのは、これらが雑務をサポートしていないから
Pythonはスクリプトとして一般用途にも使えるから、科学者コミュニティ以外でも使われる
よって使う人の頭数が多くなる
0179名刺は切らしておりまして垢版2019/01/20(日) 09:55:49.80ID:M+ISAwcn
在野では有償Matlab代替としてのOctaveと、Rが二番手と感じる
0180名刺は切らしておりまして垢版2019/01/20(日) 09:58:38.34ID:M+ISAwcn
>>138
精度保証はPython+mpmathが便利だね、愛用してる
四倍精度をまともに扱えるのは今のところFortranだけだと思う
高ければいいわけじゃなくて、保証は別に必要で面倒だけど
0181名刺は切らしておりまして垢版2019/01/20(日) 10:01:30.89ID:M+ISAwcn
Pythonの高精度計算ライブラリの標準mpmathは任意精度が指定できるけど、
実装のネイティブコード割合が少ないので大規模にはちと辛い
SciPyコミュニティの活発さを少しだけ分けて欲しい
0182名刺は切らしておりまして垢版2019/01/20(日) 10:08:22.74ID:M+ISAwcn
Python+Sageも有望だと思うけど、Pythonをコアにした独自言語という色合いが濃い
正直取っ付きにくい

数値計算ではない部分、特に数論的扱いに関してはPythonに限らずあらゆるサイエンス向け言語の中でずば抜けてる(環などの代数系を定義できる)
Magmaなど著名な処理系を手当たり次第統合してるからだけど…

素のPythonから引けるようにライブラリとしてリリースしてほしい
0183名刺は切らしておりまして垢版2019/01/20(日) 10:22:41.92ID:LJonikZS
HELOOワールドの数値計算版は円周率かと
Pythonで100万桁とかできるか?
0184名刺は切らしておりまして垢版2019/01/20(日) 15:53:25.85ID:/oYDP5aw
RとPythonの対比ならSPSSやSASの話も出る気がするけど
出ないな
0186名刺は切らしておりまして垢版2019/02/14(木) 09:26:31.06ID:XsVvXUPS
過去現在未来においてもマッドサイエンティストが時代の最先端であり未来を作ってきた訳でそっちの需要について分析したら?
0188名刺は切らしておりまして垢版2019/03/02(土) 11:12:35.38ID:vZ1ao34J
>>88
pythonの環境構築は
anacondaインストールだけで済んでめっちゃ楽だったけど
0189名刺は切らしておりまして垢版2019/03/02(土) 11:51:26.46ID:r4akEEII
PythonはwebデザイナーがjavaScriptをかじるのと似ていて自分の業務に最重要ではないけど必要だから使う感覚だろう。
ゴリゴリのエンジニアリングとしてメインに選択したい代物ではない。
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況