【IT】データサイエンティスト職に求められる言語のトップに「Python」--「R」を上回る
■ このスレッドは過去ログ倉庫に格納されています
「Python」と「R」はデータサイエンティスト職の求人で最も多く要求されるスキルに数えられている。ところが、こうしたプロフェッショナルの仕事で最も頻繁に使用されているプログラミング言語について調査した複数の報告書によると、実際は評価が分かれるという。Cloud Academyの米国時間12月27日付の報告書で明らかになった。
まず、TIOBE Programming Community Indexによれば、2018年の検索エンジンのリクエスト数でみたRの順位は下降気味だったという。だが、データプロフェッショナル1万6000人を対象に実施したKaggleの調査では、全体で最も人気の高いプログラミング言語はPythonであるものの、統計およびデータサイエンティストは他のどの職務よりも業務でRを使用している割合が高いことが分かった。データサイエンティストの87%はPythonを、71%はRを業務で使用していると回答していると、同報告書に記
以下ソース
https://japan.techrepublic.com/article/35131060.htm データサイエンティストに求められるのは言語ではない
数字を読む能力なのに
Rは統計データを扱うのに特化した言語であって
システムを組むには不向きなだけだろ データをnumpyとかpandaとかに整形するのがめんどいんじゃ糞が Python 遅いけど、、
使いやすいし、便利なライブラリも多い。 基本をC、ライブラリは都合のいいもの。今はたしかにPython。
Rは統計というかデータベース用だとおもう。 最近は機械学習系のライブラリがみんなPythonだからな
イヤでも使うしかない >>10
>最近は機械学習系のライブラリ
プログラマー全体の何パーセントが,「機械学習系のライブラリ」を
使用するのか? これがPythonの人気の主な理由とは思えない! その辺の言語は文法が少し違うだけで
どれも同じだよ >>11
この記事はデータサイエンティスト限定の話だし
もちろん他の用途では事情は変わってくるだろうね
機械学習いらんってことなら、別の言語でも全然構わないだろう
ちなみにPythonでプログラム書いてWebサイトを立ち上げようとすると
素のApacheですぐに動かないから微妙に面倒くさい
Djangoとかのフレームワークを使う手もあるけど、
それぞれにクセがあって多少手間がかかる
最後は何を作りたいかで決まるでしょう numbaじゃなくてpsyco復活してほしい
cythonがまぁまぁ使いやすい Rを使うのは昔の文系統計屋だけ
データサイエンティストはRなんて使わないわな assembler, bash, basic, c, cobol, java, perl, php, python, PL/M
人生最後の言語はrustだと思いたい データ解析といえばSASじゃないの?時代は変わったな でもモジュール作る人はc/c++じゃないの?
データサイエンティストと言う人らはフロントだけを作るの? これはおかしい
Pythonが言語として優れてるわけでなく、グーグルとか多数企業が
数値計算、AI関連のモジュールもあとから追加したからだろ。
Javascriptでもよかった なぜ機械学習にPythonが選ばれるのか
Google AppEngineの開始当初(2008年4月)にPythonをサポートしていた際には、なんでPythonなんだろうと軽く調べ、教育用として海外では普及しているという認識だった。
2012年〜2013年頃にデータサイエンスがバズワードとなり機械学習する上でR言語と次点でPythonという感じだったと思う。
そして昨今はPython一色になってきている。
私としては何故このように科学計算分野のライブラリが作成され強化されるように至ったのかを知りたくなり歴史から調べてみました。
RubyがRailsにより注目されたように、Pythonでは当初数値コンピューティング用に設計されたものではなかったがリストの概念や関数型言語の基本機能を実装したこと、
Jim Fulton氏(元ZOPE社CTO)が多次元配列・行列ライブラリ「Matrix Object in Python」を開発したことで、
早い段階(Python 1.0から1年後)で科学/エンジニアリングコミュニティに注目され「Matrix-SIG」が設立、
後の「NumPy」が紆余曲折(Numeric(1995年)とNumArray(2001)を統合)を経て2005年にリリースされた。
また幾つかの科学計算用ライブラリをパッケージ化した「SciPy」が2001年にTravis Oliphant氏らによりリリースされた。
その後はEnthought社が2001年に米国で設立され、SciPyをベースにツールやパッケージやサポートを提供、また科学技術計算向けの「SciPy Conference」と呼ばれる会議の開催を支援して行く。
Pythonが、科学技術計算で使われるようになるであろう理由のもう一つに着目した。
オープンソースプロジェクトは開発リソースが限られ、開発の中心メンバーが何らかの理由で参加しなくなった場合、一気にそのプロジェクトが衰退する場合があるが、
特に科学技術計算関係のパッケージについては民間企業が本格的にサポートとしており、オープンソースソフトウェアとして公開する体制が整っている。
民間企業の代表的なのが、Enthought社とContinuum Analytics社である。
Enthought社は科学技術計算用パッケージ群「Scipy Stack」を提供し、科学技術計算向けの「SciPy Conference」と呼ばれる会議の開催を支援している。
Continuum Analytics社はPythonディストリビューション「Anaconda」を提供し、データ分析向けの「Py Data」と呼ばれる会議の開催を支援している。
また、GoogleもPython作者のGuido van Rossum氏を2005年に雇用したり、「Google Summer of Code」というオープンソースの開発に資金を提供するプロジェクトを2005年に作成し、
機械学習ライブラリの「scikit-learn」や多変量回帰分析・時系列分析ライブラリ「statsmodels」がリリースされています。
科学技術計算分野のキーマンは、「SciPy」と「NumPy」の作者でもあるTravis Oliphant氏であろう。
http://qiita.com/yaju/items/5502115d7e3d06e6bbdd 普段業務でR言語を利用するなんて日本なわけないと思ったらやっぱり日本じゃなかった >>27
別に日本でも使うだろ。
研究者やデータサイエンティストとかなら。
ITドカタだけが仕事でプログラミングしてるわけじゃねーんだぞ >>22
機械学習とかはサーバサイドだろ。
サーバでPythonが動き、C/C++で書かれてコンパイルされたライブラリーを呼び出す。
サーバサイドのフレームワークはPHP/Ruby/Pythonあたり。
フロントエンドではJavascript/HTML/CSSが動き、
C#とかJava書かれたソフトも動いてるかもしれん。
今時1つの言語じゃ大したことできねーぞ。 >>29
仕事で使ってるんだぞ?立派な業務使用。
商用ソフトのクオリティではないだけの話。
そこは目的が違うだけ。
英語で言ったら「英語は通訳しか仕事で使わない」
と言ってるようなもん 日本のプログラマに多い、
SIとかでクライアントの社内システムしこしこ作ってるようなのが、
むしろプログラマーの中では底辺だからな。 Rかじった程度の統計の人やプログラム未経験だけどとにかくクエリは自力でかけますみたいな人たちにとっては取っつきやすいみたいですね
純粋なプログラマーにはクソ言語にしか見えない 純粋なプログラマーって言い方が謎だが、
プログラミングそのものでお金をもらってるのと、
何か成果を出すためにプログラミングをツールとして
使ってる人ではそりゃ見方が違うだろ。 >>30
全体でみればそうかもしれないが。
データサイエンティストとして要求されるのはPythonにほぼ限定されるかと。
機械学習とかAIはPythonでやって結果は別人、グループへ。 Python簡単で便利だしな
情報工学の基礎を学んでない人でも扱える じゃあなに、偉そうに書いている割に俺らと一緒でAPIをぽちぽち叩く人らなんだ
なんだそれ >>38
プログラミング環境はただの道具
実現したいことがさくっと実現できればそれでおk
と通りすがりのScheme使いが言ってみる >>11
主な理由の1つだな
もう1つは非常にとっつきやすくて、昔でいうperl的なニーズなんだと思う >>38
勝手に偉そうに感じてるだけだろ
単純な関数みたいには使いこなせんよ お前らプログラムやってるのか知らんがデータサイエンティストはお前らと全く違う職種だから
言語ってスレタイで自分の領域だと勘違いして入るのはクルマの免許しかないやつがバイクスレに入るようなもん >>11
何パーセントとか関係ないでしょ。
CにしろJavaにしろPythonにしろ言語作ったのは数人〜数十人とか。
それを何百万人ものプログラマが使ってる。
人数の多寡ではなく影響力。
影響力ある人が数人でも始めればそれが波及する。
アメリカで機械学習をやってる人たちってのは影響を与える側。
その人たちがPythonを使い出せば、新しいアルゴリズムの
ライブラリや機械学習の教科書のコードがPythonで書かれるようになる。
やがて他国の研究者もそのライブラリを使うためにPythonに乗り換える。
日本のITエンジニアが何言語使おうと世界に影響は殆どないけどね。 >>42
ワロタ
確かに、
「車のほうが値段高いから俺のほうが偉い」
とか無意識に思ってそう。 >>42
データサイエンティストと組んで仕事してるけど
今時は理論だけじゃ仕事にならんよ
システムに組み込める形にできないと python は perl5 の次のステップアップで覚えた言語
データ処理は出力がある程度まとまっている Rに任せてる クルマに例えるなら、日本でプログラマといって連想する人たちはタクシーやトラックの運転手に当たる。
で、日本に自動車メーカーがないようなもんだな。日本のIT業界を例えると。
クルマに関わる人は本来、メーカーの社員、大学の社員、レーサーとか色々いるけど、
タクシーやトラックの運転手しかないから国民は
「将来は車を扱うんだというと、トラックやタクシーの運転手しか連想できない」
あろうことか、そのトラックやタクシーの運転手たちが
「俺たちが車を一番運転してるから、車のことを一番分かってるんでい。
トヨタの開発者?俺たちより運転してないだろ」
とメーカーの社員よりえらぶってる状況。それが日本のIT業界。 細かなところで言語仕様がイラッとくるから好きじゃない >>49
分かる。
データサイエンティストとか聞いて、てっきり計算科学やってる人の事かと思ったら、
只の技術屋じゃん。
サイエンティストって。。。 なんで電子マネーみたいに無駄にポコポコ新言語作るんだ? >>52
AIやらディープラーニングやら目的が細分化して、その用途に合わせるためだったり、
プログラミングのパラダイムが変遷して、その変化に合わせたりとか、
プラットフォームの多様化して、固有のプラットフォームに特化したりとかで様々。
ただpythonは結構古い。もうすぐ30年になる。 いやだからさ、アセンブラレベルで最適化したCモジュールやフレームワークを提供する側の人間かと思ったら
そのへんのプログラマ同様、pipかなんかで引っ張ってきたのをしょーもないプログラミング能力でAPIをぽちぽちだろ
これでサイエンティストとか名乗られても、ただのプログラマじゃん >>55
一行目がプログラマで、サイエンティストはエンドユーザーかと python自体は遅いけどnumpyのようなライブラリは早いじゃん >>55
> アセンブラレベルで最適化したCモジュールやフレームワークを提供する
これはエンジニアの仕事。サイエンティストの仕事では無い。
> pipかなんかで引っ張ってきたのをしょーもないプログラミング能力でAPIをぽちぽちだろ
サイエンティストはプログラミング能力で評価されるわけでは無い。
データサイエンティストならデータから有用な結果を引き出せるかどうかが評価のポイントだろ。 ややこしいのは、新しい機械学習のアルゴリズムを作る
例えばヒントンのような人はコンピュータサイエンティストの
くくりの方が適切(多分)ってこと。
そういう意味でデータサイエンティストよりデータアナリストとか
統計技術者という言い方の方が適切なのかもしれない。 データサイエンティストとデータアナリストは別な
データアナリストはExcelでグラフ作ってプレゼンしたりする奴ら
データサイエンティストはRやPythonで予測モデルを作る奴ら データサイエンティストはエクセルも作るし、プレゼンもするぞ。モデルも作る
てか、エクセル作るためにモデル必要だし
エクセル作るだけの仕事なんてまずないだろ。それじゃただのコンサルじゃないの?
クライアントに寄り添ってデータ分析するのがデータサイエンティスト
彼らの実装をよりエレガントにエフェクティブにするのが機械学習エンジニア
その実装や必要なデータ整備を分散化、自動化するのがデータ基盤エンジニア
実際ははっきりとは分かれず
兼務してることが大半だと思う
特にデータサイエンティストと機械学習エンジニア
データアナリスト = データを分析して傾向を割り出す
データサイエンティスト = データを分析して予測を立てる
機械学習エンジニア = 鑑別器の正解率を高めるように特徴量を際立たせる
こんな感じか? ヘボい
こんなんで年収がいいんだ、おれもデーターサイエンティスト()目指そうかな >>66
人間性スキルが必要だから
君には無理だよ >>66
学位あって英語できりゃ年収2000万ねらえるよ。頑張って。 >>14
なんか、いろいろとバカが滲み出ている発言だなw π損もやっといた方がいいかなー
色んな言語に手を出すには日本人エンジニアの余暇は少なすぎるのだけど データサイエンティスト?
また胡散臭げなコンサルがでてきたんか ライブラリ頼みでPython使ってるだけでデータサイエンティストとかw >>67
そんなことを言ってるから日本一人負けなんだよ 真のデータサイエンティストならば断定口調で語る可能性は優位にあるとは言えない >>60
統計ではなくパターン化がデータサイエンティストの仕事
将来こうなるorこうするだろう、
っていうのが、データサイエンティストには読める >>69
おまえが無知なだけですよ
数字を読んで傾向を割り出すのがAIの仕事
傾向からパタン認識して未来予測するのがデータサイエンス 言語、言語言ってる連中は間違いなく素人。
プロのこだわりはドメイン設計とメッセージングとデザインパターン
これに尽きる。 >>18
実務経験ないんだろうけど。
海外じゃ理系だの文系だのといった馬鹿な区分けはないんだよ。
PythonもだけどR使ったことない学生なんて
勉強してないって自分から言ってるようなもんだし
外資じゃ絶対雇わないよ。 単なる分析屋なの?
新しいアルゴリズム開発するとかじゃないのか。 numpy, scipy, scikit-learn
この3つの影響が大きいと思う 今メインはMatlab+Statistical Toolboxで計算してて,たまにR使うくらいなんだけど,
Pythonに置き換えるってのはなんかメリットある?
やってるのはMCMCとかの1000行くらいから10000行くらいの計算。
Matlab使いやすいからずっと使ってるんだけど,最近Pythonをよく聞くのでちょっと気になってる。 論文読んでアルゴリズムを拝借するだけの
データサイエンティスト馬鹿にしてるくらいなんだから
きっと著名なアルゴリズムを生み出して
社会に貢献をしてるんだろうなあ >>25
言語としても優れてるよ
実装したいアルゴリズムをコンパクトに記述できる
型定義や型変換など、アルゴリズムとは関係ない余計な記述が殆どいらない
インデントで構造が明確で、閉じカッコの様な余計な行が不要
pythonだと、人間はアルゴリズムに集中できる
他の言語ではコンパイラやインタープリターを支援する為に、どれだけ余計な記述を強いられているかがわかる
コードが読みやすいので、仕様書は要らず、数カ月前に書いたコードでも動作を思い出せ、改造が楽
職業プログラマーではない、サイエンティストにとって、最適な言語だ >>85
そうかー,今MATLABで計算しているので,できるだけFORループを使わないように行列演算だけでなんとかならないかと苦戦してるんだけど,それもなくなるのか。
まあ,MATLABは関数の型宣言が全くいらず,いきなり行列を代入することができるのがむちゃくちゃ楽なんだけど。
でもアルゴリズムに集中できるというのはいいね。ちょっとインストールしてみようかな。 >>78
逆だろ
数字を読んで傾向を割り出すのはデータマイニングで、AIじゃない
また、データマイニングも、数字をそのまま入力して良い結果が得られるケースは殆ど無く、人間が数字を読んで前加工して、適切なマイニングツールを選ばなきゃならない
それがデータサイエンティスト
データサイエンティストが組んだ前処理とマイニングツールの組み合わせを使って、新たなデータから傾向を見出して、何かのアクションを自動化するのがAI >>86
for loop使わずに行列計算したほうが早いのはpythonも同じ。
裏でどういう処理してるか考えれば分かると思うが。
pythonのnumpyっていう実質的な標準ライブラリを入れると、
MatlabやRと同じ行列演算ができるようになる。
matlab、R、python一通り使ってきたけど、
計算するだけならmatlabが一番楽だね。
環境が製品として閉じてるから。
pythonはプログラミングより環境構築が難しい。 >>83
別にMatlabで何の問題なくできてるなら、問題はない。
Pythonが好まれてるのはオープンだから。
Matlabは商用ソフトなんで誰でも使えるわけじゃない。
あなたが書いたコードを共有するときに問題になる。
新しいアルゴリズムがデファクトで、
pythonで実装されるようになりつつあるから、
次第にpythonを使わざるをえなくなる機会は増えていく 全部VBでできるだろ
VB.NETを使えっての
てか、データサイエンティストって何なんだよ >>88
>>89
ありがとう。つまり年間10万くらいMathworksにお布施してるのは意味があるってことか。
まあ,俺が作ったFFTのCのプログラムよりインタプリタのMatlabのFFTのほうが速かったときは
びっくりしたもんな。やっぱり売り物はよくできてるってことか。
>>90
お前はマシン語でもやってろ。何でもできるぞ。 dplyrが出てからpythonでなくてもRは前処理楽になったよ。
Rとpython両方できてないと他人のコード読めないので、片方だけという
人は少ない では、>>90は我々低レベルプログラミング勢が貰い受ける
まずIntelの仕様書を渡すところから始める >>89
計算するだけならmatlabやRで良い事に同意
その計算モジュールをWebAPIやMQ等で他のモジュールと連携させたり、MongoDBやRedis等のDBを読み書きしたりと、システム化してAIにするには、pythonの方が便利
要は、バッチでデータ処理してた時代から、クラウドでAIする時代に変わり、pythonがトップになったんだと思う ExcelとRで回帰分析しかできないようなのはなんちゃってデータサイエンティスト。
それでもデータで経営層を動かせるからプログラマーより評価されるだけ。 >>95
違う。ExcelとRで経営層を動かせるほどの結果が出せる奴がすごい。
あくまでも統計的手法は道具であり,よい道具を使ったらよい結果が出るわけではない。
すごいデータサイエンティストは,道具がすごいのではなく,データを見抜く力がすごい。
思ってもみなかったものに,ものすごく単純な統計的手法を適用して,びっくりする結果を出す。
これがほんとのデータサイエンティスト。 >>61
>データから有用な結果を引き出せるかどうか
ホントにな
言語とか正直どうでもいいだろ
カンタンにミスなく書けてデータが取り回せれば
・・・行きつくとpハックの話もあるけど(白目 >>100
すごいH本を読んでマサカリマスターになることが求められる
パイソンのインデントが好きならオナニストへの道はおのずと開けよう >>100
>>102
まじレスするとJPGのバイナリ眺めるだけで画像の内容がわかるwww
良い子は真似しないようにねw >>6
スピードかかる所は
Cのプラグイン化でええだろ 統計つかうときはEZRでやってる
本職でもなんでもないし >>100
ヘブライでヤハウェ様にオナンの罪を詫びる 抽象的な話じゃなくてデータサイエンティストのすごい論文って具体的にどれよ >>6
R は Pythonに輪をかけて遅い。
Python自体はスクリプト言語だからメチャ速くはないけどCで書かれたnumpyやpandasをうまく活用してPythonはそういった外部ライブラリを繋ぐ糊だと考えればいい。 >>110
思うんだけど、matlabとかR使ってる研究者って
競争に負けないように、GPGPUとか3Dハードウェアアクセラレーションを使える
高度なソフトを勉強しようとは思わないのかね? >>111
matlabとかRってGPU使えないの? >>103
人工知能を研究している人間の中には、マジでそういう能力持ってるやついるらしいな。 >>113
無料じゃないなら意味なし。
片手落ちだよ。 >>115
>無料じゃないなら意味なし。
年収2000万ごえのプログラマーの意見ではないな? >>111
CPUとGPGPUで計算結果に相違が出るなんてしょっちゅうだし
GPGPU上で使えるライブラリ激減するし
使えるメモリ明らかに減るしで
使い所がかなり限定されるものに大金出すアホはそうそういないw >>110
別に研究者全員がごりごりの計算屋じゃないんだって。
MATLABだと10秒かかる計算をCだったら1秒以内だからって,
わざわざコンパイラ通すプログラム作るより楽でしょ?
俺の場合はMATLABで10時間以内で計算できるんだったら,MATLAB使うかな。
プログラムできてしまえば,一晩置いとけばいいからね。
CはMATLABじゃ数日かかってしまうようなものオンリーだな。
俺はプログラマーとしては素人同然なので,配列の面倒くさいポインターとかを考えるの嫌なんだよ。 データサイエンスに求められるレベルが違うんだよなあ
pythonができる人がただ、データーを半分にして重回帰しただけのものを機械学習って言われてもただ、条件分岐を数学的にやってるだけ
Rは統計ができる人が使うからデータサイエンスとしてのレベルが違う >>118
時代はGPUからFPGAに代わってきているし、Cみたいな高級言語覚えてもあんま意味ないよね
そう思ったとき、色々手早く動作テストするのには、適当に使える楽なPythonがいいという話になる R使う研究者とか、Python使う研究者とかそういうのはいないよ。
俺は研究者だけど、R, MATLAB, Python, C/C++, Java この辺は一通りできる。
周りもだいたいそう。
その時その時で使うライブラリによって使い分けてるだけ。 そりゃあそうだろ
研究者ならそれで別にいいけど
ビジネスでは全く違うから
研究者の世界を
ビジネスに持ち込まれても困るし
逆もまた然り >>123
ビジネスって言ったら全部ビジネスだよ。研究もビジネス。
プログラミングが関わってくる仕事は、
基礎研究、統計解析、商用開発、委託開発などなど色々あるってだけの話。 >>117
CPUとGPUの計算結果が異なることが問題になるって、
アルゴリズムがピーキーすぎんか? >>2
それでいうと、現場を知らないと問題意識が芽生えないので、データの関係だけを明らかにはできるかもしれないが、意味のある分析はできない >>117
アルゴリズムじゃなくてハードウェアの構成の違い
CPUとGPGPUとじゃ内部の加減乗除の計算順も
変わってくるから下数桁の違いなんてザラ
そんなもんだと割り切れる分野なら良いけど
カオス現象みたいに違いが深刻になる分野じゃ使えない カオス現象は微細な数値の差で全体の挙動が歴然と違ってしまうから桁処理とかちゃんと揃えないとダメですって話だと思われ。。。 ハード、特にセンサーをいじれないからデータサイエンティストなんてクソ。 R言語はデータ整形に使ってるけど
エクセル以上Python未満で使い所よく分からないイメージ >>132
あのね。ハード,特にセンサとか言ってるけど,話してるレベルが全然違うの。
センサっていうのはどのようにしてデータ取るかって手法なんだよ。
データ取得まで解析者がかかわれるなら,解析手法に合ったデータとりゃいいだけなの。
データサイエンティストってのは,ありもののデータをどうやって料理するのかっていう仕事なんだよ。
データはもうそこにあるんだよ。解析に向いていないノイズだらけのデータからいかにして
情報取り出すかって仕事なの。 >>128
カオスならそんなに神経質にならなくても良いんじゃ無い?
結果がカオスなのが当然なんだから。
そもそも、CPUだって仮数部52bitとかで切り捨ててるんだし。 >>135
カオスだから滅茶苦茶でも良いわけじゃないよ?
初期値鋭敏性で結果が大きく変わって行くってだけで、それでも決定論的なのがカオスなんだから
同じ初期値なら一定時間後の結果は同じものが計算されてるって前提で計算出来なきゃ
計算してる意味無いよ >>136
それ、CPUが変わったら結果変わりました
じゃ意味なくね? >>137
そうならないように精度保障とか使うんだけどさw
精度保障とかやってもCPUとGPGPUはアーキテクチャの違いが大きいから
同じ初期値でCPUかGPGPUかで違う結果が出てくる可能性がある事が問題なわけよ >>132
そんなこと言ってるから仕事にならない。 システムを考えられない下請け屋がデータサイエンティストじゃん。 >>90
言いたいことはわかる。CかアセンブラでDLL作らないと悲惨なほどに遅い。
PythonもDLLを作ったほうが速い。
同じようなもんだよ。 >>134
捏造ですね。わかります by 厚生労働省 ロシアとか韓国のような弱小国を相手にするときは
(ロシアのGDPは、韓国より少ない)
相手国のトップ(プーチン)以外は無視でいい!
決済権限の無い下っ端ペーペーの
ふんどし担ぎのすっとこどっこいの
何も知らない馬鹿な小役人(外相)
なんか相手にしても、時間の無駄である!
かまってやれば、付け上がるだけだ データサイエンティストに将来がないと思いますよ。
GAFAのような起業をできなければプログラマと同じような労働者としてこき使われる事になるでしょう。
システムやビジネスがわからないからこそデータサイエンティストでいるわけでしょう。 >>48
プログラマもピンキリ,データサイエンティストもピンキリ。
単にそれだけ。 >>120
Cはpythonと比べたら低級言語だろw >>148
データサイエンティストという肩書の人は上流で仕事をしてるから奴隷にはならない。
PGに例えると、大企業に入ってパワポ職人をしてる高学歴と同じ >>151
>大企業に入ってパワポ職人をしてる高学歴
ウチの会社には,そんな奴はいないぞ。
今の世の中,それが許される会社があるのかい?! 世の中のこと
何もわかってない奴ばかりだね
そりゃ薄給にもなるわな 俺の学生の頃は S だったな。それが、R に進化した。 >>154
進化っていうかS言語をフリーで使えるように実装したのがRだよ 言語としてはどちらもフリーだろ。
Sのフリー実装がRではなく進化してるんだろ。劣化もしてる部分あるかもしれないが詳しく知らない。 >>152
予算獲得ならパワポがいちばんだよ
パワポ3枚で500億ぐらいがめて来る データサイエンティストとか、ゴリゴリの下流PGでしょ >>1 >>2 >>3 >>4 >>5 >>6
>国家運営のシミュレーションゲームとして考えると、
>構成員を決める場面では日本の人口・国土の規模から言って
>単純な力仕事を担う低コスト労働力は必ず大量に要るんだから
日本は典型的な国内産業に依存する重商主義国だからそういう偏った思考法となる
国内に優秀な人材プールを持つことで、人材不足の成長中の外国企業に進出させ、そこから雇用を生まれさせるという考えがない
https://en.wikipedia.org/wiki/List_of_countries_by_received_FDI
1 Netherlands 4,888,000
2 United States 4,084,000
3 United Kingdom 2,027,000
— Hong Kong 1,901,000
4 China 1,514,000
5 Ireland 1,477,000
6 Germany 1,455,000
7 Singapore 1,285,000
8 Switzerland 1,230,000
9 Belgium 1,093,000
10 Canada 1,045,000
11 France 842,500
12 Brazil 778,500
13 Spain 772,100
14 Australia 647,700
日本にインド並にコンピューターサイエンス科、電子工学科卒のプログラマーがいたら
もしくは機械工学、制御工学、ロボット工学でも良いが人材が多くいるのであれば
国内にソフトウェア産業やロボット産業、プラットフォーマーが無くとも、外資が進出してくれるので雇用が生まれて税収や福祉財源も増える
もちろん輸出企業は維持すべきではあるが、外資の雇用が増えれば日本企業の盛衰に対する完全な依存はなくなり、
国内産業が敗北・衰退しても破滅的なリスクの回避ができる
実際のところ、欧州のアメリカの同盟国はこうした戦略で自国産業に過度に依存せずに、それなりに繁栄してきた
英語というバリアーもあるが、理系の使う英語は現実問題大したものではないし、国内に対する開発拠点を外資が投資するなら全員が英語を流暢に話せる必要はない
最大の問題は解雇規制・解雇法理による大企業のぬるま湯と、専門家になることによって著しく損となる文化によって知識集約産業に人材がいないことと、文系が多すぎて工学系の絶対数が少ないことだ https://investinholland.com/foreign-direct-investment-accounted-for-more-than-12500-jobs-in-2017/
US companies lead employment creation
As in 2016, the majority of ‘foreign’ jobs were created by companies from the United States. NFIA results for 2017 indicate some 2,516 jobs created by US companies, bringing 110 million euros in investments.
Companies from within Europe also provided a substantial number of jobs (2,879), including the UK (872). Japan and India provided 655 and 423 jobs, respectively.
Majority of jobs from foreign investments in 2017 came from creative industries such as fashion and entertainment & media (2,126).
Additional jobs by sector include agrifood (1,788), IT (1,219), life sciences & health (600) and business services (457). >>159
そう?
あまりハードよりではないと思うが データサイエンティストって相撲は八百長って言ってる人だと思ってたw 自称データサイエンティストがマウントしあう会場はこちらですか? 今データサイエンティスト増やし過ぎて資質ないやつが死ぬほど多いな
定量論だけで速攻で論破できてしまうから全くビジネスにならん データサイエンティストの世界の話ですからね
勘違いして一般的にソフト開発のスタンダードだと思わないようにw
目的がアプリなのにアセンブラ勉強してしまうようなもの
確かに同等の事は出来るけどね。
でもそれを言ってしまえば、どの言語だって同じw >>164
あなたは評価エンジニアですか?
それで充分ですよ
コードが書けるなんてのはプログラマーであって
データサイエンティストじゃない PypeR でPythonからR使えるという話を聞いたけど
多分制約があるんだろうなということでやらない いわゆる"職業プログラマ"の使うものじゃない
科学者はPythonやFortranなどの超高級言語を使う
成果物アプリやソフトとして売るわけではない
(Pythonは多次元配列に事実上ライブラリ必要だけど) numpyは冗長な機能を削ればコンパクトだし取り込んでもいいと思うけどな
FortranやMatlabライクな部分配列指定やufunc演算を模倣できて便利
まだスライスとufuncがFortranに比べれば物足りない、
CoArr(始:終:刻,…)[プロセス始:終:刻,…]
ユーザー定義のスカラー関数に配列を渡せるufuncもまだ限定的なサポート(Fortranではelemental宣言) ポスドクだけど周りではPython、Matlab、Fortranが三強 Pythonは小回りが効くのが買われている、速度や機能で踊るFortranとMatlabと張り合えるのは、これらが雑務をサポートしていないから
Pythonはスクリプトとして一般用途にも使えるから、科学者コミュニティ以外でも使われる
よって使う人の頭数が多くなる 在野では有償Matlab代替としてのOctaveと、Rが二番手と感じる >>138
精度保証はPython+mpmathが便利だね、愛用してる
四倍精度をまともに扱えるのは今のところFortranだけだと思う
高ければいいわけじゃなくて、保証は別に必要で面倒だけど Pythonの高精度計算ライブラリの標準mpmathは任意精度が指定できるけど、
実装のネイティブコード割合が少ないので大規模にはちと辛い
SciPyコミュニティの活発さを少しだけ分けて欲しい Python+Sageも有望だと思うけど、Pythonをコアにした独自言語という色合いが濃い
正直取っ付きにくい
数値計算ではない部分、特に数論的扱いに関してはPythonに限らずあらゆるサイエンス向け言語の中でずば抜けてる(環などの代数系を定義できる)
Magmaなど著名な処理系を手当たり次第統合してるからだけど…
素のPythonから引けるようにライブラリとしてリリースしてほしい HELOOワールドの数値計算版は円周率かと
Pythonで100万桁とかできるか? RとPythonの対比ならSPSSやSASの話も出る気がするけど
出ないな 過去現在未来においてもマッドサイエンティストが時代の最先端であり未来を作ってきた訳でそっちの需要について分析したら? 嵐山光三郎はRのヘビーユーザーらしいな、死んだけど >>88
pythonの環境構築は
anacondaインストールだけで済んでめっちゃ楽だったけど PythonはwebデザイナーがjavaScriptをかじるのと似ていて自分の業務に最重要ではないけど必要だから使う感覚だろう。
ゴリゴリのエンジニアリングとしてメインに選択したい代物ではない。 >>22
モジュールレベルは商売にならないから
基本やらないよ
モジュールを使った応用の商売だから ■ このスレッドは過去ログ倉庫に格納されています