X



【IT】データサイエンス向け言語はRとPythonのどっち?
■ このスレッドは過去ログ倉庫に格納されています
0001田杉山脈 ★
垢版 |
2019/06/21(金) 12:01:56.83ID:CAP_USER
このほど、「matloff/R-vs.-Python-for-Data-Science|GitHub」に、データサイエンスで利用するという観点からプログラミング言語であるRとPythonを比較した記事が掲載された。これまで、データサイエンスの分野ではRが使われることが多かったが、近年はPythonの利用が進んでいる。

記事の執筆者であるNorm Matloff氏はカリフォルニア大学デービス校におけるコンピュータサイエンスの教授。以前は、同大学で統計学の教授だったようだ。同氏はR関連の書籍を4冊執筆しているほか、現在はR Journalの編集長を務めている。同氏はこれまでの経験および統計学者/コンピュータ学者という視点から、今回のトピックに関して有用な光を当てることができるだろうと説明している。

執筆段階で掲載されている比較の主な内容は次のとおり。

項目 内容
優雅さ 明らかにPythonの勝ち。主観的ではあるもの、これまでさまざまなプログラミング言語を使ってきた経験や教育してきた経験から、Pythonにおける括弧や中括弧の利用が大幅に減少したことにとても感謝している

学習曲線 Rの大勝利。Pythonを使ってデータサイエンスを始めるにはNumPy、Pandas、matplotlibなど、Python以外のライブラリについて学ぶ必要がある。また、パッケージ構成も時に難しい。Pythonに比べると、Rには行列型と基本的なグラフが最初から組み込まれており、数分以内に簡単なデータ解析を行うことができる

データサイエンス向けライブラリ Rがちょっとだけ優勢。CRANに登録されているパッケージは1万4000個ほど、PyPIに登録されているパッケージは18万3000個ほどとPytPIのほうが多い。しかし、データサイエンスに関するものはそれほど多くない

機械学習 Pythonがちょっとだけ優勢。多くの人にとって機械学習はNNを意味しており、NN用ソフトウェアの多くはPythonに関連している

統計的な正確さ Rの大勝利。Rは統計学者によって統計学者のために開発されている

並列計算 引き分け。RもPythonもベースバージョンはマルチコア計算に対して優れたサポートを提供しているとは言い難い

C/C++インタフェース Rがちょっとだけ優勢。どちらにもC/C++インタフェースは存在しているが、PythonのそれはRと比べるとそれほど強力なものではない

オブジェクト指向/メタプログラミング Rがちょっとだけ優勢。どちらもオブジェクト指向をサポートしているが、RのほうがPythonよりも真剣度が高い

言語の統一性 Rはとてもひどい状況。Rは複数の実装系が存在しており、使っていない実装系のコードは読むことが難しい状況になっている

リンクデータ構造 Pythonの勝ち。Pythonでは簡単に実装することができる

オンラインヘルプ Rの大勝利。Rのhelp()関数はPythonよりも情報が多い
以下ソース
https://news.mynavi.jp/article/20190619-845288/
0003名刺は切らしておりまして
垢版 |
2019/06/21(金) 12:08:14.88ID:BakQS1zZ
データ分析クラスタも機械学習クラスタも
仕事や勉強で忙しくて
こんなクソみたいなところに書き込んだりせんだろ。
0004名刺は切らしておりまして
垢版 |
2019/06/21(金) 12:08:14.94ID:9YVJ9qiw
うーん、用途と使う層が違うから
比べてもしょうがないよな
ただ、統計の勉強にはRがいいと思うし、それからpython
使ってもいいだろうし、まあ両方使えば良いんじゃない。
R は、すぐにやってみられるし、検算用でも良いしね
0005名刺は切らしておりまして
垢版 |
2019/06/21(金) 12:10:23.11ID:9YVJ9qiw
Rは、プログラミング言語ではあるけど
数学処理系といった感じですぐ使えるから、両方で良いんじゃないかい
0006名刺は切らしておりまして
垢版 |
2019/06/21(金) 12:13:17.57ID:nN+3LQrd
Pythonはアホでも使えるという理由だけで
機械学習まわりで広く使われてるというだけだからな

自前で実装するなら言語は何でもいい
0007名刺は切らしておりまして
垢版 |
2019/06/21(金) 12:13:29.43ID:9YVJ9qiw
しつこいけど、maximaも覚えとくと便利かもよ
微分とか記号のまま出来るし
こういうのは、同じ言語でも、数学知ってれば
そこそこ使えるからね。あ、別にpython目の敵に
してるわけではないよ。両方使えれば、もっと
便利だ、って言いたいだけだよ
0008名刺は切らしておりまして
垢版 |
2019/06/21(金) 12:13:47.22ID:BuCQ0Poa
これからはPython主流になるんじゃないの
Perlが食われたように、Rも消えていきそう
0009名刺は切らしておりまして
垢版 |
2019/06/21(金) 12:15:56.01ID:9YVJ9qiw
消えないよ、これ古ーい言語だから
今消えてないなら、もう消えないよ
ほんとは言語というより、電卓みたいなもんだから
0010名刺は切らしておりまして
垢版 |
2019/06/21(金) 12:16:05.82ID:3upXEPJ6
C言語
0011名刺は切らしておりまして
垢版 |
2019/06/21(金) 12:32:54.68ID:XDit8KU9
どっちもかじっておけばいいだろう
0015名刺は切らしておりまして
垢版 |
2019/06/21(金) 13:46:29.66ID:Lc1Al9Lz
ボッキデータは両刀使い
0016名刺は切らしておりまして
垢版 |
2019/06/21(金) 14:25:12.35ID:ok3A4L/d
あんまり用途はかぶらない気がするが、ありうるとすればPythonがRの用途を取り込んでしまう方向
0018名刺は切らしておりまして
垢版 |
2019/06/21(金) 15:59:32.67ID:WdlPGyo5
dplyrがあるからRの勝ち。
0020名刺は切らしておりまして
垢版 |
2019/06/21(金) 16:58:44.75ID:AHaHV+QF
>>18
なかったらRの完敗。

あったところで、やっと引き分け
0021名刺は切らしておりまして
垢版 |
2019/06/21(金) 19:03:31.24ID:pYBjEZPM
Octaveは?
0023名刺は切らしておりまして
垢版 |
2019/06/21(金) 20:30:12.36ID:K2tWIYhk
>>21
全敗
0024名刺は切らしておりまして
垢版 |
2019/06/21(金) 22:57:54.57ID:XiUewTyv
C++は万能の神、異論は認めない
0025名刺は切らしておりまして
垢版 |
2019/06/22(土) 00:49:32.50ID:5DQJmYDI
 
Rは分析ツール
pythonはデータシステム記述

という認識なんだが
0028名刺は切らしておりまして
垢版 |
2019/06/22(土) 03:00:20.68ID:jOao2o59
Rもpythonもc++も使ってるけど
pythonは正直要らない
0034名刺は切らしておりまして
垢版 |
2019/06/22(土) 10:38:00.57ID:6iNqGOOx
ベテランは
 エクセルマクロで頑張れ
0035名刺は切らしておりまして
垢版 |
2019/06/22(土) 10:59:42.77ID:mETSYX/M
Excelはビックデータ開けんでないか。
DB+シェルスクリプト で大半はできるけど、R使うのって、何計算させるんだ?
0037名刺は切らしておりまして
垢版 |
2019/06/22(土) 11:42:51.28ID:XYdhKkxT
MathematicaとC++でおk
0039名刺は切らしておりまして
垢版 |
2019/06/23(日) 04:25:51.93ID:lrC2jDV3
SASは正直どうなの?
0041名刺は切らしておりまして
垢版 |
2019/06/23(日) 10:27:27.56ID:6nfImTaI
PythonかじったけどRのほうを先に食べるかな
0042名刺は切らしておりまして
垢版 |
2019/06/23(日) 15:43:45.37ID:RFPJANtD
関数型っぽいRのほうがコードが短くて一見楽ちんだけど、
Pythonのほうが柔軟で大きなデータを扱えるのかな?
0043名刺は切らしておりまして
垢版 |
2019/06/23(日) 17:47:41.96ID:Iffj4eb2
C++でよいのか?
0046名刺は切らしておりまして
垢版 |
2019/06/23(日) 18:54:39.45ID:UHpmRTFF
len(nums)
これがいやだから
nums.lenかnums.len()
で要素数とれるようにしてくれ
0047名刺は切らしておりまして
垢版 |
2019/06/23(日) 23:19:43.68ID:1Usa0hnk
>>46
最小はそう思ったわ
でもなんか慣れてしまったな
慣れてしまうから改善されないんだろうなとは思う
0048名刺は切らしておりまして
垢版 |
2019/06/24(月) 01:43:30.76ID:rGZ/DxNI
ニュートラルネットが使いやすいのは、Pythonのほう!!
0050名刺は切らしておりまして
垢版 |
2019/06/24(月) 09:05:14.22ID:SHyoRWaP
C++で演算子のオーバーローディングを使えばグー
0051名刺は切らしておりまして
垢版 |
2019/06/24(月) 09:27:05.04ID:vXYvOq7p
プログラミング言語自体の機能を比較しても意味がない。
何を作りたくて何を使うべきかであって得手不得手がある。
0053名刺は切らしておりまして
垢版 |
2019/06/24(月) 09:37:19.35ID:dyIYTiaT
自前の用途決め打ち専用言語が最強
0055名刺は切らしておりまして
垢版 |
2019/06/24(月) 09:54:04.81ID:YkvjJ5d6
>>19
今のデータサイエンスはAIのCNN処理が進んでからのもので
昔流行ったデータマイニングとは訳が違う。
0056名刺は切らしておりまして
垢版 |
2019/06/24(月) 10:14:45.51ID:CaOkZT+9
heartyでええやん
0057名刺は切らしておりまして
垢版 |
2019/06/24(月) 10:20:55.81ID:SHyoRWaP
LibreOffice Calc + Neuronica
はどうなんだろう?
試したことはない。
0059名刺は切らしておりまして
垢版 |
2019/06/24(月) 11:18:26.14ID:SHyoRWaP
データマイニングという言葉は1990年代にデータベースの分野で使われだしたらしい。
knowledge-discovery in databases(KDD)と関係がある。

データサイエンスのほうが言葉としてはそれよりはるかに古いけど、
そのころの意味はコンピュータサイエンスとほとんど同義だったようだ。

今日のデータサイエンスはデータマイニングを含み込む科学分野っぽいね。
0060名刺は切らしておりまして
垢版 |
2019/06/24(月) 11:26:55.98ID:SHyoRWaP
てか、統計学の今風の呼び方っぽい。
0062名刺は切らしておりまして
垢版 |
2019/06/24(月) 14:40:16.68ID:e1DF4m49
文系ど素人が働きながら効率よく身に付けるにはRから始めるべき?
どこかで基礎を学べればいいんだけど独学最強状態なのかな
0063名刺は切らしておりまして
垢版 |
2019/06/24(月) 16:17:03.11ID:NeHE8ntE
>>62
文系でもド素人でもいいけど、
何を身に着けたいのか不明ではどうしようもない
0064名刺は切らしておりまして
垢版 |
2019/06/24(月) 17:05:14.58ID:JUXHwMoV
データサイエンティストと統計学者の違いについて結局いちばん納得できた説明は、
データサイエンティストはソフトウェアエンジニアの中で特に統計に詳しい人で、
かつ、他の統計学者よりもソフトウェアエンジニアリングに詳しい人だ
ってものw
そのほかの説明は、たくみに言いくるめられているようでどれも納得がいかなかった。
0065名刺は切らしておりまして
垢版 |
2019/06/24(月) 18:13:34.00ID:3K6RILtI
>>64
あぁ、良い表現!
でも、最適化問題やってるサプライチェーンマネジメントの人や、陸運のダイヤグラム引いてる人は?
彼らだって立派なデータサイエンティストだよ
0067名刺は切らしておりまして
垢版 |
2019/06/24(月) 19:00:58.09ID:nKPFoEz3
>>62
そんなこと聞いてる奴は向いてない。
その質問する間にツールをインストールしてる奴が向いてる奴

プログラミングが初めてならRはおすすめしない。
教材が少ないから。回り道でも他の教材の多い言語をやってからのほうが早い。
0069名刺は切らしておりまして
垢版 |
2019/06/24(月) 19:31:29.48ID:e1DF4m49
>>67
まあそうだよな
SASやSPSSより安いらしいからなんかに使いたいとか言われてさ
そういうふわっとしたオーダーが一番困る
右も左もわからんしマジ詰み
統計学からやるべきなのか?
とりまRよりPythonのがとっつきはいいのかな
0071名刺は切らしておりまして
垢版 |
2019/06/24(月) 19:35:16.75ID:1NmOhIao
ExcelやLibreOfficeの分析ツールじゃあかんのですか?
RやPythonを使っていたほうがカッコいいの?
Linuxユーザーみたいだね。
0073名刺は切らしておりまして
垢版 |
2019/06/24(月) 19:47:34.76ID:DSo3l3BR
rPythonパッケージをインストールすればRからPythonコードを実行でき、
RPy2ライブラリを使えばPythonからRのコードを実行できる。
0074名刺は切らしておりまして
垢版 |
2019/06/24(月) 19:53:31.99ID:3K6RILtI
>>70
risk managementの手法だって全然使われてないんだから、それをどう使うのかと、他分野への横展開を考えながらやったら良いとおもう。
寄り道しすぎると、使えなくなるよ。

エンジニア上がりのなんちゃってとどっこいになりたくないでしょ?
0076名刺は切らしておりまして
垢版 |
2019/06/24(月) 19:55:54.10ID:3K6RILtI
>>71
エクセルだってそこらに居るなんちゃってデータ屋じゃ使いこなせないレベルのこと出来るからね…
結果が出るなら何でも良いともう夜
0078名刺は切らしておりまして
垢版 |
2019/06/24(月) 20:24:06.87ID:1chsSL/F
機械学習と言ったらLISPでしょ!
0080名刺は切らしておりまして
垢版 |
2019/06/24(月) 20:40:50.29ID:nKPFoEz3
>>69
俺は沢山そういう人を見てきたが、
身につく人は質問以前にとっと手を動かしてる。
それができない人は無理なので諦めた方がいい。
0081名刺は切らしておりまして
垢版 |
2019/06/24(月) 20:50:39.40ID:uYm0kOLd
Excel の定義がVBAも含んで、Excel 自体はあまり使ってないのか、
Excel でデータの準備を人がコピペでやってるのかで、全然違うな。
Excel ってグラフ化(含むPivot)くらいにしか使ってない。
0083名刺は切らしておりまして
垢版 |
2019/06/24(月) 20:58:23.98ID:QMeKW+S4
>>69
R にしとけ
統計なんて大学院卒業レベルまでやりこまなくても
R を起動すれば使える

t検定とかぐらいなら
起動したインタプリタから
データいれて
関数呼ぶ
の2ステップで見やすくフォーマットされた詳しい出力がでてくる
0085名刺は切らしておりまして
垢版 |
2019/06/24(月) 21:26:02.88ID:rW/rYKCP
>>83
右も左もわからん奴には無理だと思うの。
酷い話、曖昧な質問でも答えてくれるSiriみたいなの付けないと。
0086名刺は切らしておりまして
垢版 |
2019/06/24(月) 21:58:12.01ID:e1DF4m49
>>72-74
あんがと
R軸足で見てみる
個人的にメインツールはExcel極めて他はそこそこでと思ってるんだが、職場環境はとっちらかってるんだよね
なかなか自分のスキル構築うまく行かなんのだねど、頑張るわ
0088名刺は切らしておりまして
垢版 |
2019/06/24(月) 22:24:16.16ID:DSo3l3BR
2016年のあたりではデータサイエンスの間でRがトップだったけど、
今はPythonがRを上回ったらしいよ。
0089名刺は切らしておりまして
垢版 |
2019/06/24(月) 22:28:44.50ID:56RZnfhi
Rには頑張って欲しいものだ
0092名刺は切らしておりまして
垢版 |
2019/06/25(火) 00:26:09.62ID:Lh6JfvMb
>>90
R使う人ってプログラム書きをメインにするわけじゃないだろうからどうでもいい話
0093名刺は切らしておりまして
垢版 |
2019/06/25(火) 08:10:15.36ID:kig1PYBx
>>90
関数型プログラミングってだけじゃね?
0094名刺は切らしておりまして
垢版 |
2019/06/25(火) 11:52:28.76ID:othpDRXG
>>90
逆だろ。
未経験でも使える敷居の低い低級言語が R だろ

将来グラマーやるわけじゃないなら、悪いくせついても全然OK
0095名刺は切らしておりまして
垢版 |
2019/06/25(火) 13:34:21.42ID:kig1PYBx
Rだって代入演算子に=を使えるんだから使えばいいのにと思う。
<-と=は同じ意味なんだから。
0096名刺は切らしておりまして
垢版 |
2019/06/25(火) 13:43:39.97ID:kig1PYBx
データサイエンスなら、PythonよりもJulia。
文系の方で英文がすらすら読めるなら障害なし。
0099名刺は切らしておりまして
垢版 |
2019/06/25(火) 16:27:07.92ID:S/SVRDgb
>>98
昔、シミュレーション系はmatlab使ってたけど、なんか作れるようになったら別に使わなくても良くなっちゃって…
0100名刺は切らしておりまして
垢版 |
2019/06/25(火) 16:28:46.64ID:ZHxHakO4
>統計的な正確さ Rの大勝利。Rは統計学者によって統計学者のために開発されている

重要なのはここだけだろ
excelの間違いだらけの関数とかあったけどな
0102名刺は切らしておりまして
垢版 |
2019/06/25(火) 16:41:09.58ID:ZHxHakO4
>>101
そういうの見つけたら指摘して直せよというのがフリーソフト文化の良いとこなんでは

俺は間違いを知ってると自慢してるだけで
報告してないとかじゃないんだろ
0105名刺は切らしておりまして
垢版 |
2019/06/25(火) 17:37:26.73ID:HldNBK42
羽鳥神を崇めよ
0107名刺は切らしておりまして
垢版 |
2019/06/25(火) 18:55:56.98ID:wfjCCmSd
>>94
全然ダメ。グローバル変数使いまくったり、
変数名もピリオドとか含めてつけたり、配列やデータフレームにインデックス値で直接アクセスしたり、
そういう有り得ないことが身についてしまう。

そもそもコーディング基本流儀は何も職業コーダーだけのものではなく、
研究者も含めてコードを書く人全てが従うべきもの。

おまけに基本的に値渡しか参照渡しかを制御できない言語だから、
分かってない人が書くコードはすぐメモリエラーになる。

低級言語と高級言語の違いを逆に覚えている人には理解できないかもしれないが。
0108名刺は切らしておりまして
垢版 |
2019/06/25(火) 19:03:29.35ID:lLSgYjm9
>>107
プログラム書きになるんじゃなければどうでもいい話
変な癖ついても直せばいいだけだしな
0109名刺は切らしておりまして
垢版 |
2019/06/25(火) 19:22:33.07ID:wfjCCmSd
>>108
だからそのコーダー以外はプログラム書きではないという発想やめれ。
研究者とかだって立派なプログラム書きだ。
プログラミングの基本は全員が学ぶべきことだよ。
0110名刺は切らしておりまして
垢版 |
2019/06/25(火) 20:01:32.08
プログラミングは当たり前に出来て+数学+専門知識なのに
派遣とか経験の永久ループでシステムとして破綻してるから
禁止にして業界を改革しないと
コンピューターサイエンスを勉強する人が増えないで国力が落ち続ける
もう安全保障の問題になってるのに
利権化してるから誰も指摘できないんだろうな
0112名刺は切らしておりまして
垢版 |
2019/06/25(火) 21:46:00.75ID:kig1PYBx
従来の専門分化が崩壊しはじめている。
0113名刺は切らしておりまして
垢版 |
2019/06/25(火) 21:52:16.88ID:gH9JwotW
再現性のない科学とかオボちゃんじゃん
わかってるのかね?でーたさえんちすとくん
0114名刺は切らしておりまして
垢版 |
2019/06/26(水) 01:15:26.81ID:e5c7nLP5
>>109
プログラム書きで食っていくんなら変な癖がついたら困るとかいうのもわかるけど
そうじゃないんなら我流でも便利に使えればどうでもいいこと。
0115名刺は切らしておりまして
垢版 |
2019/06/26(水) 02:39:24.60ID:Cr7GuPtU
>>107

おおっと、Pandas の悪口はそこまでだ!
0117名刺は切らしておりまして
垢版 |
2019/06/26(水) 07:48:54.38ID:JTtCxs+l
>>116
機械学習の殆どはまだ判別機のレベル
去年論文発表されたネタからやっと少し先に進めるかもしれないかもとみんなが期待してる感じ。実際に案件で使ってみたと言うことは聞いたことがないよ。

統計は予知から予測に近くなってきた感じ。予想に行き着くには全然遠い。
0118名刺は切らしておりまして
垢版 |
2019/06/26(水) 09:33:11.77ID:OzEH6WKp
>>117
もう、・・・よそう
0119名刺は切らしておりまして
垢版 |
2019/06/26(水) 09:37:04.65ID:dAb6vlBU
>>118
洒落なのはわかるけど…
クライアントによっては、詐欺師まがいのコンサルに踊らされて変な期待しすぎは本当にもうよしたほうが…って思うなぁ
0120名刺は切らしておりまして
垢版 |
2019/06/26(水) 11:52:19.50ID:/5C+3UMz
AI のイメージとダブるんだが、区別はあっても無いようなものなのか?
沢山あるデータから、複数の観点で情報を抽出して分析するお仕事かと思ったが。
0121名刺は切らしておりまして
垢版 |
2019/06/26(水) 12:14:00.13ID:1ai7zQUy
過去のデータの分布が将来も同じなら
程度の予想はラプラスの時代からできてるしな
0122名刺は切らしておりまして
垢版 |
2019/06/26(水) 12:40:50.10ID:FLP+7mqB
統計情報を用いて予測モデルを作るお仕事です
機械学習の一部の分野
人間の役割はアノテーションを行いモデルを誘導する、所謂データの前処理を主に行うのでデーターサイエンティストと言われているんだと理解しているよ
0123名刺は切らしておりまして
垢版 |
2019/06/26(水) 13:33:03.99ID:WDzMLjwh
>>120
明確な区別はなく基礎となる技術も手法もおおいにかぶってるけど、

統計学=値の分布を分析・評価する
機械学習=値の分布のモデルを仮定し推測する。通常の統計学より高次元データが多い。
人工知能=コンピュータに学習させ難しいことをやらせる

ベン図書いたらほとんど被ってるといっていい
0124名刺は切らしておりまして
垢版 |
2019/06/26(水) 15:24:10.05ID:34hb3Ily
データサイエンスって人工知能エンジニアリングとほぼ同義なの?
0126名刺は切らしておりまして
垢版 |
2019/06/26(水) 17:23:53.35
データサイエンスはお客さんの要求をどうやって学習させるかを考えて正解率を上げる人
人工知能エンジニアリングは学者でスピードと正解率を上げる方法を考える人
1ヶ月、機械学習を勉強しての定義はこんな感じ
0129名刺は切らしておりまして
垢版 |
2019/06/26(水) 19:08:45.67ID:ILLohe3P
>>128
それ、宇宙人だよ…
どれか一つでも一人前にできて、ビジネスに応用できたら、データサイエンティストでよかない?
0131名刺は切らしておりまして
垢版 |
2019/06/26(水) 20:30:55.30ID:1ai7zQUy
数学
→統計論
〜〜↑数学科の人たち〜〜
→応用統計学(応用数学)微妙な領域
〜〜物理とか生物とか↓〜〜
→でーたどうのこうの機械学習横文字多数

こういうイメージ
0134名刺は切らしておりまして
垢版 |
2019/06/27(木) 06:51:43.61ID:bCXVVIIv
研究者のコーディングが幼稚なわけ
スブの素人でも支障がないコーディングができるほどソフトウェア工学は発展してないし
大学で片手間にやった程度の素人がひらめけるほどソフトウェア工学が取り組んだ問題は浅くない
0135名刺は切らしておりまして
垢版 |
2019/06/27(木) 08:11:19.74ID:T0rrtdNL
>>132
そこなんだよな
2->3 de 移植性が亡かったから
10年先つかえるか不安な言語
また書きなおしとか効率悪い
0136名刺は切らしておりまして
垢版 |
2019/06/27(木) 08:15:13.46ID:zwVW4Q0A
>>134
おまえのような自閉症のアホにもわかるように教えてやると
研究者はソフトウェア工学を研究しているのではない。
人間の知覚をモデル化する研究に取り組んでるんだよ。

だから、コーディングなんてPythonで充分なの。
アイデアやアルゴリズムをテストしたいだけ。
0137名刺は切らしておりまして
垢版 |
2019/06/27(木) 08:19:40.57ID:zwVW4Q0A
>>123
>機械学習=値の分布のモデルを仮定し推測する。通常の統計学より高次元データが多い。
>人工知能=コンピュータに学習させ難しいことをやらせる

これじゃどっちも同じだろうが。

人工知能は人間の知覚をモデル化したアルゴリズムを実装しているところに特徴があるんだよ
そもそもプログラマーは脳科学なんて素人だから、こういう中途半端な説明に終始する。
0139名刺は切らしておりまして
垢版 |
2019/06/27(木) 09:41:02.70ID:6ObXvRij
Cのライブラリを呼べればどんな言語でもいい。
0140名刺は切らしておりまして
垢版 |
2019/06/27(木) 11:56:22.84ID:tDjUMRIW
>>137
> 人工知能は人間の知覚をモデル化したアルゴリズムを実装しているところに特徴があるんだよ
研究対象としては面白いが、工学的には割とどうでもいい。
人間とは違ったモデルのほうが性能いいかもしれないし。
一生懸命二足歩行をモデリングして再現するより、車輪で移動したほうが速いのと同様。
0141名刺は切らしておりまして
垢版 |
2019/06/27(木) 19:04:33.60ID:fYRU4FaW
>>107
汎用性が高く、素人初心者にも解りやすく、綺麗なコードが書けるようになるプログラム教えてくだちい
0142名刺は切らしておりまして
垢版 |
2019/06/27(木) 19:42:11.25ID:dkDi6/eJ
>>141
最初は教材の多い汎用的な言語で勉強した方がいい。
JavaとかC++とかC#とか。この辺できてりゃほかの言語はすぐできるようになるし。

PythonやRはプログラミング初心者向けの良書が少ない。
0143名刺は切らしておりまして
垢版 |
2019/06/27(木) 19:47:27.03ID:dkDi6/eJ
受託開発とかと同レベルのコーディング品質でなくてもいいけど、
自分だけで解析するにしても最低限のコーディングの基本やソフトウェアエンジニアリングは知っておいた方がいいぞ。

グローバル変数避けるとか、関数・プロシージャに分けるとか、
分かりやすい関数名や変数名をつけるとか、並列化時はリソースの同時アクセスに気をつけるとか、
メモリリークを避けるとか、そういうのは誰がプログラミングしても当たり前に知っておくべきこと。

あと意外と研究者にとっても大事なのはテストだったりする。
結果について間違いがあってはいけないのは研究者も同じだから。
テスト自動化したらやたら捗るよ。
0144名刺は切らしておりまして
垢版 |
2019/06/27(木) 21:00:07.46ID:23i4fR1C
言語設計をした人の哲学で選んでみてもいいかも。
Larry Wall は楽しい事を書くよ。
難しい本を書く人もいるし。
0145名刺は切らしておりまして
垢版 |
2019/06/29(土) 12:15:14.02ID:Sim04gn/
良し perl5 だ
0146名刺は切らしておりまして
垢版 |
2019/06/29(土) 20:08:26.36ID:b6sgGveO
今のAIって実はサヴァン症候群と同じような状態だよ

タチコマやロボコンの実現ははなかなかに難しいよ
0147名刺は切らしておりまして
垢版 |
2019/06/30(日) 13:42:12.99ID:3VY8uaBP
>>129
そうでもない統計を利用するだけの知識なら然程専門的な知識は要らないとまで言わないが化物である必要はない
一瞬で対峙した問題への適切なモデル提唱とか利用とかを行える連中は宇宙人言っても過言じゃないと思うが
プログラミング上のライブラリーと一緒で数学の知識もツール化が図られてる
ちょうど実数論全くわからない連中がsin(x)*cos(x)の微分なんかを簡単に成しとげることが出来るのは有用な定理を証明なしにツール的に用いることで達成されてるのと一緒


>>146
タチコマは夢があるよね確かに現状からブレイクするーなしに達成されることはなさそう
推論の仕方は人間に近いものというか人間も学習によっての帰納的判断でしか物事は判断できないと思ってる
問題はタチコマみたいにどのように自発的にインプットをインプットとして判断させるかだと思う
これは何でこうなるんだろうという自発的な疑問からそれに関するインプットを自発的にサーチするそうして次の学習に現在までの学習結果を利用し学習結果を部分を現在の学習に関連付けて学習に利用する(これがガチでムズい)
タチコマのよく言う「それはどうしてかな?」が現状のAIとタチコマの決定的違いだと思う(´・ω・`)
0148名刺は切らしておりまして
垢版 |
2019/06/30(日) 15:26:58.78ID:/0keLcYm
>>127

その漢字をあてたらかわいそうだ。
統計家だろwww
0149名刺は切らしておりまして
垢版 |
2019/06/30(日) 17:12:15.45ID:I9G19psB
これ読んだけど結論は用途により使いわけろってことだな

両方必要
0150名刺は切らしておりまして
垢版 |
2019/06/30(日) 17:14:19.98ID:I9G19psB
>>128
個人的なイメージでは機械学習はデータサイエンティストの範囲外だなあ

ビジネスの知識と統計周りの知識があると良いのではないかという気がする

機械学習はAI技術者というイメージ
0152名刺は切らしておりまして
垢版 |
2019/06/30(日) 21:56:55.14ID:LrEVE7/+
科学全体がデータサイエンスだと言えなくもない。
0153名刺は切らしておりまして
垢版 |
2019/07/01(月) 02:32:35.19ID:yPIF2KI7
時代はSAS
0155名刺は切らしておりまして
垢版 |
2019/07/01(月) 08:22:18.06ID:Pgmkj2xk
> 並列計算 引き分け。RもPythonもベースバージョンはマルチコア計算に対して優れたサポートを提供しているとは言い難い
PythonはGPU使った並列計算に強いと言うイメージだが
0156名刺は切らしておりまして
垢版 |
2019/07/01(月) 20:44:47.93ID:HEwS8vex
C#
0159名刺は切らしておりまして
垢版 |
2019/07/01(月) 23:00:31.85ID:qHCA05lE
驚くような内容の論文の査読では、データ処理に使ったのがSASじゃないとまずソフトのバグを疑われるとか。
0160名刺は切らしておりまして
垢版 |
2019/07/02(火) 02:58:30.27ID:Owy4F8a/
SASは今でも売上高課金とかやってんのかねぇ。
0162名刺は切らしておりまして
垢版 |
2019/07/05(金) 07:40:37.68ID:FyO4qbgI
Rは手軽、Pythonは少し面倒。自分でガリガリコードを書けるタイプなら気にならないかもしれないけど。
例えば、線形回帰のステップワイズなんかRはデフォで出来ちゃうし、機械学習も探索の可視化は適当にplotするだけ。
それらをPythonでやろうとするとそこそこ面倒に感じる。
0163名刺は切らしておりまして
垢版 |
2019/07/05(金) 15:00:05.01ID:lvwGoD30
Rはテキストファイル自分で読み書きとか、例外処理とか、
備え付けられている動作から外れて、ちょっと普通のことやろうと思うとややこしい。
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況