X



【IT】Excelはもう古い?ビジネスマン必見のデータ分析最強ツールとは
■ このスレッドは過去ログ倉庫に格納されています
0001ノチラ ★
垢版 |
2018/03/12(月) 16:59:56.93ID:CAP_USER
データ分析最強ツール「R」の実力
Rは、統計分析に特化したプログラミング言語です。プログラミング言語、というくくりではありますが、統計分析に特化したシンプルな作りになっています。

取っ付きやすさの大きな要因になっているのは、データフレーム、という考え方です。データフレームは列と行という表形式になっていて、Excelで扱うデータ形式と似ているため、Excelに慣れ親しんでいる人であれば、少し使ってみるだけでRに対する違和感はすぐに消えることでしょう。

しかもRは決してマイナーなツールではありません。研究者やデータサイエンティストの間では、分析のツールとして非常にポピュラーです。またRはオープンソースであり、世界中のユーザによって日夜開発が進められ、日々進化しています。

そういうとプロの分析者が使うツールだと思われがちですが、実際にはExcel以上に簡単に、かつExcelだけでは対処が難しい問題を解決できます。フリーのツールなので導入もスムーズです。

さきほどExcelに対してあげた三つの問題点である

・データ量が膨大になると動作が不安定
・一度やった分析を保存できない
・すぐに実行できる分析ツールが限られている

について、Rだとどのように対応しているのかみていきます。

(1)大規模データでも軽快に動く

Excelで扱うことができるデータ量ですが、Excel2013では最大行数は1,048,576行、最大列数は16,384列となっています。ただし、実際にはこれ以下の数十万件レベルで動作が不安定になります。

対してRで扱うことができるデータ数は、1000万行程度×400列であれば、PCのスペックにも依存しますが、たいていは動作も軽快です。Excelでは動作が不安定だったデータ量でも、Rならば動作は常に快適です。

(2)分析手順が残るので、やり直しも簡単

Excelの場合は分析手順は基本的に残らないので、自分で記録を取っておく必要があります。手順の実行は基本的に手動です。

対してRはプログラミング言語なので、当然処理の過程がコードとして全て残ります。どこか間違っていても、そこを修正してまたボタン一つで全ての処理をやってくれる。グラフを描く過程もコードにできます。

(3)最新の分析ツール(アルゴリズム)が使える

Excelはマイクロソフトの製品なので、バージョンアップもマイクロソフト次第です。

対してRはオープンソース。全世界から有志が開発に参加しているので、日々改修が行われています。学会で発表された最新のアルゴリズムも、すぐにパッケージがリリースされ、そのパッケージをインストールしさえすればすぐに使えるようになっています。
http://gendai.ismedia.jp/articles/-/54570
0180名刺は切らしておりまして
垢版 |
2018/03/13(火) 09:47:57.99ID:Kk341+HJ
>>165
まともな企業なら同じ規則かそこらに
業務上必須なツールやソフト等々のインストールの申請手続きも決められてるだろ
0181名刺は切らしておりまして
垢版 |
2018/03/13(火) 10:03:46.27ID:z74p7W5o
>>170
ファイルメーカーも10分いいよ
iPadやiPhone等と連携できるから超強い
0182名刺は切らしておりまして
垢版 |
2018/03/13(火) 11:22:37.40ID:22dRceWB
Rは統計には便利だが、これからはExcelでデータ作って、Pythonで直接読み込んで辞書形式に変換してからいろいろな処理を加えて、(必要なら)Excelデータにまた書き戻すというやり方が主流になると思う。
ヒューマンインターフェイスとしてはExcelは分かりやすいから、これからも使われ続けるでしょう。
0183名刺は切らしておりまして
垢版 |
2018/03/13(火) 11:29:03.78ID:5F5emCFu
>>161
R_scr | others
ができないから
0184名刺は切らしておりまして
垢版 |
2018/03/13(火) 11:38:25.71ID:ENiZMK0/
windowsやらofficeのバージョンアップまじ迷惑 どうせ金儲けのために前の切捨てしてるんだろうけど。
使えるハード資源をみすみすゴミにするようなことはまじでやめてほしい
もう2005年くらいから実質のPCの劇的な進化なんてないはずだろうに・・・・
0187名刺は切らしておりまして
垢版 |
2018/03/13(火) 12:58:31.85ID:SZYTUk6j
【衝撃】フジテレビ、暴力団と「ズブズブの関係」
http://daily.2ch.net/test/read.cgi/newsplus/1482138859/
https://www.youtube.com/embed/YEGNqOkpPP8?autoplay=1

【テレビ】傷害容疑でフジテレビ社員逮捕 タクシー乗降巡り男性会社員の顔を踏んで外傷性くも膜下出血を負わせた疑い
http://hayabusa9.5ch.net/test/read.cgi/mnewsplus/1508916873/
https://kamome.5ch.net/test/read.cgi/mnewsplus/1314191608/l50
0188名刺は切らしておりまして
垢版 |
2018/03/13(火) 22:45:48.99ID:fZSDTuES
エクセルで計算とか解析とかしないけど、ワードにはない使い方ができるから
エクセルの方が都合いい時もある。
まあビジネスマンじゃないからどうでもいい
0191名刺は切らしておりまして
垢版 |
2018/03/14(水) 08:26:51.65ID:Tf7F0IFm
>>190
良い点は無償なところだけ
家計ぽつけるならそれでもいいけど
人とやり取りするのは無理
計算もクソ遅い
0194名刺は切らしておりまして
垢版 |
2018/03/14(水) 12:23:39.96ID:w942UkUT
オープンソースの方が商用より優れているというガバガバ理論
0195名刺は切らしておりまして
垢版 |
2018/03/14(水) 16:16:47.20ID:HFEcSm0Y
>>190
オープンオフィスの方が好き
Linuxにもあるし、どのPCでだって使えるから個人でやるなら融通がきいて便利
0196名刺は切らしておりまして
垢版 |
2018/03/14(水) 16:31:50.40ID:83at2t/3
表計算と統計解析ではニーズもユーザー層も全く別だと思うんだけど。
0197名刺は切らしておりまして
垢版 |
2018/03/14(水) 20:23:35.54ID:6nli1zFK
Pythonでいいわ
0198名刺は切らしておりまして
垢版 |
2018/03/14(水) 21:14:24.25ID:O13Q01WT
>>193
ggplot2使えよ。


このスレではRよりもpython派が多いのかな。
Rだとデータ前処理(仕事分析の8割はこれ)にtidyverseが使えるんだけれど、このメリットは考えてない?
dplyr使うと、他の言語で前処理する気がなくなる。
0202名刺は切らしておりまして
垢版 |
2018/03/17(土) 21:59:46.32ID:AYn35Zdr
>>198
一時期ハマって使ったことあったから「dplyr」懐かしい
パイプだかで繋いで処理が短くなるやつだっけ
Rはデータ整形に便利だけど分析には使わないかな
0205名刺は切らしておりまして
垢版 |
2018/03/17(土) 23:36:12.73ID:x0F0YiZ0
どうせアホばっかりで忙しくて流し読みしかしないんだからメモ帳で十分。
0207名刺は切らしておりまして
垢版 |
2018/03/18(日) 04:36:53.05ID:iPkFFf7f
HadleyのR for data science
http://r4ds.had.co.nz
0208名刺は切らしておりまして
垢版 |
2018/03/20(火) 00:21:44.89ID:j7shvhAJ
>>202
今は何使ってんの?
0209名刺は切らしておりまして
垢版 |
2018/03/20(火) 00:47:06.02ID:7a4MLRMS
Rとか今更感
pythonにしとけ
ど阿呆が書いても読める
0210名刺は切らしておりまして
垢版 |
2018/03/20(火) 01:28:58.68ID:dotXIN+D
>>45
俺も真っ先にタブローを思い浮かべた
噂でしか知らないけど
0212名刺は切らしておりまして
垢版 |
2018/03/20(火) 01:46:48.79ID:iUJRHTmI
USDJPYの1分足スキャルピング型EA(自動売買ツール)とサインツールを開発・公開しております。
興味がありましたら見てみてください。
http://wsedrftgyu1234567890.teamblog.jp/archives/7206121.html
0213名刺は切らしておりまして
垢版 |
2018/03/20(火) 17:31:34.33ID:i43vumMJ
>>167
線とか矢印の挿入をできるようにしてくれ。
0219名刺は切らしておりまして
垢版 |
2018/03/20(火) 18:29:14.84ID:94ZcApMy
時代はLISP
異論は認める
0221名刺は切らしておりまして
垢版 |
2018/03/21(水) 11:59:01.28ID:uNMI26Op
>>214
SASはデスクトップの世界では随分前にSPSSに敗退して
エンタープライズの世界の覇者になっていたのでは
今はRやnumpyなんかに押されてる状況かな
0224名刺は切らしておりまして
垢版 |
2018/03/21(水) 12:29:59.23ID:+VsnROjq
ってか、エクセルで問題になるほど大きなデータを扱うビジネスマンって何%を対象にしてドヤ顔してんだよwwwwww
0225名刺は切らしておりまして
垢版 |
2018/03/21(水) 21:21:02.94ID:uedntOD8
正直、統計解析程度ならソフトは何でも良い。
プログラム作って自動化するまでだから
0227名刺は切らしておりまして
垢版 |
2018/03/22(木) 20:13:23.89ID:SehxRSdY
>>225
フルスクラッチでコード書いてんの?
0228名刺は切らしておりまして
垢版 |
2018/03/22(木) 20:24:04.60ID:7tjrcIQ7
これから統計などこれらの分野はAIクラウドで自動化の流れ何だろうね
0229名刺は切らしておりまして
垢版 |
2018/03/22(木) 20:58:43.26ID:xqbrXTWY
>>1
1000万行×400桁って、仮にセルのデータが倍精度浮動小数点数(8バイト/データ)なら、
バイナリデータとして取り込めば、たったの32メガバイトなんだよね。 すべてUnicode文字列で、
全セルの平均文字数が50文字あれば、:3:.2GBになるが。
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況