【IT】Excelはもう古い?ビジネスマン必見のデータ分析最強ツールとは
■ このスレッドは過去ログ倉庫に格納されています
データ分析最強ツール「R」の実力
Rは、統計分析に特化したプログラミング言語です。プログラミング言語、というくくりではありますが、統計分析に特化したシンプルな作りになっています。
取っ付きやすさの大きな要因になっているのは、データフレーム、という考え方です。データフレームは列と行という表形式になっていて、Excelで扱うデータ形式と似ているため、Excelに慣れ親しんでいる人であれば、少し使ってみるだけでRに対する違和感はすぐに消えることでしょう。
しかもRは決してマイナーなツールではありません。研究者やデータサイエンティストの間では、分析のツールとして非常にポピュラーです。またRはオープンソースであり、世界中のユーザによって日夜開発が進められ、日々進化しています。
そういうとプロの分析者が使うツールだと思われがちですが、実際にはExcel以上に簡単に、かつExcelだけでは対処が難しい問題を解決できます。フリーのツールなので導入もスムーズです。
さきほどExcelに対してあげた三つの問題点である
・データ量が膨大になると動作が不安定
・一度やった分析を保存できない
・すぐに実行できる分析ツールが限られている
について、Rだとどのように対応しているのかみていきます。
(1)大規模データでも軽快に動く
Excelで扱うことができるデータ量ですが、Excel2013では最大行数は1,048,576行、最大列数は16,384列となっています。ただし、実際にはこれ以下の数十万件レベルで動作が不安定になります。
対してRで扱うことができるデータ数は、1000万行程度×400列であれば、PCのスペックにも依存しますが、たいていは動作も軽快です。Excelでは動作が不安定だったデータ量でも、Rならば動作は常に快適です。
(2)分析手順が残るので、やり直しも簡単
Excelの場合は分析手順は基本的に残らないので、自分で記録を取っておく必要があります。手順の実行は基本的に手動です。
対してRはプログラミング言語なので、当然処理の過程がコードとして全て残ります。どこか間違っていても、そこを修正してまたボタン一つで全ての処理をやってくれる。グラフを描く過程もコードにできます。
(3)最新の分析ツール(アルゴリズム)が使える
Excelはマイクロソフトの製品なので、バージョンアップもマイクロソフト次第です。
対してRはオープンソース。全世界から有志が開発に参加しているので、日々改修が行われています。学会で発表された最新のアルゴリズムも、すぐにパッケージがリリースされ、そのパッケージをインストールしさえすればすぐに使えるようになっています。
http://gendai.ismedia.jp/articles/-/54570 Excelって説明変数最大で16個って知ってコケたことあるわ >>165
まともな企業なら同じ規則かそこらに
業務上必須なツールやソフト等々のインストールの申請手続きも決められてるだろ >>170
ファイルメーカーも10分いいよ
iPadやiPhone等と連携できるから超強い Rは統計には便利だが、これからはExcelでデータ作って、Pythonで直接読み込んで辞書形式に変換してからいろいろな処理を加えて、(必要なら)Excelデータにまた書き戻すというやり方が主流になると思う。
ヒューマンインターフェイスとしてはExcelは分かりやすいから、これからも使われ続けるでしょう。 >>161
R_scr | others
ができないから windowsやらofficeのバージョンアップまじ迷惑 どうせ金儲けのために前の切捨てしてるんだろうけど。
使えるハード資源をみすみすゴミにするようなことはまじでやめてほしい
もう2005年くらいから実質のPCの劇的な進化なんてないはずだろうに・・・・ エクセルで計算とか解析とかしないけど、ワードにはない使い方ができるから
エクセルの方が都合いい時もある。
まあビジネスマンじゃないからどうでもいい オープンオフィスがいいと思う人
いないの・・・・・?
印刷できるのに >>190
良い点は無償なところだけ
家計ぽつけるならそれでもいいけど
人とやり取りするのは無理
計算もクソ遅い Rとgnuplotを統合してほしい。
さらにjavaを統合したのがPhythonな気もするが。 オープンソースの方が商用より優れているというガバガバ理論 >>190
オープンオフィスの方が好き
Linuxにもあるし、どのPCでだって使えるから個人でやるなら融通がきいて便利 表計算と統計解析ではニーズもユーザー層も全く別だと思うんだけど。 >>193
ggplot2使えよ。
このスレではRよりもpython派が多いのかな。
Rだとデータ前処理(仕事分析の8割はこれ)にtidyverseが使えるんだけれど、このメリットは考えてない?
dplyr使うと、他の言語で前処理する気がなくなる。 pythonから pyperで必要に応じてRを呼び出せばいい なんでデータベース系ツールや
SQLすっ飛ばして
いきなりRなんだ… >>198
一時期ハマって使ったことあったから「dplyr」懐かしい
パイプだかで繋いで処理が短くなるやつだっけ
Rはデータ整形に便利だけど分析には使わないかな >>201
オフィスユーザーがsqlightでも使うのか??? どうせアホばっかりで忙しくて流し読みしかしないんだからメモ帳で十分。 >>204
Rなんてなおさら使わんだろ
SQL以上に敷居が高いわ HadleyのR for data science
http://r4ds.had.co.nz Rとか今更感
pythonにしとけ
ど阿呆が書いても読める >>45
俺も真っ先にタブローを思い浮かべた
噂でしか知らないけど USDJPYの1分足スキャルピング型EA(自動売買ツール)とサインツールを開発・公開しております。
興味がありましたら見てみてください。
http://wsedrftgyu1234567890.teamblog.jp/archives/7206121.html >>167
線とか矢印の挿入をできるようにしてくれ。 >>76
R、SAS、SPSSのデータ入力フロントエンドはエクセルが便利。 >>83
データベースに強いのと、統計解析に強いのと、用途が違うとしか言いようが無い。 ビジネスパーソンのデータ分析ツールのde facto standardはExcellですね。 >>214
SASはデスクトップの世界では随分前にSPSSに敗退して
エンタープライズの世界の覇者になっていたのでは
今はRやnumpyなんかに押されてる状況かな >>220
整理計算してるだけで分析はしてないのでは ってか、エクセルで問題になるほど大きなデータを扱うビジネスマンって何%を対象にしてドヤ顔してんだよwwwwww 正直、統計解析程度ならソフトは何でも良い。
プログラム作って自動化するまでだから これから統計などこれらの分野はAIクラウドで自動化の流れ何だろうね >>1
1000万行×400桁って、仮にセルのデータが倍精度浮動小数点数(8バイト/データ)なら、
バイナリデータとして取り込めば、たったの32メガバイトなんだよね。 すべてUnicode文字列で、
全セルの平均文字数が50文字あれば、:3:.2GBになるが。 ■ このスレッドは過去ログ倉庫に格納されています