X



【IT】Excelはもう古い?ビジネスマン必見のデータ分析最強ツールとは
■ このスレッドは過去ログ倉庫に格納されています
0001ノチラ ★2018/03/12(月) 16:59:56.93ID:CAP_USER
データ分析最強ツール「R」の実力
Rは、統計分析に特化したプログラミング言語です。プログラミング言語、というくくりではありますが、統計分析に特化したシンプルな作りになっています。

取っ付きやすさの大きな要因になっているのは、データフレーム、という考え方です。データフレームは列と行という表形式になっていて、Excelで扱うデータ形式と似ているため、Excelに慣れ親しんでいる人であれば、少し使ってみるだけでRに対する違和感はすぐに消えることでしょう。

しかもRは決してマイナーなツールではありません。研究者やデータサイエンティストの間では、分析のツールとして非常にポピュラーです。またRはオープンソースであり、世界中のユーザによって日夜開発が進められ、日々進化しています。

そういうとプロの分析者が使うツールだと思われがちですが、実際にはExcel以上に簡単に、かつExcelだけでは対処が難しい問題を解決できます。フリーのツールなので導入もスムーズです。

さきほどExcelに対してあげた三つの問題点である

・データ量が膨大になると動作が不安定
・一度やった分析を保存できない
・すぐに実行できる分析ツールが限られている

について、Rだとどのように対応しているのかみていきます。

(1)大規模データでも軽快に動く

Excelで扱うことができるデータ量ですが、Excel2013では最大行数は1,048,576行、最大列数は16,384列となっています。ただし、実際にはこれ以下の数十万件レベルで動作が不安定になります。

対してRで扱うことができるデータ数は、1000万行程度×400列であれば、PCのスペックにも依存しますが、たいていは動作も軽快です。Excelでは動作が不安定だったデータ量でも、Rならば動作は常に快適です。

(2)分析手順が残るので、やり直しも簡単

Excelの場合は分析手順は基本的に残らないので、自分で記録を取っておく必要があります。手順の実行は基本的に手動です。

対してRはプログラミング言語なので、当然処理の過程がコードとして全て残ります。どこか間違っていても、そこを修正してまたボタン一つで全ての処理をやってくれる。グラフを描く過程もコードにできます。

(3)最新の分析ツール(アルゴリズム)が使える

Excelはマイクロソフトの製品なので、バージョンアップもマイクロソフト次第です。

対してRはオープンソース。全世界から有志が開発に参加しているので、日々改修が行われています。学会で発表された最新のアルゴリズムも、すぐにパッケージがリリースされ、そのパッケージをインストールしさえすればすぐに使えるようになっています。
http://gendai.ismedia.jp/articles/-/54570
0002名刺は切らしておりまして2018/03/12(月) 17:01:46.66ID:Pak7tG0q
時代はロータス123
0004名刺は切らしておりまして2018/03/12(月) 17:05:03.93ID:NqTRFN/w
その前にアクセスという考えはないのか?
0006名刺は切らしておりまして2018/03/12(月) 17:07:12.78ID:EZ9wtn/E
名前がRて…固有名詞なら、もっと検索で識別しやすい名前にすればいいのに
0007名刺は切らしておりまして2018/03/12(月) 17:09:05.90ID:cp17+xLM
一太郎だろ
0009名刺は切らしておりまして2018/03/12(月) 17:09:48.66ID:HcxVVlE2
クビになったけど
物理的思考で儲けた実話
不動産のアービトラージ
で六本木ヒルズに住む
株価の上げ下げ無関係に
儲けるδヘッジなど
労働以外の選択肢↓

物理 儲け

で検索
0010名刺は切らしておりまして2018/03/12(月) 17:09:58.07ID:6AZJsAkD
A3で印字しても見えないくらい縮小されてたら
見る気もしない
0012名刺は切らしておりまして2018/03/12(月) 17:10:31.46ID:jQ9bWXiM
他の言語とどう違うの?
Fortran, Pascal, C, C++, Perl, PHP, Java, Python その他シェルとかいろいろやった俺に
説明してみて
0013名刺は切らしておりまして2018/03/12(月) 17:11:04.92ID:+IT0Qtql
究極超人
0014名刺は切らしておりまして2018/03/12(月) 17:12:04.07ID:metLimP+
あ〜る?
0015名刺は切らしておりまして2018/03/12(月) 17:12:29.94ID:3FrUtBNq
Rは言語であってアプリケーションじゃないだろ そもそも比較するのがおかしい
0016名刺は切らしておりまして2018/03/12(月) 17:13:49.42ID:K2beRpqj
>>1
コード必須とか比較対象はExcelじゃないだろ
Accessあたりじゃないの
こっちはGUI操作も出来るが
0018名刺は切らしておりまして2018/03/12(月) 17:15:09.82ID:Ixv1fD1i
数十万件レベルのデータをExcelの中に置いたりするのかね
0020名刺は切らしておりまして2018/03/12(月) 17:17:53.09ID:wKz1alow
フリーソフトだっけ?
でも、理系学部の人たちが使うものでしょ。
ウィンドウズが跋扈する社内で、使っても、孤立するだけだし。
0021名刺は切らしておりまして2018/03/12(月) 17:18:12.11ID:QjgFiNCy
Rかなと思ってスレ開いたらRだった
0022名刺は切らしておりまして2018/03/12(月) 17:18:28.53ID:6AZJsAkD
>>18
某生保ではやってます
PC処理能力が必要です(でかいとフリーズする)
いろんな観点で分析するので
0023名刺は切らしておりまして2018/03/12(月) 17:19:42.51ID:5diXXeGG
マジレスをすると、まともに統計解析やりたいなら、SPSSとかの統計専門ソフトだろうね。
0024名刺は切らしておりまして2018/03/12(月) 17:20:12.74ID:REpEctks
>>12
統計処理特化言語
統計処理というのは基本的に複数の処理方法の結果が欲しい
例えば高校生レベルなら
最大、最小、平均、中央値 が欲しくなったりする
この言語だと summary 関数呼び出せばそれらがまとめて一気に手に入る
同様に t検定だと t.test で
p値のみならず信頼区間などよく使う関連性の高いものがまとめて出力される

このように、Rを使うのは統計処理をする関数の中身が
よく使う処理をまとめて行ってくれる手軽さが魅力的な言語だ
0025名刺は切らしておりまして2018/03/12(月) 17:21:17.52ID:5diXXeGG
>>22

保険料の払い渋りでボロ儲けしてるんだから、SPSSぐらいサクッと経費で買えよw
0026名刺は切らしておりまして2018/03/12(月) 17:22:21.08ID:REpEctks
ところで cygwin にR言語インストールできなくて困ってる
ビルドにも失敗する
Linuxだとパッケージで一発なのだが
0027名刺は切らしておりまして2018/03/12(月) 17:23:00.99ID:6AZJsAkD
>>25
保険金な
0030名刺は切らしておりまして2018/03/12(月) 17:24:32.30ID:5ZDUF0gX
いや、excelと比較するならS-PLUSだろw
0031名刺は切らしておりまして2018/03/12(月) 17:26:10.22ID:a2aEjAUv
ツールというならSPSSとかTensor Flowとかだと思ってた
0032名刺は切らしておりまして2018/03/12(月) 17:26:24.44ID:REDaQunm
そういえば、昔、論文書くときに使ってた!
0033名刺は切らしておりまして2018/03/12(月) 17:26:26.14ID:4vkYI8dc
ExcelかRかっていう二択な時点で頭悪すぎる。
Excelでデータ入力してRで読んで解析が効率良いだろ。
0035名刺は切らしておりまして2018/03/12(月) 17:27:29.23ID:6AZJsAkD
全然しらないけどデータの取り込みはどうやるの?
0037名刺は切らしておりまして2018/03/12(月) 17:27:53.15ID:0HViObuh
>>26
ファイル足りないか更新が必要なんじゃね
0039名刺は切らしておりまして2018/03/12(月) 17:28:03.32ID:PMYVPBv1
方眼紙上手く書けるかな?
0040名刺は切らしておりまして2018/03/12(月) 17:28:40.33ID:QyQzo3ON
>>26
Windows使うのやめればいいだけだな
俺はWindows使わなくていい会社に転職した
0041名刺は切らしておりまして2018/03/12(月) 17:30:06.81ID:6AZJsAkD
>>33
最初にエクセルシートのデータ入力して
使うのか?
VBAより簡単?
0044名刺は切らしておりまして2018/03/12(月) 17:34:29.38ID:xTRuxrfd
検索しづらい名称つけたら最後
すぐ廃れる
0047名刺は切らしておりまして2018/03/12(月) 17:46:12.81ID:JfkRhsW3
エクセル→R はハードル高いだろwww
0048名刺は切らしておりまして2018/03/12(月) 17:46:31.89ID:z9farOJI
そんなにRがいいならなんでEXCELの方が普及してんだ? ん〜?
0050名刺は切らしておりまして2018/03/12(月) 17:50:14.00ID:M9e41MvN
ロータス、Microsoftオフィス97で十分。
フリーソフトだしな。w
0051名刺は切らしておりまして2018/03/12(月) 17:50:43.84ID:5cCyQkgL
むしろPythonのJupyter Notebook、PyMCやscikit-learnの開発が進んだからRも古い
今更統計処理に特化したRを習うならPythonを習得したほうが効率的
0052名刺は切らしておりまして2018/03/12(月) 17:53:30.29ID:vBhy/39r
Rは便利だけど、先を考えると、Pythonの方がええで。
0054名刺は切らしておりまして2018/03/12(月) 17:55:21.60ID:M9e41MvN
ソフトの進歩も一段落。

なんでわざわざ金を出して、操作しずらいソフトを買うの?

著作権切れのオフィスや一太郎でも十分だろう?
0055名刺は切らしておりまして2018/03/12(月) 17:55:25.59ID:5KfyZxM9
今の最先端は、計算尺じゃよ。
ソロバンも会社に導入しよう。
0056名刺は切らしておりまして2018/03/12(月) 17:59:54.50ID:LOZYloRg
技術職ならまだしも、普通のビジネスマンがR使う必要性がない
0057名刺は切らしておりまして2018/03/12(月) 18:03:04.47ID:juPZJ28D
題名見てRかなあと思ったらやっぱりそうでワロタ
普通のサラリーマンがわざわざ言語を勉強してRなんか使うわけねーだろうが
はっきり言ってエクセルで充分
0058名刺は切らしておりまして2018/03/12(月) 18:07:22.34ID:M9e41MvN
古い一太郎やエクセルでも変換できるソフトが有るから、
使いづらくなった最新ソフトをいたずらに追う必要はないだろう?
古い一太郎ファイルを貰う→変換ソフトで新しいワードで使う。
→変換ソフトで古い一太郎に変換する。w

http://www.systemport.co.jp/product/cs17/taio_wp.html
0059名刺は切らしておりまして2018/03/12(月) 18:09:12.40ID:AbgikzTX
おまえらは一体何の話しをしているのだ
0060名刺は切らしておりまして2018/03/12(月) 18:11:51.44ID:iYfEHRc4
どっちが上とか下とかいってもしょうがないだろうな
単純にデータを入力収集するならエクセル
簡単な統計解析もエクセルでできる
より本格的な(しかし典型的な)処理が必要ならRに持ってく
さらに独自の処理をしたいならパイソンとかで自分で制御
0062名刺は切らしておりまして2018/03/12(月) 18:19:54.11ID:5oBOBaes
日本人ならなんでもExcel
0063名刺は切らしておりまして2018/03/12(月) 18:24:41.66ID:bdi4plEQ
マルウェアとか大丈夫か?
0064名刺は切らしておりまして2018/03/12(月) 18:24:45.57ID:M9e41MvN
ちょっと前までは、パワポ職人が大企業では重宝されていたようだな。
内容よりも見た目重視。(プレゼン重視)
生産性大幅に低下。
0065名刺は切らしておりまして2018/03/12(月) 18:26:53.32ID:b3M126Ph
「博士採用数と業績はご覧のとおり負の相関があります。
つまり博士を採用すると業績が悪化します。」
「でもさ、結局統計でしょ?本人の頑張り次第だから」

これがお前らの職場の会話だろ、Rとか全く不要
0066名刺は切らしておりまして2018/03/12(月) 18:39:35.55ID:+wL59YD5
>>4
それな。
あんまりこの手のプロダクツとか
テクノロジーに詳しくない奴が書いてるのかな。
0068名刺は切らしておりまして2018/03/12(月) 18:43:51.21ID:MZcf5l6L
なんでソフトと言語を比べるの?
馬鹿なの?死ぬの?
0071名刺は切らしておりまして2018/03/12(月) 18:50:27.61ID:G80xAUBF
GT-R
0072名刺は切らしておりまして2018/03/12(月) 18:50:47.02ID:ArvFJACA
分析するのは能力と才能、ツールは補助でしかない。

どんなにすごい道具をブタ、猫に与えても、豚に真珠、猫に小判
0073名刺は切らしておりまして2018/03/12(月) 18:53:49.66ID:xSzdDIxW
30代だが大学はMatlab使ってたな。
それより便利なん?
0074名刺は切らしておりまして2018/03/12(月) 18:54:23.23ID:SJn1Dgio
エクセルに分析ツール入れると統計処理にも結構使える
グラフ化など見栄え良くするにも便利
Rは言語が簡単なのでプログラミングの学習にも使えそう
0075名刺は切らしておりまして2018/03/12(月) 18:55:07.00ID:5diXXeGG
私の目の前に統計の神が現れ
「ホスト・コンピューターでSASを使え!」
とおっしゃった。

〜オレ記より抜粋。
0077名刺は切らしておりまして2018/03/12(月) 18:59:05.05ID:9bzN2lmg
>>68
バカでR
0079名刺は切らしておりまして2018/03/12(月) 19:01:50.38ID:5diXXeGG
ここ、滅び去ったStatViewを懐かしむスレになれる?
0082名刺は切らしておりまして2018/03/12(月) 19:06:59.21ID:LornznaL
Excellは重過ぎるよ
Office2000の機能でいいから、Rとやらで同機能Versionを作ってくれ
0083名刺は切らしておりまして2018/03/12(月) 19:11:55.33ID:6EBntLPo
PostgreSQL、MySQL は?
0084名刺は切らしておりまして2018/03/12(月) 19:13:52.22ID:rLDpT86R
統計処理ソフトが統計に強いのは当たり前だろw

差は、Rを使えるのは統計学を使える人ってこと
除算もおぼつかない最近の大卒者にはExcelだって荷が重い
0085名刺は切らしておりまして2018/03/12(月) 19:15:25.23ID:kBAmZYFE
>>1
excelだってマクロで処理の過程をコードで記録できるやろ編集もできるし
0086名刺は切らしておりまして2018/03/12(月) 19:16:24.41ID:81PcVmlb
究極超人かよ
0087名刺は切らしておりまして2018/03/12(月) 19:16:37.09ID:HfCB3ufZ
>>6
本当にその通りだ。
0090名刺は切らしておりまして2018/03/12(月) 19:18:57.96ID:N9kcLVGT
Rって大学で習った覚えがあるけど結局どういうものか分からんかった
それよりFirefox-ESRを主流に戻せや。アドオン使えないならEdgeでもええんやで?
0092名刺は切らしておりまして2018/03/12(月) 19:22:08.37ID:QuTCnr3p
役割がエクセルと違うような気がするが
0094名刺は切らしておりまして2018/03/12(月) 19:25:57.81ID:aE6pzPC+
400万件も打つ人がいません。
0096名刺は切らしておりまして2018/03/12(月) 19:30:30.52ID:T026kneF
>>94
そなんよな
普通のビジネスマンが、個人のデスクトップで、そんなに大量のレコードを解析することがない。
そもそもピボット集計程度なケースの方が多いので、Excelの方が使い勝手がいい。
0097名刺は切らしておりまして2018/03/12(月) 19:31:27.55ID:HfCB3ufZ
これで家計簿つけられますか?
ピボットで分析したいのだけど。
0098名刺は切らしておりまして2018/03/12(月) 19:31:50.94ID:uRRefUa4
神エクセルが大好きなエクセリアン達は
統計処理ツールじゃなくてワープロだと思ってるから
RではExcel駆逐不可だと思う。

アイツラはオートフィルタすら使ってねーもん。
0099名刺は切らしておりまして2018/03/12(月) 19:32:45.64ID:nU4J+A8m
3次元データ処理ができるキュービックカルクは名ソフトだった
最新版があれば今でも使いたいくらい
0100名刺は切らしておりまして2018/03/12(月) 19:35:38.50ID:ba+Xe5y6
accessでええやん。
データがでかかったらDBに置けばいいだけ
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況