【IT】Excelはもう古い?ビジネスマン必見のデータ分析最強ツールとは
■ このスレッドは過去ログ倉庫に格納されています
データ分析最強ツール「R」の実力
Rは、統計分析に特化したプログラミング言語です。プログラミング言語、というくくりではありますが、統計分析に特化したシンプルな作りになっています。
取っ付きやすさの大きな要因になっているのは、データフレーム、という考え方です。データフレームは列と行という表形式になっていて、Excelで扱うデータ形式と似ているため、Excelに慣れ親しんでいる人であれば、少し使ってみるだけでRに対する違和感はすぐに消えることでしょう。
しかもRは決してマイナーなツールではありません。研究者やデータサイエンティストの間では、分析のツールとして非常にポピュラーです。またRはオープンソースであり、世界中のユーザによって日夜開発が進められ、日々進化しています。
そういうとプロの分析者が使うツールだと思われがちですが、実際にはExcel以上に簡単に、かつExcelだけでは対処が難しい問題を解決できます。フリーのツールなので導入もスムーズです。
さきほどExcelに対してあげた三つの問題点である
・データ量が膨大になると動作が不安定
・一度やった分析を保存できない
・すぐに実行できる分析ツールが限られている
について、Rだとどのように対応しているのかみていきます。
(1)大規模データでも軽快に動く
Excelで扱うことができるデータ量ですが、Excel2013では最大行数は1,048,576行、最大列数は16,384列となっています。ただし、実際にはこれ以下の数十万件レベルで動作が不安定になります。
対してRで扱うことができるデータ数は、1000万行程度×400列であれば、PCのスペックにも依存しますが、たいていは動作も軽快です。Excelでは動作が不安定だったデータ量でも、Rならば動作は常に快適です。
(2)分析手順が残るので、やり直しも簡単
Excelの場合は分析手順は基本的に残らないので、自分で記録を取っておく必要があります。手順の実行は基本的に手動です。
対してRはプログラミング言語なので、当然処理の過程がコードとして全て残ります。どこか間違っていても、そこを修正してまたボタン一つで全ての処理をやってくれる。グラフを描く過程もコードにできます。
(3)最新の分析ツール(アルゴリズム)が使える
Excelはマイクロソフトの製品なので、バージョンアップもマイクロソフト次第です。
対してRはオープンソース。全世界から有志が開発に参加しているので、日々改修が行われています。学会で発表された最新のアルゴリズムも、すぐにパッケージがリリースされ、そのパッケージをインストールしさえすればすぐに使えるようになっています。
http://gendai.ismedia.jp/articles/-/54570 ExcelマクロでRに変換する案件が増えて良かったな 名前がRて…固有名詞なら、もっと検索で識別しやすい名前にすればいいのに クビになったけど
物理的思考で儲けた実話
不動産のアービトラージ
で六本木ヒルズに住む
株価の上げ下げ無関係に
儲けるδヘッジなど
労働以外の選択肢↓
物理 儲け
で検索 A3で印字しても見えないくらい縮小されてたら
見る気もしない 他の言語とどう違うの?
Fortran, Pascal, C, C++, Perl, PHP, Java, Python その他シェルとかいろいろやった俺に
説明してみて Rは言語であってアプリケーションじゃないだろ そもそも比較するのがおかしい >>1
コード必須とか比較対象はExcelじゃないだろ
Accessあたりじゃないの
こっちはGUI操作も出来るが 数十万件レベルのデータをExcelの中に置いたりするのかね フリーソフトだっけ?
でも、理系学部の人たちが使うものでしょ。
ウィンドウズが跋扈する社内で、使っても、孤立するだけだし。 >>18
某生保ではやってます
PC処理能力が必要です(でかいとフリーズする)
いろんな観点で分析するので マジレスをすると、まともに統計解析やりたいなら、SPSSとかの統計専門ソフトだろうね。 >>12
統計処理特化言語
統計処理というのは基本的に複数の処理方法の結果が欲しい
例えば高校生レベルなら
最大、最小、平均、中央値 が欲しくなったりする
この言語だと summary 関数呼び出せばそれらがまとめて一気に手に入る
同様に t検定だと t.test で
p値のみならず信頼区間などよく使う関連性の高いものがまとめて出力される
このように、Rを使うのは統計処理をする関数の中身が
よく使う処理をまとめて行ってくれる手軽さが魅力的な言語だ >>22
保険料の払い渋りでボロ儲けしてるんだから、SPSSぐらいサクッと経費で買えよw ところで cygwin にR言語インストールできなくて困ってる
ビルドにも失敗する
Linuxだとパッケージで一発なのだが ツールというならSPSSとかTensor Flowとかだと思ってた ExcelかRかっていう二択な時点で頭悪すぎる。
Excelでデータ入力してRで読んで解析が効率良いだろ。 >>26
Windows使うのやめればいいだけだな
俺はWindows使わなくていい会社に転職した >>33
最初にエクセルシートのデータ入力して
使うのか?
VBAより簡単? そんなにRがいいならなんでEXCELの方が普及してんだ? ん〜? ロータス、Microsoftオフィス97で十分。
フリーソフトだしな。w むしろPythonのJupyter Notebook、PyMCやscikit-learnの開発が進んだからRも古い
今更統計処理に特化したRを習うならPythonを習得したほうが効率的 Rは便利だけど、先を考えると、Pythonの方がええで。 >>41
やろうとしている内容にもよるだろうけど、総じてRの方が手軽だと思う。 ソフトの進歩も一段落。
なんでわざわざ金を出して、操作しずらいソフトを買うの?
著作権切れのオフィスや一太郎でも十分だろう? 今の最先端は、計算尺じゃよ。
ソロバンも会社に導入しよう。 技術職ならまだしも、普通のビジネスマンがR使う必要性がない 題名見てRかなあと思ったらやっぱりそうでワロタ
普通のサラリーマンがわざわざ言語を勉強してRなんか使うわけねーだろうが
はっきり言ってエクセルで充分 古い一太郎やエクセルでも変換できるソフトが有るから、
使いづらくなった最新ソフトをいたずらに追う必要はないだろう?
古い一太郎ファイルを貰う→変換ソフトで新しいワードで使う。
→変換ソフトで古い一太郎に変換する。w
http://www.systemport.co.jp/product/cs17/taio_wp.html どっちが上とか下とかいってもしょうがないだろうな
単純にデータを入力収集するならエクセル
簡単な統計解析もエクセルでできる
より本格的な(しかし典型的な)処理が必要ならRに持ってく
さらに独自の処理をしたいならパイソンとかで自分で制御 ちょっと前までは、パワポ職人が大企業では重宝されていたようだな。
内容よりも見た目重視。(プレゼン重視)
生産性大幅に低下。 「博士採用数と業績はご覧のとおり負の相関があります。
つまり博士を採用すると業績が悪化します。」
「でもさ、結局統計でしょ?本人の頑張り次第だから」
これがお前らの職場の会話だろ、Rとか全く不要 >>4
それな。
あんまりこの手のプロダクツとか
テクノロジーに詳しくない奴が書いてるのかな。 なんでソフトと言語を比べるの?
馬鹿なの?死ぬの? こう言う時ネーミングをもっと考えないのかね
Cが元凶か 分析するのは能力と才能、ツールは補助でしかない。
どんなにすごい道具をブタ、猫に与えても、豚に真珠、猫に小判 30代だが大学はMatlab使ってたな。
それより便利なん? エクセルに分析ツール入れると統計処理にも結構使える
グラフ化など見栄え良くするにも便利
Rは言語が簡単なのでプログラミングの学習にも使えそう 私の目の前に統計の神が現れ
「ホスト・コンピューターでSASを使え!」
とおっしゃった。
〜オレ記より抜粋。 ここ、滅び去ったStatViewを懐かしむスレになれる? Excellは重過ぎるよ
Office2000の機能でいいから、Rとやらで同機能Versionを作ってくれ 統計処理ソフトが統計に強いのは当たり前だろw
差は、Rを使えるのは統計学を使える人ってこと
除算もおぼつかない最近の大卒者にはExcelだって荷が重い >>1
excelだってマクロで処理の過程をコードで記録できるやろ編集もできるし Rって大学で習った覚えがあるけど結局どういうものか分からんかった
それよりFirefox-ESRを主流に戻せや。アドオン使えないならEdgeでもええんやで? >>94
そなんよな
普通のビジネスマンが、個人のデスクトップで、そんなに大量のレコードを解析することがない。
そもそもピボット集計程度なケースの方が多いので、Excelの方が使い勝手がいい。 これで家計簿つけられますか?
ピボットで分析したいのだけど。 神エクセルが大好きなエクセリアン達は
統計処理ツールじゃなくてワープロだと思ってるから
RではExcel駆逐不可だと思う。
アイツラはオートフィルタすら使ってねーもん。 3次元データ処理ができるキュービックカルクは名ソフトだった
最新版があれば今でも使いたいくらい accessでええやん。
データがでかかったらDBに置けばいいだけ 名前考えてくれよ、他の人に言う時も「R」ってなんとなく言うの躊躇する 他社にデータが送れない時点でOUT!
独りよがりの分析ツールは、変人扱いされる RってSのフリーバージョンみたいなもんでしょ
Sは昔FreeBSD版を使ってたが、分厚いマニュアルと格闘した記憶しかない
SASやSPSSだったらまだわかる ネタでRとかこうと思ったらRか
出世したな
というか金あるなら普通にSPSS買えよ BusinessObjectとかの方がリーマンはとっつきやすいと思うけどな。 研究するわけじゃないならRなんかいらん
ビジネスの流行りは、ダッシュポード化だろ
誰がつけたんだか、ダッシュポード化なんて名前
場所が違うだろ
インパネ周り化って言いたかったんじゃないの? GUIのついたアプリケーションとただの言語を比較してるのっておかしくね
とおもったらソースなるほどね
あほしかおらんとこだった >>108
pythonはExcelに組み込まれるとか言われてるしpythonでいいと思う
ただRに比べてpythonは遅い(そんな大量のデータ普通使わないけど) エクセルみたいに、素人が直ぐ使いこなせるものじゃ
ないよ。 その点は、Linuxを使いこなすのと同じでしょ。 今のgnumericってビジネスマンが使えるレベル? >>4
アクセスは決まったデータでサマリを作るのに適しているけど、明細を細かく都度修正しながら見るのには向かない。Excelはそれができる。それだけ。 そもそも用途が違うだろうに
紙を切りたい人間に理髪用ハサミ勧めるような馬鹿はやめろよ 95はもう使わないし、2000にはエクセル2003入れてっし 2003でたいていのソフト作ってっからXPでも7でも10でもOSあがっても読んでくれるからそれでいいよ 充分だよ。 >>118
perl -lane
正規表現に差があるから一応把握しておいたほうがいい ちょと用途は低いけど僕は物を大事にするのでいまだにワープロ使ってます 大好きです ↑おめなそれとこれとは話が違うべ コンピューターの演算の話してるんだべ 俺よりバガめっけ >>6
へ? Language R で検索すりゃいいじゃん。 >>94
>400万件も打つ人がいません。
手入力ではない
既存のデータ管理とかログ調査とかそう行った方面
ま、でも何万件ってレベルのデータなら前処理するべきだろうけどね
で、Rって日本語使えるの?
この手のフリーウエアって日本語対応がイマイチな印象だけど
信者は「できます」って言うけど突っ込んで聞いてみると「表示はできます」レベルだったりすることがほとんどだし
ちゃんと日本語込みの文字列扱えるの?何文字目から何文字目とか なんだかなぁ
ExcelとRを比較するなんて、まるでWordとTexを比較しているような気がするんだが・・・
意味あるのかよくわからんのだが? >データ分析最強ツール「R」の実力
それはない。
半端な理解でライターがいい加減な記事書いてるのか、何かのステマだろう。
ちょっとエクセル使える程度でRは使いこなせないし、
いまさらRはじめるよりは、Python+Jupyterだろう。
つか、分析ツールにエクセルなんか使ってるレベルじゃRなんか必要ない。 包丁はもう古い?主婦必見のカットツール・ハサミ
みたいな感じ 何故にわざわざ「R」?
R使うなら「EZR」だし、
法人ならSPSSかJMPでしょ ぼくの親友の悪口ゆうな
Excelはとても大事な親友 エクセルはあくまで一般向け
解析の専門家がエクセルしか使ってないなんてあり得んだろ
しかも他にもメジャーなツールなんて幾らでもある
アホな記事だな〜 >>1
この記事書いた馬鹿は誰だ?
言語とアプリを比較すんなよ 10年前に社外取締役のオッサンに
自慢されたの思い出した Excelは「中途半端に」何でもできるのが強みであり困ったところなんだよなぁ Rってネットでわかんないこと検索するのにどうやって検索するの?
Rって探しにくくね?Cもそうだが。 Rはセルの結合できるの?ワープロ代わりになる?
日本では大事なことよ? >>143
普通に検索して普通に出てくる
ネット初期の検索エンジンを使ってるんじゃあるまいし 日本人にとってExcelはデータ分析ツールではなく
ワープロソフトであり、プレゼンツールであり、CADツールである えっエクセルってデータ分析できるの!?
ただの表計算ソフトだと思ってた >>151
VBAでマクロいれ込めば ある一定の分析はできるでしょ てか、これってビジネスマンが使うんか?
研究者じゃなくて? >>154
回帰モデリングとか数値的な将来予測を行おうと思ったら、
こういう統計ソフト使わないと無理 アマゾンプライムで流れてるMR ROBOTでkibanaという雅な名前の
ビジュアライザーっていうのかな、あれかっこいいなと思った。
テレビドラマってデスクトップ画面見せるだけでもMSとかAppleに使用料払わなきゃならないからか
たいてい謎のOS画面だったりするが、アメリカの大企業って案外
私的利用を徹底的に排除するために、クライアントPCもlinuxベース、webアプリを中心に
仕事してるのかもしれん。 エクセルでデータ分析って誰がやってるんだ?
分析とまで言うような事柄は専用ソフト使ったりしちゃうけど >>26
R for Windows使えばいいんじゃないの うちの女性社員でも20代30代はピボット、マクロ、アクセス使うけど、40代以上はピボットまでだな。 まともな会社なら、野良ツールインストール禁止なのでエクセルかアクセス使うしかない >>166
セキュリティー対策のしっかりしている一部上場企業 Googleを信用してなんでも会社の情報を置く神経がわからん 有名なExcelの名を使われた典型的な詐欺記事
これをクリックした人はオレオレ詐欺にも気をつけよう ソルバーみたいな破壊的計算をするならRでもいいかもしれんけど
Excelはビジュアルに式を組めてしかも参照透過だからいいんだよ
Excelは凄いんだそ Excelって説明変数最大で16個って知ってコケたことあるわ >>165
まともな企業なら同じ規則かそこらに
業務上必須なツールやソフト等々のインストールの申請手続きも決められてるだろ >>170
ファイルメーカーも10分いいよ
iPadやiPhone等と連携できるから超強い Rは統計には便利だが、これからはExcelでデータ作って、Pythonで直接読み込んで辞書形式に変換してからいろいろな処理を加えて、(必要なら)Excelデータにまた書き戻すというやり方が主流になると思う。
ヒューマンインターフェイスとしてはExcelは分かりやすいから、これからも使われ続けるでしょう。 >>161
R_scr | others
ができないから windowsやらofficeのバージョンアップまじ迷惑 どうせ金儲けのために前の切捨てしてるんだろうけど。
使えるハード資源をみすみすゴミにするようなことはまじでやめてほしい
もう2005年くらいから実質のPCの劇的な進化なんてないはずだろうに・・・・ エクセルで計算とか解析とかしないけど、ワードにはない使い方ができるから
エクセルの方が都合いい時もある。
まあビジネスマンじゃないからどうでもいい オープンオフィスがいいと思う人
いないの・・・・・?
印刷できるのに >>190
良い点は無償なところだけ
家計ぽつけるならそれでもいいけど
人とやり取りするのは無理
計算もクソ遅い Rとgnuplotを統合してほしい。
さらにjavaを統合したのがPhythonな気もするが。 オープンソースの方が商用より優れているというガバガバ理論 >>190
オープンオフィスの方が好き
Linuxにもあるし、どのPCでだって使えるから個人でやるなら融通がきいて便利 表計算と統計解析ではニーズもユーザー層も全く別だと思うんだけど。 >>193
ggplot2使えよ。
このスレではRよりもpython派が多いのかな。
Rだとデータ前処理(仕事分析の8割はこれ)にtidyverseが使えるんだけれど、このメリットは考えてない?
dplyr使うと、他の言語で前処理する気がなくなる。 pythonから pyperで必要に応じてRを呼び出せばいい なんでデータベース系ツールや
SQLすっ飛ばして
いきなりRなんだ… >>198
一時期ハマって使ったことあったから「dplyr」懐かしい
パイプだかで繋いで処理が短くなるやつだっけ
Rはデータ整形に便利だけど分析には使わないかな >>201
オフィスユーザーがsqlightでも使うのか??? どうせアホばっかりで忙しくて流し読みしかしないんだからメモ帳で十分。 >>204
Rなんてなおさら使わんだろ
SQL以上に敷居が高いわ HadleyのR for data science
http://r4ds.had.co.nz Rとか今更感
pythonにしとけ
ど阿呆が書いても読める >>45
俺も真っ先にタブローを思い浮かべた
噂でしか知らないけど USDJPYの1分足スキャルピング型EA(自動売買ツール)とサインツールを開発・公開しております。
興味がありましたら見てみてください。
http://wsedrftgyu1234567890.teamblog.jp/archives/7206121.html >>167
線とか矢印の挿入をできるようにしてくれ。 >>76
R、SAS、SPSSのデータ入力フロントエンドはエクセルが便利。 >>83
データベースに強いのと、統計解析に強いのと、用途が違うとしか言いようが無い。 ビジネスパーソンのデータ分析ツールのde facto standardはExcellですね。 >>214
SASはデスクトップの世界では随分前にSPSSに敗退して
エンタープライズの世界の覇者になっていたのでは
今はRやnumpyなんかに押されてる状況かな >>220
整理計算してるだけで分析はしてないのでは ってか、エクセルで問題になるほど大きなデータを扱うビジネスマンって何%を対象にしてドヤ顔してんだよwwwwww 正直、統計解析程度ならソフトは何でも良い。
プログラム作って自動化するまでだから これから統計などこれらの分野はAIクラウドで自動化の流れ何だろうね >>1
1000万行×400桁って、仮にセルのデータが倍精度浮動小数点数(8バイト/データ)なら、
バイナリデータとして取り込めば、たったの32メガバイトなんだよね。 すべてUnicode文字列で、
全セルの平均文字数が50文字あれば、:3:.2GBになるが。 ■ このスレッドは過去ログ倉庫に格納されています