【統計学】「統計的有意」には弊害があるとして800人以上の科学者が反対を表明[03/22]
■ このスレッドは過去ログ倉庫に格納されています
「真実はいつもひとつ」のはずですが、真実を確かめるために実験したとしても、必ず1つの結果が得られるわけではありません。例えば薬を投与したとして、効果があるのかないのか実験するとき、「薬の効果は偶然ではない」と統計学的に判断できたとき、その結果を「有意」と呼びます。しかし、この「有意」という言葉に振り回されていると科学者800人が反対意見を表明しています。
Scientists rise up against statistical significance
https://www.nature.com/articles/d41586-019-00857-9
'Statistical Significance' Is Overused And Often Misleading : Shots - Health News : NPR
https://www.npr.org/sections/health-shots/2019/03/20/705191851/statisticians-call-to-arms-reject-significance-and-embrace-uncertainty
20世紀初頭に統計学の開祖、ロナルド・フィッシャーは有意差検定という手法を開発。有意差検定は、薬の効果が「ある」のか「ない」のかははっきりとわからない場合においても、「薬の効果がない」という確率を求め、「ある」のか「ない」のかを結論づけようという手法でした。有意差検定では実験の計測結果から「P値」と呼ばれる確率変数を計算します。例えば、実験結果が起こりえる確率が95%以上である場合は、P値は0.05以下になります。慣例的に科学者は「P値が0.05以下、つまりこの事象が起こりえる確率は95%以上ならば、この実験結果は偶然ではない」と判断し、「有意である」としていました。当初、「有意であるかどうか」は「この実験結果は95%以上の確率で起こりえる」ということを示しているだけのはずでしたが、次第に「有意かどうか」が研究結果の結論を左右するようになり、「研究が発表されるかどうか」や「実験が助成金を受けられるかどうか」などまで支配するようになっているとのこと。
https://i.gzn.jp/img/2019/03/22/scientists-against-statistical-significance/blackboard-with-maths-statistics-equations-and-PZ6Q57W.jpg
アメリカ統計学協会事務局長ロン・ワッサースタイン氏は「実験結果を改ざんして、P値を自分の望む数値に近づける研究者や、実験に意義がある場合でも有意ではないために実験結果を公表しない研究者もいる」と述べています。一般の人々と同様に、科学者も「統計的に有意であれば結果は真である」と信じがちです。ノースウェスタン大学のブレイク・マクシェーン氏は「実験の状況により、実験結果がガラッと変わり得ることはあり得りえます。『真』か『真でない』のかの2択ではなく、もっと曖昧な結論、例えば健康に害があるかもしれない食べ物を食べるならば、『有害か』『無害か』ではなく、『健康に対するリスクはどれくらいだろう』ということを考えることが大切です」とコメントしています。
GIGAZINE
https://gigazine.net/news/20190322-scientists-against-statistical-significance/ >>1
ただの言葉遊びで的外れなこと言っているだけじゃん
有意か有意でないかはゼロイチに決まっているだろう
有意でない、という結果は、その実験方法で有意性が認められないということであって、有意性を得るなら別の実験方法を試すべきという実験結果だ
>食べ物を食べるならば、『有害か』『無害か』ではなく、『健康に対するリスクはどれくらいだろう』ということを考えることが大切です」
たとえとして完全に的外れ 宇宙も生物も存在してるよな
ありえんくらいの微小な確率の組み合わせなのに 全くその通りだな。
実験結果なりを有意かそうでないかの離散的に評価するのは妥当ではない。
確率の話なんだし連続値に決まってる。
まぁ門外漢にはバイナリで示してくれた方が分かりやすくはあるが、結局は数字の大小で比較してるわけだから馬鹿らしい。
でもいろいろと代替案が必要なんじゃないかね。 統計的有意性という概念それ自体を放棄すべきだという話だね。 どうすればいい、というのがないと。
どうなってればいいの? >>2
薬の実験があったとして担当者が怖い顔のいかついおっさんだらけだった場合と若い娘だらけだった場合でそう言いきれるかな 過去の事例を検討すると
有意差があると書いたほうが 優位なんだよなぁ ぷっ
★巡航ミサイルにF-35用長距離ミサイルから 滑空弾 春のミサイル祭り
http://yamatotakeru999.jp/jsm1.html
★はやぶさ2 水の起源に迫るリュウグウの探査開始 開発が進む新型H-IIIロケット
http://yamatotakeru999.jp/haya2.html え??
危険率10%って言えばいいんじゃないの?
例えば、危険率0.1%でも、社会問題になることって多いのも現実。
1000人に1人がイジメで自殺してたら大問題。
研究目的に応じて、許容される危険率が違うのは当然。
それを論理的に説明すればいいだけ。 「このクスリがあなたに効く確率は95%です」と書けばよかろう
そうすれば90%や80%も値段を下げれば売れる; 言いたいことはわかるが、けっき指標がないから統計学を作ったのにそれを否定したら何を信じりゃいいのよ?
グラフ眺めてなんか違いがあるんじゃねって勘で決めるのか? 統計処理をしても
おなじ実験を1000回やったら
何回か逆の結論が出ることもあるだろうから
それを使えば逆の結論も導ける ガンが50%の確率で治る薬とかならすごい需要あるよな 健康番組の食材の話もどこか似たようなところがあるね
「きく」か「きかないか」でいうと「効く」って話しかしなくて
年間どれだけ摂取すると、どれだけの違いがでるのか
大きな違いがでるのか、ほんの少しの違いだけなのか
そこがあいまい >>2
そもそもの有意の判定基準そのものが慣例に過ぎない
書いてある常識も知らず読めません >>16
個体差があるからねぇ。無理ゲ〜かも(笑) >科学者は「P値が0.05以下、つまりこの事象が起こりえる確率は95%以上ならば、この実験結果は偶然ではない」と判断し、
つまり、後100回実験をすれば 95回は薬が効き、5回は利かないということだろう
薬としては 充分じゃないの アインシュタインは 統計が嫌いで、統計力学も認めなかった
死ぬ直前の言葉が
「神様は不確実な物は作らない」
だったという伝説が残っている お前らが白黒はっきりしろとか言うからだぞ
反省しろ データが真実、捏造でないなら、「有意なもの」は、説明変数と結果が、本当につながっている可能性が高い。
「有意でないもの」は、まだまだよくわからないというだけのことだ。
別の条件を加味すると「有意」なのかもわからない。
科学者は意味と限界を理解し使えばいい。
世間のことは、そもそも、宗教の世界もありなのだから、何を言っても仕方ない。 有為
有意
昔の本だと有為と書いてる方が多かったが
今は圧倒的に有意の方が優位 >>19
毒性と副作用と値段と効くまでの期間も加味しないと、有用かどうかは分からない >>1
>実験結果を改ざんして、P値を自分の望む数値に近づける研究者や
それ去年、医療過誤をねつ造して隠蔽しようとしてマスコミに全部バラされた、東京大学付属病院と、
出した論文が全部ねつ造だらけで撤回騒ぎになって傍系ラボに全責任を押し付けて逃げた東京大学医学部と、
インチキ論文を量産しまくりサイエンス誌から「これ以上ねつ造するな馬鹿」と叱られた鉄門倶楽部のオハナシ? 部長や課長を騙すにはこの数字の有効性は絶大だぞ。理工系出身の奴等でも統計に
詳しい奴は多くないから反論される恐れはない。現場のオペレーターはシッカリ勉強して
チャンスを掴め。 >20 アインシュタインっておっさんは算数が出来なかったこと有名なんじゃよ、知らんの?
で、算数の得意な嬶をもらった(後で離婚)。 やつの論文の得体の知れない方程式
は、その嬶が書いたもんじゃろ。 算数屋って生物はな、その式の物理学的意味合い
なんぞに全く興味が無いから、物理的意味不明の式に何の違和感もないのよ。 >>27
捏造するなら統計使わなくても何とでもなるよな。
それこそ手をかざしただけで嘘のように治ったて本に書いときゃいい。 ■
つまり
ベイズ統計が最高 って話。
事前水準とか 真の頻度論的状態が 一つ、与えられなくてはならない。
でも 実際 こんな想定は不可能なので、それを元に 有意水準が どれくらいだとかぁ ほとんど 安倍晋三の妄想科学に近い。
だから
ベイズだと その辺 適当な確率を 自身の勝手な経験から 持ってこれるし、周りの人間が その確率採用
、何かいい とか 思えれば それで ロンを展開できる。
まぁ こっちも なんか 如何わしいけど。。。。。。。。。。。。。。。。。。
安倍の不正統計みたいにはなりにくい。
だって 実感が無いのに 実質賃金が下がってるのに 景気はいい。いざなみ景気、超えたとかぁ これなら 言い張ることもできない????みたいな? >>28
部長課長の前に、文科省のエリートキャリア官僚様が騙されたるわ
ただ、昨秋発覚した、鉄門倶楽部の白痴による東大付属病院カテーテル医療事故隠蔽は、文科省と厚労省が怒りまくったからなぁ
ねつ造と改ざんしか出来ない東大医学部の「落書き」量産論文に毎年何千億円も科研費Sを投入する価値はないと理解してるから、
もう世の中の部長課長も統計の魔法に騙されにくくなるんじゃ無いの? 経団連さんの言うことを聞いてると分母をゆがめた、俺たちをだましやすいデーターを出してくれるのです
いうことを聞くときは総合職だけの給料データー、聞かないときは派遣込みのデーターを提出ってね ・
■
ベイズ統計がいいとかぁ
言い出したの
米国だろ。 あの ゲイツとかも 偉そうに 叫んでたし。
まぁ
アメリカは 自国が 世界ナンバーワン としかぁ 思っていないし。 科学における信憑性は、結局のところ、科学者による投票で決まるのだろうか? 統計学は歴史的産物である
http://pastport.jp/user/sheltem2/timeline/勤労統計不正事件の年表/event/p0usKu7j39E 「嘘には三つある。
普通の嘘と、真っ赤な嘘と、統計だ」
マーク・トウェインのこの言葉に、
笑うか納得したならば、
本書は不要だ
(でないなら、本書を読むと愕然とする)。
http://dain.cocolog-nifty.com/myblog/2009/05/post-b9f7.html
https://ja.wikipedia.org/wiki/嘘、大嘘、そして統計 ロナルドエーフィッシャーが理論構築して約100年たったのに
こんなに回りが理解できないとは夢にも思わなかっただろうな なーんかゼロイチ理論臭い奴が居るな
有意差という考えが悪いんじゃなくて、悪用するアホと過剰に礼賛するアホが多いのが問題なだけだぞ >>1も含めて誰も有意差を理解してないじゃないか。
ここ本当に科学ニュース+? 第一種の過誤と第二種の過誤をきとんと理解しないとこうなるわな >>19
違うんだなあ。全然違う。
実はもう少し正解に近いけど間違ってる解釈をしている場合があって、
これが一流の研究者にも意外に多い。 >>1
>「この実験結果は95%以上の確率で起こりえる」ということを示しているだけのはずでしたが、
・・・
>『有害か』『無害か』ではなく、『健康に対するリスクはどれくらいだろう』ということを考えることが大切です」
両方できるのが分散分析や主成分分析
メジャーな国際学術誌だとP値だけじゃなくて分散分析表を乗せることが義務付けられてることが多いけどマイナーどころはそういうのなし
政府の疫学調査機関であってもP値のみ公表してドヤってる場合が多い
こういうのはやめてもらいたいわ 信頼区間と仮説検定の話か
読むまで忘れてたけどこの2つじゃ確かにリスクはわからんね これは自分も思ってた
実験の結果が云々ではなくて有意差を出すための実験をすることに違和感を感じてた
でも自分には代替案も出せなかったし、そもそもそんな頭脳はなかった
結局修士で研究からサヨナラすることになった p値自体がわかりにくい概念なうえに、
有意差があることと、その学問で意味のある差があること
が混同されているからもはやわけわからないことになっている。 どっかで線引きしないとな
どこで線引きするかと言う問題
それは経験的、総合的、主観的に判断するしかない「決め」の問題 統計的に優位って
プロ野球で10ゲーム差つけて優勝したチームがリーグ最強であることは統計的には優位でない、とか
そういう話だろ?
一般人の感覚とは違うよな 交流戦が始まって負け越しが一度しかないパ・リーグが
交流戦でセ・リーグより強いというのも統計的には有意ではないらしい 出たデータの前処理が大事って、総理府統計局が言ってた >>2
お前現場の研究者じゃないだろ
業界ではP値なんて便宜上使ってるだけというコンセンサスが醸成されつつあるぞ
特に>>1のような医薬ではな >>60
そこのトリックや研究者の流儀には触れずに、数学的に反対なんだよ
ちなみに、統計局のはただ出す数字だから関係ない。統計にも毎年にきちんと公表するのと
こういう集めて解析的にする二種類ある 昨日のエーザイのだってこの話みてーなもんだろ
おそろしい P値を減らすために独立試行の数増やすように教官が指導すんのはホント酷いと思った
分散が大きくて重なるんならそれが自然の状態であってそう記述すりゃいいんだし、P値が下がらんでも平均値間に実験仮説を支持出来るだけの差異が見出だせたらそれでええやろと >>1 よくわからんな 統計的有意というのは、統計的には意味があるよって事だから
別に良い気がする それを受け取る側が、「100%正しいんだな」とか白黒思考になるのが問題であって
説明してもわからない人はスルーすればいいだけかと >>65
統計的に意味があるよなんて言えないと言うこと 民衆の知的水準が追い付いていない
数字が出てるだけで正しいと考えるアホが多すぎるから統計詐欺が横行してしまう え〜 何をいまさら。
「数学に証明は有害」って主張するようなものじゃないか。 これはその通り
明らかに結果に差があるのにp値だけで有意差無しって、その差が何から来るのかもっと追求しろと >アメリカ統計学協会事務局長ロン・ワッサースタイン氏は「実験結果を改ざんして、P値を自分の望む数値に近づける研究者や、実験に意義がある場合でも有意ではないために実験結果を公表しない研究者もいる」と述べています。
まともな研究者ならサンプル増やすっての
>一般の人々と同様に、科学者も「統計的に有意であれば結果は真である」と信じがちです。
まともな研究者なら有意じゃなきゃあ発表に値しないし、他人が有意じゃない結果を出しても追試には値
しないと考えるだけ 語感が不適当と言う主張なんだろうけれど、それ以前に用語の意味を理解させる方が先決だろw >>71
有意差がなかったら発表する意味がないってのがそもそも間違いだと言ってる >>73
だからそれが間違いだと俺は言ってるのに、お前馬鹿だろ そりゃ統計学はサンプリングと分析(解釈)の問題が付きまとうからな
突き詰めたら絶対に変なことになる
さらに銭やな、製薬会社の財力はすさまじいものがある
統計的有意はまさにそれでは?でも銭には勝てないんだよ、それも真実だね 細胞1000個の中に薬を一滴たらして観察すると、0-9個の細胞がガン化しました
1%未満の効果なのでこの薬の影響でガン化になるとは言えませんし、有意では無いので公表するのも控えましょうか そもそも反対表明してる奴こそ賛成か反対かの2択から選択してるだろ
そこまで言うなら30%は反対だとか言えよw >>73
有意差がなければ発表する意味がない、は科学的に妥当な考えだろ
「○%の有意水準で有意差があると判定された」とは「100回実験すれば○回ぐらいは逆の結論に至る実験データが得られてしまう」ということであり、
要は誤差が大きすぎていい加減な実験なので実験条件を改良しろということ
そして、有意差がない=有意水準を高く設定しなければ有意と判断されない=頻繁に別の結論に至る実験データが出てしまう=再現性が低い
ということなのでそんなものを発表したところでその価値はゼロに等しい >>71
サンプル数を増やすと誤差分散は減っていく
よってサンプル数を極端に増やせば有意でないものも有意と結論付けることができる
つまりサンプル数増やせばいいというのは常に最良の手段になるわけではないことや、
とにかく有意と結論付けたい場合にサンプル数を増やす手口が有効なことは統計学では常識 統計学は奥が深すぎて・・・
ちょっとかじった程度じゃお手上げだ。 普段使われる5%有意も問題多くてな
20回のうち1回は誤った結果が導かれるのは
年100件とか試験やってると非常に困る >>11
統計的な操作を行って、取り扱いやすい『大多数』を取り出すと、それが95%に近い数字に
なるのであって、95%が目的だったわけじゃない。
90%を優位とすると、統計的操作がかなり違ってくる。 ★
ゼロか弌か、だろ。 小数値ってのが、そもそも怪しいんだよ。数の概念として
★ ★
例: ゲーデルの不確実性理論 ←こんなのウソ。 絶対的な力は存在する。 それは、みんな、確実に最後は、死ぬ!って事実だ。
★ >>81
>よってサンプル数を極端に増やせば有意でないものも有意と結論付けることができる
馬鹿ばっかだな 助成金の有無とかは何かしらの判断材料が必要なんだけど、
この人達はその合否判定の代替案を出しているの?
言いたい事は理解出来るけど、現実社会ではただの理想論だぞ。 チンパンジーの前にタイプライターを置く。
チンパンジーがランダムにキーボードを押して文字が印刷される。
そのタイプされた文字列が新約聖書のマタイ伝の全文と一致する可能性は
限りなくゼロに近い。しかし、ゼロとは言い切れない。 >>89
記事の趣旨は有意性検定を使うなと言ってるわけではなくて有意性検定至上主義になるなと言っているだけだぞ
薬の効果に関して言えば、有意か否か=効果があるか否か、ではなく同じ実験をもう一回行うと同様に効果があるというデータが得られる確率がいくらかを示すにすぎない
だから代替案としては、きちんと統計学を学んで実験結果を理解して助成金を出すか判断しろというだけのこと
現実の実験には必ず誤差があるのでそもそもどんな指標を考案しても薬の効果が100%あるかないかなど判定する方法は存在しないのに、その100%の判定指標として有意か否かを誤用していた 有意でないなら、発表する意味はない。
95%が気に入らないなら、あらかじめ下げておけば良いだろう。
最初に決めておく事が重要で、結果が出てから決めるのは科学じゃない。 有意水準は実験前に決めるもの、というのは統計的検定の初学者向けの参考書に必ず書かれていることだからな >>83
困る分野なら5%の敷居値採用し続ける人間側に問題がある
上部に1%などもっと水準の高いものを採用するように掛け合えよ >>94
いや全然違う
p値がある値以上だからという判断根拠がそもそも科学じゃない
事前だろうが事後だろうが同じ
0.05だろうがそれ以下だろうが同じ >>97
>p値がある値以上だからという判断根拠がそもそも科学じゃない
判断根拠=効果の有無や大小、というならその通り
判断根拠=実験の再現性の高さ(効果の有無には関係なし)、というならp値は判断根拠そのものとなる >>1
つまり、論より証拠より感情とな
それはつまり鮮人思考 >>98
>判断根拠=実験の再現性の高さ(効果の有無には関係なし)、というならp値は判断根拠そのものとなる
いやこの意味でも判断根拠にはならん
いくつならいいかよくわからん実験の再現性の高さっぽさ
くらい意味しか持てない 1%有意にしろ
それ以外はゴミだ
研究者は全員死ね >>88
いや、今回の声明で改善が必要とされているものの1つがまさにこの点だぞ。 有意性の考え方自体に問題はないでしょ
問題になるのは、有意性の程度を確認しないことでしょ >>100
「いくつならいいか」を最終的に判断するのはその研究結果を利用する側だぞ
命に関わることに利用したいなら1%以下でなければ使い物にならないかもしれないし、
そうでない状況で利用するなら10%ぐらい問題ないだろという場合だってある
何%ならOKかというのは状況に応じて変わるものであって絶対的な指標ではない >>105
>何%ならOKかというのは状況に応じて変わるものであって絶対的な指標ではない
いついかなる状況においても何パーならOKという数字は無い >>108
誤差が決してなくせない以上、100%実験通りになるなどということは期待してはいけない
よってビジネスの現場などで利用するなら実験と合わない結果が現実に得られてしまった場合の(主に金銭的な)リスクと比較してそれでも儲かるかどうか等を考慮して、何%ならOKかを決めるしかない
それを何%ならOKという数字はないなどと言ってしまうのは単なる責任回避か考えることを拒否しているかどちらかでしかない
まあ旧来の日本型組織ならありがちな状況だろうけど >>109
p値に入る誤差は実験通りかどうかだけでもないしな
仮定においても多分に入る
>それを何%ならOKという数字はないなどと言ってしまうのは単なる責任回避か考えることを拒否しているかどちらかでしかない
これは全く逆で本来何パーならOKと言うことはできないのに
数字を独り歩きさせてそれで決めるのが思考停止と言えるわな
日本企業はこっちの方が圧倒的に多い
私は悪くない何パーという基準がわるいんだ!みたいなね
論理を極端に嫌うよな >>94
有意でないなら有意でなかったと発表する必要がある
特に実験に多額の費用が掛かる場合は、同じことを繰り返させないためにも >>110
> これは全く逆で本来何パーならOKと言うことはできないのに
言えない根拠は?
言える根拠は>>109が示してるよね? >>112
>言えない根拠は?
当然誤差を含む確率論の話でしかないからだわな
>言える根拠は>>109が示してるよね?
言えないが真なわけだから当然全く示してない >>113
> 当然誤差を含む確率論の話でしかないからだわな
確率論だとダメな理由は?
> 言えないが真なわけだから当然全く示してない
ひょっとして馬鹿なの?
間違ってると言うならまだしもw 今頃 フィッシャー統計など日本だけ。世界のほとんどがベイズ統計に。ベイズなら信頼区間などいらんし。 >>114
>確率論だとダメな理由は?
駄目じゃなくて単に言えないだけ
システマチックなのも含めて誤差も多分に含むしな
>ひょっとして馬鹿なの?
特に特別な知能のいる話してないから類推できないと思うよ >>113
誤差を含む確率論の話でしか語れないからこそ、都合の悪い方向に偶然誤差が偏って出てしまうリスクをどれだけ許容できるかを考えなければならずそれこそが有意水準そのもの
何%ならOKか言うことができない理由が分からない
1%の確率で想定外の結果が出てしまいそれにより100万円の損失が出て1000万の損失まで許容できるなら10%以下ならOKだろ >>117
>1%の確率で想定外の結果が出てしまいそれにより100万円の損失が出て1000万の損失まで許容できるなら10%以下ならOKだろ
単純にこの情報を得ることができないのと
判断基準はP値じゃなくて私的な事業判断であるから >>118
>単純にこの情報を得ることができない
・想定外の結果が出る確率→有意水準なので論文や実験レポートに書かれているので見れば分かる
・想定外の結果が出ると被ってしまう損失→100%成功することなどあり得ないのだから失敗時の損失を見積もらないことなどあり得ない
・許容できる最大損失→個人でも企業でも倒産しては元も子もないのだからこれも見積もらないことなどあり得ない
ということで情報が得られないのではなく得ようとしていないだけでは? >>119
>・想定外の結果が出る確率→有意水準なので論文や実験レポートに書かれているので見れば分かる
「有意水準なので」は理由にならん
当然乱雑で事前にも事後にも完全に得られる情報でない(だからこそ統計モデルに落として理解してる)
>・想定外の結果が出ると被ってしまう損失→100%成功することなどあり得ないのだから失敗時の損失を見積もらないことなどあり得ない
>・許容できる最大損失→個人でも企業でも倒産しては元も子もないのだからこれも見積もらないことなどあり得ない
これらはP値に基づく分析でなく私的な解析を前提としてその時点でのっぽいものに決めたのであって
自動的に下された判断でないわけ
ここに独断的な操作があることを見過ごしちゃだめだわな 想定外の結果が出る確率は有意水準の定義そのものだぞ
そもそも想定外の結果が出てしまう原因が乱雑さにあるわけでその乱雑さの度合いを考慮して想定外が何%出るのかが有意水準だ
あと、どれだけの想定外の結果が許容範囲化は使われる場所によって違うのに現場による独断的な操作を入れずにどうする?
少なくとも元の論文を書いた研究者が決めることではない >>121
>そもそも想定外の結果が出てしまう原因が乱雑さにあるわけでその乱雑さの度合いを考慮して想定外が何%出るのかが有意水準だ
そういう意味では有意水準はその役割においてすら正確なものじゃないってことになるな
データや家庭から計算できるにすぎず安定性も完全でないわけだから
>あと、どれだけの想定外の結果が許容範囲化は使われる場所によって違うのに現場による独断的な操作を入れずにどうする?
そうそう
独断的な操作をいれないといけないものであって何パーならオッケーというツールになることは不可能だわな >>122
論文に書いてある有意水準はあくまで論文に示された実験条件でのものなのだから、論文の条件よりもいい加減な条件でデータを取ればノイズが大きくなって想定外の数値が出る確率も上がるのは当然
明らかに論文と異なる条件下で実用化したいならその条件でのデータを自分で計測して乱雑さを確認するしかない
そして論文に書かれる「有意水準○%で有意」というのは単なる実験による事実でしかなく、そもそもそれが使い物になるかどうかを示すことを目的としたツールではない
それを独断的な操作と呼ぶと何かいい加減なことをしているかのように思えてしまうが、
世の中ではドメイン知識などと呼ばれており統計学の知識だけでなくドメイン知識がなければ実用上は最終判断が下せないのは常識 >>123
×それを独断的な操作と呼ぶと
○現場で許容範囲を決めることを独断的な操作と呼ぶと ID:yqoV0uF6は統計についてもう少し勉強してから出直してこいよ
どうも100%じゃないデータには意味がないと思ってる小学生並みの知能に見える >>123
だよな
>それを独断的な操作と呼ぶと何かいい加減なことをしているかのように思えてしまうが、
それもあるし
不自然に厳正な方法をとってるようにも聞こえる言い方の反乱も結構あって
注意すべきはそっちってことだわな
ドメイン知識も最終判断を下せるようになるレベルのものではなく慣例みたいなのが支配的で
ビジネスシーンでは私的解析だからこそある程度の独断性を慣例化してるという感じだわな >>125
さすがに引用したらw
見えるって言われてもお前の頭の中での事実誤認的な出来事は外には伝わらんから >「実験結果を改ざんして、P値を自分の望む数値に近づける
>実験に意義がある場合でも有意ではないために実験結果を公表しない
>『有害か』『無害か』ではなく、『健康に対するリスクはどれくらいだろう』ということ
弊害というよりはリテラシの問題じゃん >>127
伝わってないのはお前だけw
それは想定内だし 記事で言いたいことは研究者も実用側も有意という言葉の意味をきちんと理解しろということだけ
統計的有意が悪いのではなくそれを誤用するのが悪いということ
論文書く人も読む人も最低限の統計学は勉強しましょう p値を低くする方法:
1. マグレ当たりがでるまで実験を繰り返す
2. 新しい変数(実験者の日々のウンコの長さでも良し)を用意して1を繰り返す いい悪いじゃなくて特段の意味がねえってだけだわな
これは統計を勉強云々以前に当たり前の話 >>66
> 統計的に意味があるよなんて言えないと言うこと
「予め与えられた危険率に対して統計的に意味がある」というのは言える
というよりも、危険率つまり外れる可能性に関する確率付きでの統計的言明を認めないのならば、白か黒かしか言えなくなり、自然科学的・工学的な言明はほぼ何も言えなくなる
(数学のような演繹だけで組み上げられる理論体系はともかく、経験的な事実の積み重ねに基づいて帰納的にしか認められ得ない言明で危険率ゼロで言えるものなど、まず存在しない)
問題は統計的な言明は常に外れる可能性つまり「危険率」を伴っていることを認識していない人間が多いということ
これは一般人は言うまでもなく、少なからずの科学者たちでさえだ
同様に科学者でさえいい加減なのは有効桁数の正しい理解と正しい使用だ
栄養士が食事メニューのカロリー値を3桁もの有効数字で平気で表示する(つまり栄養成分表の値を単純に足し合わせて計算した結果の値を無批判に表示する)のは
まだ可愛げがある(栄養士さんはプロの科学者じゃないから)けれども、東大地震研などに代表される日本の地震学者たちが何らかの法則か何かの式にパラメタを入れて得た計算結果として
「××でM8以上の地震が30年以内に起こる確率は35%」などと見込まれる誤差の値を添えず無反省に有効数字2桁で示すのは論外だ
東大地震研(や同様に地震予知利権に巣食っている他の地震学者)の連中は学食や社員食堂のオバチャン(の1人である栄養士)並みの科学的理解しかないということだ
しかも地震の発生確率を2桁の数字で社会(一般人)に向けて発表することは社会に大きな誤解を与える
何故ならば誤差や有効数字の概念を理解していない一般人は2桁の精度で地震予知ができると誤解し、
「そんなに正確に予知できる地震が35%つまり3分の1以上の確率で30年以内に起こるんだ」と錯覚するからだ
私は、こういうデタラメな「●●年以内に○○(場所)でM△以上の地震が発生する確率は××%」というのが▼▼(例えば地震)学会で発表されたというニュースを見聞きする度に、
何故、このニュースを取材した記者は「先生、その確率そのものに付随する誤差は幾らなのですか?」と質問しないのかとイライラする
地震予知での一定期間内の地震の発生可能性なんて、せいぜい「極めて起こりそう」・「かなり起こりそう」・「まあまあ起こりそう」・「少し起こりそう」・「起こりそうにない」ぐらいの半定量的な区別しか意味がないのだ
というわけで、話を元の統計的言明と危険率との問題に戻すと、重要なのは、
統計に基づく言明には常に外れる可能性に関する確率(つまり危険率)がゼロでなく付随しているということを科学者は正しく認識して使用する必要がある、
そして、そういう統計に基づく言明を一般社会に向けて発表する場合には、外れ得る確率をちゃんと示し、その言明が外れる可能性が常にゼロでないということを周知徹底する、
これら2点を正しく守るということだ
逆に言えば、これら2点を正しく守れない人間は科学者・工学者と名乗る資格がないといういうこと
これは有効数字の桁数(と誤差の存在やその値)に関しても同じだ >>133
ごたくはいいから
> 「××でM8以上の地震が30年以内に起こる確率は35%」
を一般人がちゃんと理解できる簡潔な文章にしてみなよ >>133
>「予め与えられた危険率に対して統計的に意味がある」というのは言える
意味があると言うことにしたんであってp値が何パーだから何かが言えると言うのとは別
>というよりも、危険率つまり外れる可能性に関する確率付きでの統計的言明を認めないのならば、白か黒かしか言えなくなり、自然科学的・工学的な言明はほぼ何も言えなくなる
だから当然話を進めるためにある種無理やり言うがそれにおいてp値が閾値になる理由は全くない >>79
実験結果が最初から分かるような実験ばかりではないし、再実験ができるとは限らないし、サンプルが用意できるとも限らない。
せっかくやった実験が望む結果ではなかったという理由だけで全く表に出ないで闇に葬られるのは勿体ない。
実験系さえ明確に示されさえすれば発表して良いと思う。 本来線引きできないことを線引きするのが政治、社会、ルールってやつなのさ 大吉が出るまでおみくじを引き続けるように、
p値が0.05以下になるデーターの組を得るまで実験を繰り返すとなると、
膨大な数の実験を繰り返さなければならない。
そのため、医薬製薬では新薬を開発するのには莫大な資金と年月を要する。
良い結果が出るまで繰り返し続ける必要があるためだ。
(使えないデーターの組はもちろん葬って棄てる。) >>19
なんじゃその解釈は
おまいさんは科学者か? >>115
医学の世界はどこでもいまだに有意差病だ >>115
世界でも製薬業界と世界の有力科学誌くらいでしょ。
そこでもまだ結論は出てなくて、ベイズ統計て割と悪くないよねて見直されてるけどフィッシャーが悪いかというとそうでもなくて、一辺倒はやめましょう、ちゃんとデータを全体眺めましょうという段階。
フィッシャー独裁時代が数十年続いたから、p値だけで判断する人がまだまだ多い。 生物、医学系はデータとるの大変そうだからな
データ数少ないのに魔法の方法なんてない 科学の世界で結論を出すための手法として
「研究対象をなんとか数字にして統計や演算して答えを出す」やり方がゴールデンスタンダードなんだけど
「数値化」「統計・演算」「有意・有意でないの2値化」の各段階において
その研究の手法として適切でない、あるいはあやまりがある可能性がある
それにもかかわらず「有意」という言葉に水戸黄門のごとくひれ伏す学者のなんと多いことか
薬剤メーカーが医者を騙すのにもよく使われるよ「P=0.023」みたいにして 50パーセントの確率で不治の病を治す薬ができたとしても
無かったことにされるってことか >>144
50%の確率で不治の病が治せることが5%有意なら画期的大発明 元の確率は連続的なんで5%でスパっとわけるより、そのまま使いましょってことでしょ
現場でのなんとか有意にもっていこうという血みどろな戦いは無意味 リテラシーって何だしー また片仮名語かよ次から次へとまあ >>134
> ごたくはいいから
> > 「××でM8以上の地震が30年以内に起こる確率は35%」
> を一般人がちゃんと理解できる簡潔な文章にしてみなよ
君は全く理解力のない人間だね、その文章の問題が何かを説明してあげても全く理解できないようだね
誤差の評価さえ出来ない単なる式に当てはめた結果として出た35%なんて数字には意味がないと言ってるのだ
その数字を出すことで一般人に地震予知に対して過剰な期待や信仰を呼び起こしてしまう害が大きいと言ってるのだよ
お望みの一般人でも理解できて過剰な期待を呼び覚ます危険性が小さい簡単な文章としては
「××でM8以上の地震が30年以内に起こってもさほど不思議じゃない」
だよ
まあ定量化は必要だ罠。
そうしないとおカネの配分で裁量が入り込む。
その物差しだけだと問題があると言うなら、
改良物差しや他の物差しを用意しとけってこと。
ある学説が有力になるかどうかに政治的な力がかなり影響していると思う。 政治が期待する研究を選んだ方が研究費がたくさんもらえるし、
政治が期待する研究結果を発表したらさらに研究費がまわってくることになる。
そうすればそれだけ多くの研究ができて自分の業績を残すことに成功し、
その結果として大学での地位も向上することになる。
こうやって政治家、官僚、学界が結びついて御用学者が量産される構造が作られる。
研究を多く手にできた学説ほど多くの証拠を集められるから他の学説よりも相対的に
優位に立つことができるようになり、見せかけ上有力な学説になっていく。 >>149
> 「××でM8以上の地震が30年以内に起こってもさほど不思議じゃない」
そんなアホな文章になんの意味があるんだよw
要するにお前は何も伝えなきゃ誤解されないって言ってるだけ
しかも「さほど不思議じゃない」なんて言葉は人によって解釈がバラバラだから余計に危険 >>131
>p値を低くする方法:
>1. マグレ当たりがでるまで実験を繰り返す
>2. 新しい変数(実験者の日々のウンコの長さでも良し)を用意して1を繰り返す
p値を緩めたらそれがもっと簡単になるからせめて5%ないとダメだろってのが、まともな研究者の態度
そのうえで、マグレ当たりとか捏造じゃないか第三者が追試をするわけだが、5%ないとその追試にも値しないってこった >>147
その研究を進めるかどうかとかその食べ物を食べるかどうかとかいずれどこかで誰かが判断しないといけない
そもそも素人が5%と言った数値を基にきちんと判断できるわけでもないし
あと意図的に有意になるように改ざんするとかの話は全く別の話なのでわざと混ぜてる>>1はかなり悪質
★★パチンコ換金営業は明白な刑事犯罪(賭博罪)です!
警察官は定年退職すると
パヨク(在日韓国人)パチンコ屋に再就職(天下り)して
年金が出るまで3〜5年ほど雇ってもらいます
警察の風営法検査の日時情報を漏らしたり
ヤクザから店を守る手伝いをします
そんな警察官OBは、最も卑劣な売国奴です
パヨク(在日韓国人)パチンコ屋の犬です
パヨク(在日韓国人)パチンコ屋の社長(金持ち)は
そんな警察官OBをトコトン馬鹿にしています
「警察官OBは使い捨ての犬ニダ!」なんて言ってます
それでも警察官OBは文句が言えません
年金が出るまで、ひたすら我慢です
その分、日本人には威張り散らしています
警察は自分たちの利権(天下り先)を守るために
重大な犯罪行為(賭博罪)を「見て見ぬフリ」しています
パチンコ換金営業は明白な刑事犯罪(賭博罪)です
今すぐパチンコ換金営業を全面禁止すべきです!
パヨク(ゴキブリ在日韓国人)に甘い「親韓政治家」は
次の選挙で落選してもらいましょう
自分の選挙区の政治家さんたちが
パヨク(ゴキブリ在日韓国人)に対してどんな姿勢でいるか
次の選挙のために、冷静に観察しましょう
★★パチンコ換金営業は明白な刑事犯罪(賭博罪)です!
👀
Rock54: Caution(BBR-MD5:1341adc37120578f18dba9451e6c8c3b) 統計は因果関係を示さない
これが直感的に分からん奴はセンスがないよ 応用数学では数学外の要素がかなり関わってくるので
数学外のリテラシーも必要になってくるのが複雑だね。 ほぼ同じ内容のアメリカ統計協会声明の和訳があった
結局は統計を勉強してその数字が何を意味するかきちんと理解して使え、というだけのこと
http://www.biometrics.gr.jp/news/all/ASA.pdf コンピューターの弊害
膨大な種類の変数を瞬時に計算できる
因果関係が無くても、p値が0.05以下の変数の組み合わせも簡単に見つかるようになった 説明不可能だけど結果は出る人工知能の世界は科学との親和性が悪くなる予感がするんだが
これからどうなるんだろうね 今までの科学でも
経験則発見→理論の後付け
パターンは多い
理論が先のケースの方が少ない
(考えを否定してる訳じゃない) 棋士の羽生だっけ?
「人は【60:40】の有効値が判ると【99:1】に偏る」とか言ってたの。
そうゆうこと? 入門レベルの教程では、ある概念の微妙なところまで触れていないことが多いでしょ。 >>19
ぜんぜん違う
スパシーボと変わらない確率が5%以下ってだけ
抗がん剤とか患者の2割3割にしか効かなくても立派に薬として認められてる そういや偽薬のプラシーボ効果があるのか調べるのに
二重盲検の対照実験をやるのって治る確率が低くなる患者が
必然的に出てしまうわけだけど本人は承知してんのかなぁ >>167
スパシーボってなんだよと言うのは置いといてwそれもまた違う。正解は、もしプラセボだったと言うのが真実だとして、
その場合にこういった実験結果が出る確率が5%以下と言うことだ。この2つ、似ているようで全然違う。 有意性の検定はあくまで帰無仮説が正しいと仮定した際にある方法で計算される統計量が特定の確率分布に従うのでその分布の中のどの辺りに位置するかが確認できて、
その統計量が一定以下の低い確率でしか発生し得ないならそもそもの仮説が間違いだと判断するのが妥当というだけのことだからね 発想としては背理法に似てるな
前提を否定すると矛盾(らしきもの)が出るから元の命題は真(らしきもの)
ガバガバだけど Kota Matsui@matsui_kota
3月12日
京大の生物統計の講義コースの動画が無料公開されている(https://ocw.kyoto-u.ac.jp/ja/graduate-school-of-medicine-jp/12/video …)。
昨今指摘されているp値問題についてまるまる1回割いて解説しているなど生物統計じゃない人でも視聴の価値はあるかもしれない 真の100%なんてものは存在しないんだから
あくまで許容範囲のレベルの問題ってだけだし
ここまで来るとただの言葉だろ いやいや、800人以上の連中が
言っている事は、
よーするに、一回限りの事象の場合、
このP値のツールではダメやんという話 一回限りの事象とは?
そもそも統計学は繰り返しの計測が前提となる >>174
これも自分とこの宣伝だろうけどね
人集めの
寄付講座じゃない? で?800人という人数は統計的に有意なの?
冗談じゃなく。 あまりにも低脳で笑いも出ないわ
こんなことに同調したやつ全員再教育したほうがいい 統計はおおざっぱには指標にはなるが
AIみたいな感じで使うには限界があるだろうな
結局人間の意志がやまのようにかかわるとすべてが意味なくなる >>180
君が観測しても僕が観測しても反対意見を表明したのは800人で変わらないので例えば表明者がゼロだという帰無仮説に対してどれだけ低い有意水準を設定しても有意だ >>6
>>7
文句言う奴は代替案を示すのが科学の慣例。 >>176
あたかも独立試行が起こると仮定して考えるわけだが、確率を受け入れたらそれで問題ない。
そこまで信じないなら、確率論から覆さなきゃならない >>187
そんな慣例ないぞ
間違っていることを示すことも意味がある >>189
統計学は間違ってないから。
あとは解釈の問題。
数学的な形式満たしてるのに、間違ってるとかアホですか >>190
数学的な形式の部分を間違っているとは言われてないことに気付け だから誤りじゃないんだけど、バカなの?
そもそも記事読めてないでしょ? 補足するが、間違った解釈するアホがいるよねって話だ。
アホがいる、な。
統計学に罪はない。 R. Maruyama @rmaruy
「統計的有意性って言うのやめよう」という趣旨の話題のNature論文に対する、統計哲学者デボラ・メイヨーの批判。
英語が難解だが、ざっくりまとめると「考え無しに閾値を使ってはいけないからといって、その閾値を捨てたらさらにひどいことになる」との主張。
個人的感想。
・「閾値の有無は本質でない」というメイヨー氏は多分正しい
・しかし有意性有無の二分法が科学の前進を阻害しているというNature論文の問題意識もわかる
・一方科学コミュニケーションの観点からは、専門家集団外への発信においてp<.05のような基準を一掃するのは難しく危うい気がする
その意味では、ARインデックス(by石村源生先生)のaccuracy寄りの発信ではNature論文の提言に従い(p値(CI区間)を
値で示す&統計的前提を明記する)、readability寄り発信では共通の閾値による解釈を義務付ける、などが良いように思えてくる。
そうなると今度はARインデックスに閾値が必要になるが。
https://twitter.com/rmaruy/status/1110092817466941440
https://twitter.com/5chan_nel (5ch newer account) 有意差検定をなくしたら薬の認可はどうやってやるんだ、
という実務上の問題がある。 記事を読めば、有意差検定なくせなど専門家は誰も言ってないことが分かる
もし有意差の有無で薬の効果の有無を判定しているならそもそも判定方法のチョイス自体が不適切なので有意差検定の代わりがどうのこうのといった問題ではない
逆に有意差の意味を正確に理解して薬の効果を何らかの適切な方法で判定しているなら明日からもその通りに続ければいい
結論としては統計学を理解していないならきちんと勉強しましょう、理解しているなら今まで通り統計学の知識を適切に使って仕事しましょう、というだけのこと 勉強したところで有意差検定にものごとの判断をする能力がないことには何ら変わりはない
勉強すればこう(現状に)はならないって趣旨ではあるわな >>196
みんなで検定の話してるのに条件付き確率出して脳みそズレてるよ >>198 連続的な結果を出した方がいいときに
検定を重視する必要がない、というのはその通りだと
思うけど、薬が効くか効かないか、煙草が
ガンの発生に影響するかどうか、みたいな決断を
迫られる場面では検定をするしかないと思う。 >>162
そこはよくあるSFの世界になるんだろ。
よく分からんけど凄いテクノロジーとか理論を出力してきて、人間はそれをリバースエンジニアリングして真理を探究する。 >>201
それ証明できる?無理でしょ
検定含めて手法は存在しないってのが正解じゃね
実データをベースとした確率論でしかないものに完全な判断手法がないだけ
検定自体にそんな能力がないのは統計学の定義からいってしょうがないわな >>197
区間推定を使って優越性、同等性、非劣性を確認する。
20年くらい前に製薬業界は取り入れてる。 統計学者っていうのは、自分たちでは直接、科学に関わっていないもんだから、
定期的に、新しい統計はこれこれっていうトレンドを勝手に作り上げる。
ファッション雑誌の記者みたいなヤツらだな。
でも、結局、科学そのもので実績をあげる訳ではないから、たいして世の中に貢献しない。 >>198が正解。
馬鹿は煽り文句に乗っかって曲解する >>205
ってか、数学の中では最下層ですし。
煽りに乗っかる奴がアホ。
邪馬台国論争みたいなもので、きちんと分析している考古学者もいる一方で、
煽って研究費をくすねたり講演で稼ごうとする輩がいるようなもん >>207
やっぱり最下層なんだな。で、本当の数学では相手にされないもんだから、
医学や心理、その他、統計は使うが数学が専門ではないという分野に来ては偉そうにする。
本物の数学者コンプレックス丸出しの奴らだな。 統計が恣意的に作れるっていうなら
それこそビッグデータでいいんじゃ?
科学者が実験を考案し、AIが発表 >>208
まあでも、その最下層の人たちに数理的な思考が全くかなわないいい加減な人も多いのは事実なので、えらそうにされる側も問題大杉かと そこは大して差がない。
おかしな解釈を加える奴がいるのが問題なだけで >>210
210の言うとおり。P 値に対する信用区間は条件付き確率だわな。ベイズは主観的確率だから信用区間がいらんわけ。 確率の世界を受け入れた後は、あくまでも客観的に処理できるからね。
その処理がどの程度意味を持つかで主観は入るが、とりあえず機械的に処理できる部分があるというのは大きい。 【速報】金券500円分タダでもらえる
https://pbs.twimg.com/media/D2zNujoU4AAryXb.jpg
@スマホのApp Storeから「タイムバンク」をインストール(iOS、Android両バージョンあります)
A会員登録
Bマイページへ移動する。
C招待コード→招待コードを入力する [Rirz Tu](スペース必要無し)
コードを入力した方に600円もらえます
今なら更に500円ギフト券を貰った残高からただで買えます。
貰ったギフティプレモはAmazonギフト券(チャージタイプ)に交換できます(電子マネー払いにて)
数分で出来るので是非ご利用下さい >>196
モンティホール問題はいいとして、リンク先「選んだドアが当たりの時に、司会者が特定のドアを開ける
確率を2分の1とすることは再考すべき」って滅茶苦茶じゃないか、事前確率1/3で、司会者がどっち選
んでも外れなのは同じだっての >>218 そう思う。Natureの記事には、5パーセント
検定を行うのではなく、総合的な事情を苦慮するべき、
みたいなことが書いてあるけど、そうなれば、
忖度や情実が幅をきかせることになる。 「がん医療開発における臨床統計学入門」竹内 正弘
↑ここに書いてあるようなことが統計計算の基本だと
すると、Natureの記事の著者はこれをどのように
変更するべき、と考えているのだろうか。
あの記事は抽象的で分かりにくい。 >>222
単なるアホを排除しましょってだけだろう 「これまでの判定方法を使うなと言うならどうしたらいいんだ?」という意見が多いけど
仮にこれまで有意差の検定だけで判断していたとしたらそれ自体が不適切な方法なんだよね
つまりそもそも適当に判定してたわけで、明日からも適当に判定しても大した問題は起きないよ >>221
その前にまず検定による判断に忖度や実情が影響しない(しにくい)っていう誤解を解く必要があるわな >>224 これまで間違っていたんだから、これから
別の間違い方をしてもいい、というのはいくら何でも
建設的ではないと思う 生データ出して
あとは、各自で考えてね!
でいいのかな・・ 優位って、
P値って、
統計って、最強の学問だとか、
腑に落ちない学問だなって思ってた。
母数の多さが一番大事なんじゃねの? 有意性検定を調べたら分かるけどサンプル数を増やしまくれば大抵のデータに有意差有りとの判定出させることができるよ
検定統計量にサンプル数が含まれるからね 有意かどうかの検定って、ゴミみたいな仮説やゴミみたいなデータしか取れない分野で使うもんでしょ。
普通はどれだけやればどの程度効果があるかとか、モデルにどの程度合致するかを検証する。 >>230
>有意性検定を調べたら分かるけどサンプル数を増やしまくれば大抵のデータに有意差有りとの判定出させることができるよ
実際に微妙な影響があるってことだから、それで問題ないだろ
ってか、ヒッグスの検出とかそれだし >>230 統計的に有意な差があってもその差に
実用的な意味がないときは差がないのと同じ、
と考える。データ数が多いときは、風邪が治る
早さが10分間違っても有意差が出るかも知れないが、
そのくらいの差なら差がないと考えることができる。 ヒッグス粒子発見の場合は
素粒子標準理論で予想されていた、
ATLAS実験とCMS実験が独立に発見した。 >>230
だから、1パーセントで検定するんじゃん。
そもそも差がありそうなことを仮説に検定するんだから、差があって当然かと。
サンプル数の多さは正義。数理統計から勉強してれば230みたいな馬鹿なことは言わない。
統計学はかわいそうなことに、道具の使い方しか知らない奴がでかい顔するんだよな。
数理統計をきちんと勉強する奴がすくない。
それで警鐘を鳴らしたのが1の記事なんだが。 >>232
統計処理 AI等々
大量の情報処理が可能になったからね
それもいいとおもう。 >>236
多分お前が想定してる検定を勘違いしてることによる間違った指摘をしてるな 実際、科学論文の多くがP値を理解していなかったってことだろ? >>237
科学の発展がデータ公開可否に律速されて遅延しまくるだけだからな 素人のリテラシーの問題だろ?
科学に謙虚である奴なら有意って言葉みりゃ「所詮は確率」ってわきまえる
素人は「で、〇なのか✕なのか、どっち!?」と騒ぐ。
バカをだまらせる方便と、科学の良識はわけるべき。
学界が素人みたいに振舞うようになってる現状を嘆くのが >>1 なんだろうけどさ。 統計学はかわいそうなことに、道具の使い方しか知らない奴がでかい顔するんだよな。
数理統計をきちんと勉強する奴がすくない。
それで警鐘を鳴らしたのが1の記事なんだが。
名言ktkr 素人の話は誰もしていないだろう。
学術誌に論文を発表するレベルの研究者たちが
統計学の入門書をかじった程度の粗雑な知識しか持っていなかった
という話じゃないのかい? モンティホール問題は数学の研究者でさえ条件付き確率の初歩すら
理解できていなかったことを証明しただろう?
意図しない理系版のソーカル事件だったといえる。 >>243 その通りだと思う。しかし、あの記事は、
連続的な多数のデータを有意差があるかないかという
2値の1個のデータに還元してしまうと多くの情報が
失われてしまうことを指摘した点では意味があると
思うけど、具体的な改革の提言はなく、抽象的な
言葉遊びのような内容が大半を占めているのは
残念だ。 いわゆるmathinessの一種。
数学を使うと論文が権威づけられるので
ちゃんと理解していないのに濫用する。
査読もちゃんとなされていない。
そんな惨状に統計学のスペシャリストが
黙っていられなくなっただけ。 著者が一番訴えたかったこと:
漏れを査読者に入れろ >>245
それは簡単な話
こうすればいいみたいな簡単な話でないものに
こうすればいいと言う単純な手法がねえってだけ
こんなの考えたらわかることだと思うんだけどな
なんか企業の研修とかでアホが金儲けのために考えた対案がないなら意見じゃねえみてえな
本質的に間違ったロジックを普通に使う奴が多くなったよな 馬鹿の一つ覚えみたいに「対案出せ」と言いたがる奴が多すぎるんだよな
そもそもお前が今まで間違った理屈で判断してたという話なんだからその解決策は統計をきちんと学ぶことだ >>249 実務のための統計学を考えるのなら、
現状に問題があるというのなら具体的な改革案を
示して欲しいと考えるのは当然だと思う。
確かに、有意差がないときは等しいことが証明された、
というような誤解は勉強不足が原因だと思うけど。 >>249
対案を出せってのは、統計学を否定するなら、それに変わる蓋然性なりを示す道具作れってことで、使い方を間違ってるって指摘に対していうものではないわな。 >>250
意思と数理は別物だからな
俺に1兆円くれという意思があったところで数学的にそうできるかどうかは別 >>254 意味が分からない。対案というのは、現在の
統計学を否定したり修正したり新たな内容を加えたり
重視する部分を変更したり、どれでもいいから具体的な
解析手順や結果の表現方法を提案してくれ、という意味。 適用分野に関係なく不偏的に使える解析手順や表現方法など存在しない
統計学の見地からできることはあくまで、この指標はこういう意味だ、ということを教えるだけ
それをどのタイミングで何に使うかは統計学ではなく各分野の専門家でなければ判断しようがない >>256 ある薬が別の薬より効果が高いかどうかの判定は
薬学や医学の状況も踏まえて行うべき、という考え方は
Natureの記事の著者の立場に近いのかも知れない。
それでは、製薬会社の経営が苦しいからこの薬の効果を
高く見積もるべき、みたいな話にもなる。そうならないように
するために5パーセント検定が使われている。それでは
ダメだというのなら、別のより優れた方法を提案して
欲しい。総合的な考察が必要、みたいな抽象的な提言は
実務に役立たない。 >>257
薬Aが薬Bより効果が高いことが設定した有意水準で有意か否かは検定できる
仮に有意と判断されれば100回やれば95回は同様の実験結果になるわけだから薬Aの方が効果が高いと判断することは問題ない
しかしその差に意味があるかは統計学の知識だけで判断できるわけがない
AとBの効果の差が1あればいいのか100程度なければ無意味なのか、それとも0.01でも差があれば凄いことなのか、
それは薬学や医学を学んだ人がその知識を使って決めるしかない
このことは物理でも生物でも他の分野についても全く同様 100回やれば95回というのは仮に有意水準5%とすれば、ってことで >>258 その点については
>>234 に書いた。 >>255
解析手順に関する否定じゃないからそこの要求するのはまず間違いと言える
統計学を否定するものでない
統計学の範疇を超えてる使用方法が否定されてると気付け
できないことはできないんだから提案してくれもくそも意味ない >>261 「統計学の範疇を超えてる使用方法が否定されてる」
のなら、いくつかの「解析手順」が否定されて
いるんじゃないか(笑)5パーセント検定を使って、
薬の優劣を判定することは「統計学の範疇を超えてる使用方法」
なのか、そうでないのか、どっちだ? >>260
つまり統計学だけで判断することなどできずその分野の専門知識に基づいて判断するしかないので
統計学者に問い合わせたところで「総合的な考察が必要、みたいな抽象的な提言」しかできないことは君が理解しているわけだろ? >>263 そんなアホな統計学者は少ないと思う。
その分野の知識がなければ判定できないのは、
>>234 のような場合だけ。 >>239
理解してないということもあるし、悪用してとにかく有意差が出るように恣意的運用する奴もいるってこと。
金科玉条にp値だけ追っかけたら本質見誤るぞということ。 >>264
>その分野の知識がなければ判定できないのは、
>>>234 のような場合だけ。
だったら早く「その分野の知識」がなくても判定できる状況とその方法を教えてくれよ >>266 二つの薬の風邪が治る早さに有意差がなければ、
二つの薬の効き具合にはっきりした優劣はつけられない、
と判定する。優位な差があれば統計学的には優劣の
判定ができた、と判定する。しかし、その差が
患者にとって重要な違いと言えるかどうかは
統計学では何とも言えない。 文系の役人や経営者が馬鹿だからだろう。
「有意」の判定基準が確率1%だったとしよう。
では、君が明日0.99%の確率で雨に降られるとしたら、君は容認できるだろうか?
「明日、雨が降るのは有意でない」なら、雨は無視できよう。
では、君が明日の出張で0.99%の確率で死ぬとしたら。君は容認できるだろうか?
「明日、君が死ぬのは有意でない」で、納得して出張できようか?
同じ確率1%でも、出来事の種類によっては同じ確率でも、容認できる場合と容認できない場合があるはずだ。 1%が容認できなければその確率を厳しくして0.5%とかにすればいいだけだ
そして絶対に死なないなどあり得ないので死亡率0%を期待してはならない そもそも有意水準とは判定が外れる危険率なので雨の降るリスクと死ぬリスクを同程度と想定することに無理がある >>268 明日死ぬ確率が1パーセントであることと、
明日雨が降らない、という予想が外れる確率が
1パーセントであることは深刻さが違うことくらい、
「文系の役人」も理解していると思うけど。 薬の場合、二つの薬の効き具合がほとんど違わないのに、
片方がよく効く、と判定してしまった場合の損失を
計算することは難しい。逆に、片方の薬がよく効くのに
ほとんど違わない、と判定してしまった場合の損失の
計算も難しい。だから、5パーセント検定を使っている
ということだと思う。5パーセント検定を否定するのなら、
2種類の間違いのそれぞれ対する損失を求めるしかない
と思う。 >>257
>それでは、製薬会社の経営が苦しいからこの薬の効果を
>高く見積もるべき、みたいな話にもなる。そうならないように
>するために5パーセント検定が使われている。
効果がない、又は効果があるが差はわずかで無視できる、という事実があったとして意図的にその効果を高く見積もるには以下の2通りしかなく、当然どちらも完璧に防ぐ方法など存在しない
1.実験データを改竄する
2.意図的に誤った計算や解釈を行う >>272
有意水準5%で検定するということは現実に5%の確率で外れることになるわけで外した場合のリスクを見積もらなくてよいわけがない むしろリスクの見積もりが行われて初めて有意水準を何%とするかが決められる
リスクも見積もらずに何%外していいのかなど決められないから >>275 そう考えると、今のところリスクの見積もりが
できていないから、平均値の差が意味を持つかどうかを
判定する方法はないことになってしまう。 >>275 その点を重視した場合の解決策は、
新しい薬の効き具合の平均値が既存の薬よりも
少しでも上回っていれば認可する、という方針だろう。
新しい薬の効果が既存の薬と同じ程度でも少しぐらい
下回っていても大きな問題は生じないだろう、と
いう立場である。 >>262
薬が優劣かどうかを決めるのであれば当然範疇を超えてるわな
そんな式存在しない
これ以上を優位というのであれば有意と言えるってだけであって
問題の判断を行ってくれるものではない >>278 推定でも検定でも、真実からどんなふうに
ズレた結論を出したらどんなリスクが生じるかを考慮すべき
じゃね、みたいなことを言うと、そんなもん、できるわけ
ないだろ、というのが答え。 風邪薬とがん治療薬の効果の検定結果が間違いの場合どっちがどれだけやばいのか教えてくれ、などと統計学者に聞いたら「そんなもの医者か医学の研究者に聞け」と言われるだろう >>281 レントゲン写真を見て腫瘍を見逃した場合の損失と
腫瘍ではないものを腫瘍と考えた場合の損失の比較のような
ことならいくらかは可能だろうけど。 >>229
母数はパラメータ
お前さんの言ってるのは分母
誤用も甚だしい >>284 間違い。 以下を参照。
ttp://cse.naro.affrc.go.jp/yamamura/topic31.html >>286
書いてあることを要約すると「捏造しようと思えば捏造できる」という当たり前のことだぞ 逆だわな
死ぬほど労力をつぎ込みまくって
捏造じゃないと言えるレベルにもっていく不断の努力が必要
近年になってようやく有用と言えるようになってきたレベルでコストを要する 捏造だったら今後の予測で使い物にならないんだからすぐボロが出るだろ
万が一捏造なのにうまく予測に使えるならそれはそれで何の問題もない 検証コストがかかる場合とかいくらでも問題あるから
その考えは間違い >>289
>捏造だったら今後の予測で使い物にならないんだからすぐボロが出るだろ
捏造じゃない実験でも間違った結果が出ることあるから、再現性がないからといって捏造と決めつけることはできない
だから、捏造で論文をアクセプトしてもらえると楽ができるわけだ >>287 「捏造しようと思えば捏造できる」から
ベイズ推定には問題がある。常識的な
確率密度関数を仮定して最尤法なら捏造しようと思っても
捏造できない。自分が望む結果を与える確率密度関数を
使うことはできるけど、あてはまりが悪ければ信用されない。 >>289 その理屈を採用するなら、どんなでたらめな
統計解析をやってもいい、妥当でない結果は予想に
役立たないから消えていくだけ、と考えても
いいことになりそう。 でたらめな解析を行うのも自由、でたらめ解析ばかりしてる奴の出すレポートを信用しないことも自由 >>294 だから、どんなものが「でたらめな解析」かを
判定することが重要、とならないか? 統計って基本的な使われ方は嘘ついて人を騙すための学問でしょ 騙されるのは知識が足りていないから
十分知識があれば騙すための統計解析結果に対しては「嘘」又は「事実とは言い切れない」の何れかの結論に達するはず >>299 高い、低い、というのは曖昧な表現だが、
この場合、普通は、相関が高い、と言うだろう。 データをねつ造しなくても
気に入った結果だけ発表するなら同じことなのでは・・
ランダムでないものに有意性とかナンセンスだろ つまり排除の理由としては使えるけど、採用の理由として使っちゃダメ 統計学は権力者の「思い込み」を正当化する口実に使われがちである。 >>301
なるほど
じゃあOECD全部ブッ込んで相関性が高いなら問題なさそう
ちなみに一番右上は中国な >>299
ただし因果関係は不明
多分縦が因で横が果
ミスリードしようという意図が感じられるな >>299
凄い強い相関。(^0_0^)
GDPが伸びているから財政支出もできると考えれば
当たり前かもしれない。 だったらそれはそれで財政支出が増えてるのにGDPが伸びてない国がないとおかしいという話にならない?
他にもGDPの伸び分しか財政支出を増やさない国しか世の中存在しないのかとかね >299
GDP伸び=>税収伸び=>財政支出伸びって関係じゃないの
横軸が支出/GDPなら意味があるかも それは高校数学レベルの論理の問題
「AならばB」が成り立つからといって「BならばA」も成り立つとする根拠はどこにもない
AがGDP増加、Bが財政支出増加 Y(GDP)=C(消費)+I(投資)+G(政府支出)+NX(純輸出)
この式はいつでも正しくなります(恒等式)。
だからそもそも政府の支出が増えたらGが増えるからその分GDPが伸びるんだとはならない?
他にも政府が支出するとそれはすなわち同等額が国内企業に支払われ国内企業が生産するからその分消費や投資が増えるとはならない? なんだコレ(珍)姉妹都市
秦野市 1964年9月29日 パサデナ (カリフォルニア州)
秦野市 1964年9月29日 パサデナ (テキサス州)
【マITLーヤ】 悪人に悲報、テレビ出演、大演説も
http://krsw.5ch.net/test/read.cgi/hulu/1556774069/l50 >>310
事前と事後の区別が付いてない初学者だなあ。 >>312
事前、事後でいうならまず支出が先では? >>310
Gが増えてもその他の要因が減れば見かけ上Yに変化がなかったりむしろ減少したりすることはあり得るだろ
GとCやIの間に恒等的に成り立つ式なんてないだろうから上記の可能性を捨てる客観的根拠などない >>314
なるほど
財政支出が増えてもGDPが増えなかった
GDPが増えても財政支出が増えなかった例とかないの? 政府が支出したら当然民間企業は仕事をこなさないといけないわけだから仕事に必要な出費もすれば投資もするし賃金も払うんでは?
そう考えると政府が支出した分いくらか貯金にはなるがほとんどは支払われるんではないの? >>1
たまに死ぬやつがいるって、
そこで打ち切っているのが統計
なぜそいつが死んだのか他の死ななかったやつと比べて
何が違うのかを徹底的に調べるのが本当の学者だ >>313
初心者やな。
意図した時点と、活動が終わった後で見るかで、同じ等式でも解釈は全く違う。 ■ このスレッドは過去ログ倉庫に格納されています