X



【統計学】統計好きでも意外と知らない「p<0.05」の本当の意味<p値ハッキング> [すらいむ★]
0001すらいむ ★
垢版 |
2024/04/05(金) 20:51:57.11ID:HURuvpJv
【統計学「p値」の謎】統計好きでも意外と知らない「p<0.05」の本当の意味<p値ハッキング>

● 「p値」を理解するための例え

 p値の概念は必ずしも直感的ではない。そこで、統計学者が大好きなたとえを使ってみよう。

 私はコインの入った袋を持っていて、「コインをめくるとすべて表が出る確率が高いだろう」と考えているとしよう。そして実際、コインを1枚取り出して5回めくるとすべて表が出た。これは何かおかしなことが起きているという、それなりに説得力のある証拠になるだろう。

 では次に、最初のコインで5回のうち表が出たのは3回だけで、2回は裏が出た場合を考えてみよう。これは、私の理論の証拠としてはよろしくない。

(以下略、続きはソースでご確認ください)

ダイヤモンド・オンライン 4/5(金) 6:02
https://news.yahoo.co.jp/articles/7442092ad751032353e8b757208c5ede930485f1
0002名無しのひみつ
垢版 |
2024/04/05(金) 20:56:53.98ID:4qxxHehM
字数稼ぎの薄くて回りくどい文章
0003名無しのひみつ
垢版 |
2024/04/05(金) 21:06:48.65ID:8xAjcT9G
意外と知らないどころか今時 p値ハッキングなにそれ?ってやつはヤバイだろ
0004名無しのひみつ
垢版 |
2024/04/05(金) 21:08:51.31ID:YJA+nDHA
「サンプルが増えれば「偶然」の確率も上がる」との見出しだけでヤバい記事なのがわかる。(確率は変わりません。発生回数が増えるだけです)
0005名無しのひみつ
垢版 |
2024/04/05(金) 21:21:19.35ID:LSC6lDei
P値ハッキングどころか、そもそもサンプルした標本データの確率分布を確認して仮定とするモデルと同じ正規分布に従っているかを確認しないといけない。そもそも正規分布に従っても無いのにP値で仮定が正しいか行うこと自体が無意味。確率分布を確認するにはサンプルとして取るデータは何万、何十万と必要だろう。せめて数千ぐらいは取りたいが、実際はこのようなことをしていない。サンプルデータが12個だけという最初から論文にならない論文も沢山見受けられる。にも関わらず査読ではねないのは、査読するものが統計処理を理解していないから。結論を言うと、次のパターンによる誤りだらけ。
1)論文執筆者自身が統計処理を理解していないので機械的にP値検定で結論づけてしまう誤り。物理と数学以外の理系の論文はこれが多いので、結論に全く信憑性がない。地球温暖化も怪しいとノーベル物理賞受賞学者が否定するのも当然。
2)サンプルデータそのものが少ない。20や50程度しか取れない。医学系や生物学系に多いパターン。当然結論は信頼できない。
3)論文執筆者が意図してp値ハッキングする。論外。結論は見る価値もない。
0006名無しのひみつ
垢版 |
2024/04/05(金) 21:48:04.61ID:m3GhNOeE
論文の数が10000あったらそのうちの500はP値が偶然5%以下になるがそれはいいのかな?
0007名無しのひみつ
垢版 |
2024/04/05(金) 22:24:21.06ID:4qxxHehM
>>6
だから(という訳では無いが)論文のメタ解析というのがある
0008名無しのひみつ
垢版 |
2024/04/05(金) 23:18:15.75ID:mgPwfd6W
>>1は、一昨年昨年に全国大学に量産された「データサイエンス担当教員」(ほぼ全員、文学研究者か、データサイエンスの講義は受けたことのないIT屋)に、ぜひ読ませたい記事だ
悶麩蚊顎症が唯一、文系私大で認めたデータサイエンスの重点大学のカリキュラムと講義内容と教員たちをよく知っているのだが、
>>1の内容どころか、Rを知らないどころか、excelのマクロを使えないため、
学生に解析させて無償で巨大企業に提供して大学が稼ぐデータを、すべて手作業で処理している
学生への教育が、数年すれば使えなくなる目先のテクニックだけなのはいうまでもないが、これが、
大学の経営者(資産家で大手企業の株主様)や、紋武火画苦笑の高級官僚(灯台学部の落ちこぼれの成れの果て)には大受けしているらしい
富裕層がどうなろうと折れの知ったことではないが、学生にマトモなデータサイエンス教育が施されるには、
データサイエンス担当教員つまり文学者や市井のIT屋が、>>1の記事を読んで、内省することが不可欠だとおもう
0010名無しのひみつ
垢版 |
2024/04/06(土) 12:31:33.99ID:VIqpT3IO
何が本当で何が偽物化があやふや院なる

全ての論文該当しそうなのですが・・・

今の科学も確率論で一番再現率の高いものを使用している
でも真実は再現できていないもありうるのですね

全員統合失調症の幻覚!とあるとなることも考慮する必要がある
0011名無しのひみつ
垢版 |
2024/04/06(土) 12:49:42.72ID:xlDMQBcj
 
p値
木兆
0013名無しのひみつ
垢版 |
2024/04/06(土) 14:25:42.63ID:s9p0JNoY
>>1
数式が無くてチンプンカンプンだ
戯言の領域を出ていない主張、記事
0014名無しのひみつ
垢版 |
2024/04/06(土) 14:27:04.20ID:9+Zem2hU
フィッシャーが一生のうち一回くらい間違えてもいいよね。ってくらいの発想だから
0015名無しのひみつ
垢版 |
2024/04/06(土) 15:10:48.95ID:94gUuz0Q
この手の「p値だけを見るのは危険」って言うやつってたいてい効果量まで言及しないよなぁ
雑魚ばっか
0016名無しのひみつ
垢版 |
2024/04/06(土) 16:26:03.95ID:Jw3ra2HB
世の中n=1とか因果関係と相関関係の区別できない奴とか
ゴロゴロしてるからp値とか早すぎる
0017名無しのひみつ
垢版 |
2024/04/06(土) 18:41:51.30ID:DsRueQlY
今の日本の理系としては
この記事をできるだけ多くの理系学生に読んでほしいと思うは
教員がこれを知らないというのが現在の日本の大学のデフォルトなので
0019名無しのひみつ
垢版 |
2024/04/07(日) 01:34:14.84ID:QDmanLPw
事象Aが有であったときに事象Bであった
事象Aが有であるのに事象Bがなかった
事象Aが無であるのに事象Bであった
事象Aが無である時に事象Bもなかった

知らんけど
0021名無しのひみつ
垢版 |
2024/04/07(日) 09:40:25.67ID:NjDB5D3B
最近はp値使ってる論文は受け付けませんってジャーナルもあるんでしょ
0023名無しのひみつ
垢版 |
2024/04/07(日) 21:15:20.45ID:Jqdp1ufL
なぜ検定では5%水準とか1%水準を使うのか、それらの数字の根拠を述べよ。(5点)
0025名無しのひみつ
垢版 |
2024/04/10(水) 20:04:35.01ID:Prt5q7cr
two one-sided testでも、許容できる誤差は自分で決める
レスを投稿する


ニューススポーツなんでも実況