【AI】IBMの人工知能「Watson(ワトソン)」による医療診断システムは「実用に耐えうるものではない」という主張[08/16]
■ このスレッドは過去ログ倉庫に格納されています
IBMが開発した人工知能システム「Watson(ワトソン)」は、2011年にアメリカで行われたクイズ大会「Jeopardy!」に出場し、人間の参加者よりも多くの賞金を獲得して世界的な注目を浴びました。そんなワトソンを利用した医療診断システムをIBMは開発しており、これまでに多額の投資を行ってきましたが、「ワトソンの診断システムは実用的なレベルにはほど遠い」という主張が専門家らによってなされています。
Playing Doctor with Watson: Medical Applications Expose Current Limits of AI - SPIEGEL ONLINE
http://www.spiegel.de/international/world/playing-doctor-with-watson-medical-applications-expose-current-limits-of-ai-a-1221543.html
IBMは多額の資金を投入して開発したワトソンを、医療分野に応用しようと試みています。世界の医療業界は数兆ドル(約数百兆円)もの巨大なマーケットであり、人間がさまざまな病気を克服したいという希望を持ち続ける限り、今後も成長し続ける見込みもあります。医療分野は毎日のように新たな研究成果が発表されるため、医療知識の量は3年ごとに2倍になるともいわれており、人間の医者では追い切れない最新の医療トレンドを蓄積できる人工知能を医療分野に応用しようとする試みは、理にかなっていると感じられます。
病気の診断にワトソンを利用するプロジェクトは、ドイツのギーセン大学とマークブルク大学の付属病院で行われていました。IBMはワトソンの医療診断システムの優秀さを証明しようとしましたが、実際にはワトソンの病気診断システムが期待されていたほど優秀でないことが判明してしまいました。たとえば、来院した患者が胸の痛みを訴えている場合、通常の医師であれば心臓発作や狭心症、大動脈の破裂などをまず最初に疑います。ところが、ワトソンは胸の痛みという症状の背後には、珍しい感染症があるという不可解な診断を下したとのこと。
Rhön-Klinikum AGというマークブルク大学付属病院を傘下に持つ医療機関でCEOを務めるシュテファン・ホルツィンガー氏は、マークブルク大学で行われていたワトソンの臨床テストを見学し、「ワトソンに専門的な医学的理解があるとは思えず、このプロジェクトを継続するのはラスベガスのショーに投資するのと変わらない」と感じたそうです。
結局、ホルツィンガー氏はワトソンを実際の患者の診察に応用する前の段階で、IBMとのプロジェクトを打ち切ると2017年に決定しました。ところが、IBMは単なる打ち切りに終わった大学病院におけるプロジェクトを、まるで「成功したテスト」であるかのように宣伝していると、ホルツィンガー氏は述べています。
マークブルク大学でワトソンが直面した大きな問題には、言語の認識もあったとされています。ワトソンは患者の病気を診断する時に、医者が患者から得た情報をまとめた文書やカルテ、検査結果などをスキャンし、病気の手がかりとなる情報を得ていたとのこと。ところが、ワトソンは文章の複雑な言い回しをうまく理解することができず、正確な診断結果を下すことができなかったそうです。たとえば、医者が使う「〜という可能性を排除することはできない」という否定寄りの微妙なフレーズの解釈は、ワトソンにとって非常に難しいものだったとのこと。
加えて、医師も患者の診断結果を非常に簡略化して書く傾向にあり、「HR 75, SR, known BAV」と書けば「平常時の心拍数が75、大動脈二尖弁あり」ということを意味しますが、ワトソンはソフトウェアにこれらの略語を学習させるまで、文章の意味を理解することができません。一度学習させればワトソンも略語を理解することができますが、ワトソンに医師のカルテを理解させるためには、膨大な数の略語をソフトウェアに登録する必要があります。
もちろん、ワトソン以外の人工知能による医療診断が完璧だというわけではなく、Isabel Healthcare platformやPhenomizerといった医療診断システムも、完璧な診断結果を得られるわけではありません。ワトソンが診断を誤ってしまうことも仕方のないことではありますが、IBMはワトソンを「他のどの医療診断システムよりも優れている」と主張しており、ドイツの大学病院における失敗はIBMにとって喜ばしいものではないとのこと。
https://i.gzn.jp/img/2018/08/16/watson-expose-current-ai-limit/05_m.jpg
https://i.gzn.jp/img/2018/08/16/watson-expose-current-ai-limit/00_m.jpg
GIGAZINE
https://gigazine.net/news/20180816-watson-expose-current-ai-limit/
続く) 診断に迷ったらワトソン使えばいい
今のところ道具の一つに過ぎないが、ないよりマシ 「アナタハ、カゼデス。
オクスリ、ダシテオキマスネ」 DeepMindのAlphaGoもそうだけど、
ゲームレベルと現実世界は雲泥の差なのよね。
所詮お遊び程度。 ワトソン君は英語脳なのでドイツ語の
難しい言い回しが理解できなかったのかな。 10年もせずにセカンドオピニオンくらいにはなるだろ。 実用に耐えないレベルの人間の医者だって
いっぱいいるけどな
専門外の事となると素人みたいな事、平気で言うよ 0か100しか認めない文系脳www
ほんと文系はゴミしか居ない 膨大なデータ読み込ませないと意味ないってIBMが説明してんのに読み込ませてないじゃん アキネーターみたいな病気診断システムぐらいはすぐに作れそうだけどな
いろんな症状をはい、いいえで答えれば絞り込める的なやつね
新しいトレンド情報を自動で収集するとかはレベル高すぎやろ
googleでも二の足踏むんじゃないか >>4 だよな。ワトソン専用の患者情報入力ソフトをなんで作らなかったんだろ。 一見正常に見える異常
一見異常に見える正常
現実に医療やってるとこれが非常に多い
本の知識だけのグーグル先生とか素人さんでは診断できないのはこのせい 医者は短時間の診察で診断するけど、
患者自身がワトソンの患者情報入力ソフトに向かって、
時間をかけて事細かに症状とか入力すれば
いい診断が出てきそうな気がするけどな。 クラウドの端末をドラックストアに置いて
OTCを選ぶ支援に使えばいけるんじゃね?
人によってアレルギーやら持病やら服用中の薬の話になったら
忙しい薬剤師や登録販売士の手を取られることも無いし、
その時の担当の技量に差がつかずにより正確なチョイスが出来るだろ。 >>13
あれって今どうなってるの?
最新のWindowsでも載ってるの? 国語が難しいならフローチャート診断書にすりゃいいじゃないか。批判のための批判っぽいな。 >>28
相手が医師だと緊張して本当のことを言い出しにくいとかもあるからコンピュータの問診の方がいいかもね >>1
> 加えて、医師も患者の診断結果を非常に簡略化して書く傾向にあり、「HR 75, SR, known BAV」と書けば「平常時の心拍数が75、大動脈二尖弁あり」ということを意味しますが、
> ワトソンはソフトウェアにこれらの略語を学習させるまで、文章の意味を理解することができません。
いや、それって人間でも同じだろ w
> 一度学習させればワトソンも略語を理解することができますが、ワトソンに医師のカルテを理解させるためには、膨大な数の略語をソフトウェアに登録する必要があります。
人間が覚えられる程度の略語を膨大とか言われてもなぁ…
既得権益者が難癖つけてるだけにしか見えん いや、だって十年前に開発されたシステムだよね
IBMからしたら、新しいの買えって話じゃない? AIは魔法じゃねーんだよ
使えないところは改良するんだよ >>4
AI開発ではそこが問題が多い。ティーチング用データが実はゴミばかりとか,
従来のデータベースでのデータ項目は実はあまり意味を持たないとか。結局,
一からデータとりなおしになったりとか。 まー、「電卓は実用に耐えうるものではない」とか言われた時もあったしねえ
まだ電子部品の精度が低くてよくエラー起こしてた頃 >>35
>>人間が覚えられる程度の略語を膨大とか言われてもなぁ…
カルテの略語って医者本人だけのマイ略語だったり,クリニックだけ,医院だけで通じるやつだったり
色々とローカル略語があるんだな。人間の場合,略語の作り方のパターンを経験的に学んでいるんで理
解できたりする。ということで,略語を推定するエンジンが必要となる。それができる改良型は一歩進
んだってことになるんじゃないか。
逆に言えば,人間ってなんて不必要なルーチンやらエンジンをたくさん抱えているんだなってことになる。 >>40
> 人間の場合,略語の作り方のパターンを経験的に学んでいるんで理解できたりする。
なんでその程度のことがAIではできないと思ってるんだ? IBMのワトソンは取り残された旧来の人工知能という位置にある。
分野によっては実績もあるから判らない人が多いだろう。 要するにWatsonの現状の問題点は文章読解力が不十分という事だろう
読解力が人間並みになれば数秒で数百数千の論文などの情報を理解し知識として保持。
人間がかなう相手ではないよ。 それも数日先に実現しても不思議じゃないな。 ええやん、どうせ人間は死ぬんだし
医者が誤診もワトソンのせいにすれば、逃げられるしww 現時点で使えないのと、未来永劫使えないのは違う
胡座かいてると大変な事になる ・
テスラもそうだけど
AIの限界が 徐々に 明らかになってきてる。 可哀想だけど AIに巨額投資してきた投資家は 大損するでしょう。
■
カルテ情報だろ。判断できるのは。
人間の発話から 病気診断とか言ったら、自然言語を完璧に把握してる必要がある、ってこと。
これは 難しい。 たぶん、不可能。
自動運転も ほとんど不可能。街中にセンサー埋め込んでないと無理だし。 カルテ情報も
あやふやな表現で書いてあると、意味は分かっても 医者の意図は分からない。
その表現が 病気の診断なのかぁ、 怪しい疑問点なのかぁ など・・・・・・・・・・・・・
さっさと この対面診断は止めて、病気のDB寄りのAIに特化したほうが いい。 診断システムの問題点というより情報入力の問題点だな ワトソン>>東大君>>第5世代
といずれもくそであることが証明されました。
でも金は使った後だし、やってよかった。
AIは詐欺の歴史 何事もそうだが、出来る可能性を探る者と出来ない言い訳を探す者では大きな差が出る >ワトソンは胸の痛みという症状の背後には、珍しい感染症があるという不可解な診断を下したとのこと。
どんぴしゃの名診断である可能性はw
トンチンカンだったとしても、その発生率は そしてそういうものを削減する手段は簡単に作れそうにも思えるが
>このプロジェクトを継続するのはラスベガスのショーに投資するのと変わらない」
「投資」の中では確率が高めというたとえになるんじゃないのかこれはw
そもそもドイツの話で、
>ワトソンに医師のカルテを理解させるためには、膨大な数の略語をソフトウェアに登録する必要があります。
難癖に近い 去年駄目でも今年は驚異的という進歩をしても珍しくないのがこの界隈 つまりカルテのフォーマットと言葉の言い回しを整えれば実用化できるの? ワトスンくんってディープラーニング用いてない古いタイプのAIだっけ
そういえば以前特殊な白血病だと見抜いて治療法も提案して回復したのがニュースになってたけどあれはなんだったの? DeepMindのAI、50件超の眼病を診断--医師に匹敵する94%の精度を達成
CNET Japan-2018/08/14
Googleの親会社であるAlphabet傘下のDeepMindは、人工知能(AI)をヘルスケア分野に応用することの特効性に
大きな重点を置いており、英国時間8月13日、AIを利用して眼疾患を診断する上での進歩を示す研究結果を発表した。
DeepMindのAIは人間の医師と同等の精度で目の病気を診断できる
GIGAZINE-2018/08/13
DeepMindはヨーロッパと北アメリカで最大の眼科医療機関であるMoorfieldsと協力し、
Moorfieldsで治療された7500人の患者から得られた1万5000回分のOCTデータをAIに学習させたとのこと。人間の眼科医による診断と並行して訓練する ... 過学習させたのでは?
人工知能は道具であって使う側の能力に依存するんだよ 「シャーロック」に改名すれば大丈夫
みんな「シャーロックがそう言うなら間違いないな」って思うから ワトソンのパフォーマンスが良くないというのはクライアントなら公然の秘密だよ。
世間にはAIと言ってアピールできるけど、残念ながら実用レベルにならない。
これは横のつながりでクライアント同士も情報交換してる。 >>58
診断の根拠が提示出来ない以上、ディープラーニングを医療現場へ用いるのは無茶だろう 診断の根拠なんて、人間の医者だってロクに説明しないじゃん
どのみち素人には理解できないし ワトソン君が悪いわけじゃないんだよな。
たとえば、胸やけという症状ひとつとっても人によって違うんだな。
文字通り胸が焼けつくような症状を胸やけと表現する人(これ正解)もいれば、
単にムカムカするのを胸やけと表現する人もいる。その辺は人間でも
見極めが難しい。ワトソン君にはこの見極めができるようなアルゴリズムは
相当難しいだろうね。なんせ人間の感覚に共感できる能力が必要だからね。
簡単に言うと人間でも共通認識ができていない病気の症状の表現方法を
ワトソン君に理解させるのは現段階では極めて困難だということ。 医者の診断支援AIとしては役に立ちそうな気がするのだけどな >>1
IBM製と言うだけで実用に耐えうるのか?w
Notesとか誰もが嫌うウンコ製品を未だに出してるしw
うちの会社じゃ廃止の方向に動いてるけど 機械学習できるようにカルテのフォーマットを統一しろっていう話だな
医者がわざと分かりづらく書くようになるかもしれんなw >>76
なんでAIの診断結果をそのまま使うのが前提なんだよ w
普通の医師の診断でも診断結果によって確認のための検査とか他の医師の意見とかも聞くだろ >>20
いや、専門でも素人がネットで調べてきた情報を提示されて、論理的に賛成なり否定できないのに開業してる人間が山ほどいる。一番驚いたのは、血圧をちゃんと測定出来ない内科医。祖母が機械で測った数値と違うと2ヶ月ほど訴えたのに、何の対処もせず間違い続けてる。
バカ医者が淘汰されるのが楽しみですわ。 >>26
まあなぁ。読み込ませるというより、データセットを設計して打ち込んでいくのが大変だわな。それでも優秀な医者を雇ってやる価値があると思うけどね。 >>27
まあでも、思い込みの少ないAIに歩があると思うけど。Googleは診断するためのインターフェースじゃないからね。 単純なデータの蓄積だけで、ケーススタディの蓄積が少ないんじゃないの
自主的に学習してすぐに人が到達できないレベルとなる >>28
症状から可能性を絞りこんで検査するんだから、しっかり症状を聞き出すインターフェースを作れば、思い込みの少ないAIの方がヌケ、モレが少ないのは確実。
医者とAIのどちらが時間的、インターフェース的に情報を取りやすいかは明らか。どんどん精度は上がっていくんだから、現時点のバグやデータの不備は更新すれば良いだけ。 人間の言葉を理解できないって時点でちょっとね…
そもそもシンギュラリティって騒ぐほどでもなかったか。 そんなことよりワトソンの問診が「医療行為」かの方が問題で実用化できないんじゃないか? 勉強不足な医者の診断より情報詰め込んだコンピュータの判断のほうが信用できる。
だって医者って誤診してもフィードバックないから自分が間違ったなんて気づかないし、その間違った判断を「経験と実績」て言うから経験も実績もあてにならない。 情報のインプットの方はもう少し正規化した方が良いな。
自然言語、しかも書いた本人にしかわからないようなメモ書きに頼るのはおかしいだろ。 略語の問題は、医療分野だけでなく、他の業種に使うときも問題になるだろうな。
まあ導入できるのは、ルール作りに
リソース使える大企業で、中小企業は導入できず潰れるかもしれんが、 医者が長年培った保身術が機械に弾かれるというだけなのではw グーグルの画像認識でも黒人とゴリラを区別できなかったじゃん、
そんなレベルで病気を正確に判断できるのかね。 ちなみに、医学はDBが整ってる領域だからね。
そこで実用レベルにできないということは、それ以外の学習用データが整備されていない分野は夢のまた夢ということ。 人工知能でなくてもアーキネーターの改造版でもかなりの病気は当てそう 前にいた会社はワトソンで食おうとしていたんだが、ご想像通り
あまりにも酷く、あきれてその会社辞めてしまった。20年ほどこの
世界に関わってきたものから言わしてもらうと、自然言語処理応用
の病理診断は、有望株の筆頭。だから、AIがだめなんじゃなく、IBM
がダメだ、というだけの話。SPSSといいワトソンと言い、本当に全く
使い物にならないものを売るのがIBM。しかもその使い物にならない
ものの資格商売までやらかすのだから笑いを通り越して呆然とする
しかない。Google, Amazonとの実力差はもう埋めようがないという
のは、論文あさっていればすぐ分かること。 シャーロック・ホームズの助手が医者のワトソンだもんな。
ワトソンが少し抜けているのをホームズはいつもバカにしていて
怒ったワトソンがホームズと長らく絶交したんだもんな。 >>99
生まれ変わって「Cortana」さんになったから。 >>81
医者はだなぁ
患者が発した文字通りの意味だけじゃなくて
表情とか雰囲気とか含めて診断してたりするんだよ
問診票と検査結果だけを扱うワトソンとは扱う情報量が違うわけで
このあたりが誤診を防ぐには重要だったりするの >>107
DBが整っているのとデータが整っているは違うからね ■ このスレッドは過去ログ倉庫に格納されています