【情報/AI/管理】データの匿名化はウソだと欧州の研究者グループが解明[08/09]
■ このスレッドは過去ログ倉庫に格納されています
データの匿名化はウソだと欧州の研究者グループが解明
https://jp.techcrunch.com/2019/07/25/2019-07-24-researchers-spotlight-the-lie-of-anonymous-data/
2019/7/25 by Natasha Lomas
TechCrunch,https://jp.techcrunch.com
【科学(学問)ニュース+、記事全文はソースをご覧ください】
ヨーロッパの2つの大学の研究者たちが、匿名化されたデータセットから、たった15のデモグラフィック属性から99.98%の精度で個人を再識別できるとされる方法を公表した。
個人情報の複雑なデータセットは、情報サンプル(サブセット)を分離するといった今の匿名化方式では再特定を防げないことを、彼らのモデルは示唆している。
つまり、匿名化して公開された大きなデータセットで、厳格なアクセス制限なくして再特定に対して安全なものはひとつもないということだ。
「私たちの研究が示しているのは、大量にサンプリングされた匿名化データセットであっても、GDPR(EU一般データ保護規則)に明記された最新の基準を満たせず、公開したらそれっきりという非特定化モデルによる匿名化の技術的、法的な妥当性を著しく阻害します」と、インペリアル・カレッジ・ロンドンとベルギーのルーヴァン・カトリック大学の研究者たちは、Nature Communicationsに掲載された論文の要約の中に書いている。
当然ながら今回の研究は、データの匿名化を元に戻せることを初めて証明したものではない。この論文に関わった研究者の一人、インペリアル・カレッジ・ロンドンのイブ=アレキサンダー・デ・モントイ(Yves-Alexandre de Montjoye)氏は、これ以前の研究でも、たとえば、クレジットカードのメタデータから、わずか4つの情報の断片をランダムに抽出するだけで、買い物をした人の90%を、一意の個人として再特定できることを証明している。
スマートフォンの位置情報のプライバシー侵害問題について調査した、デ・モントイ氏が共同筆者となった別の研究論文によれば、たった4つの時空間地点からなるデータセットから、95%の個人を一意に特定することに成功したという。
同時に、寄せ集められたデータから簡単に個人が特定できてしまうというこれらの研究結果があるにも関わらず、マーケティング目的でブローカーが売買しているような匿名化された顧客データセットには、その何倍もの個人の属性データが含まれている恐れがある。
たとえば研究者たちは、データブローカーのExperianがAlteryxにアクセス権を販売した匿名化されたデータセットには、米国の1億2000万世帯の、世帯あたり248の属性データが含まれていたことを引き合いにい出している。
彼らのモデルから見れば、基本的に、これらの世帯はみな再特定される危険性がある。それでも、大量のデータセットが、匿名化という甘い言葉に載せられて、今でも取り引きされている。
個人情報がどれだけ商用目的で取り引きされているかに関して、さらに怖い話を聞きたい方に教えよう。あの悪評高い、すでに廃業した、政界にデータを売る会社Cambridge Analyticaは、昨年、こう話していた。それは、Facebookのデータ不正利用スキャンダルの最中のことだ。米国人有権者をターゲットにした内密な活動の基礎となったデータセットは、Acxiom、Experian、Infogroupといった有名データブローカーからライセンスされたものだった。とくに同社が強調していたのは、「米国人個人の無数のデータ点」は「超大手の信頼あるデータ収集業者とデータ販売業者」から合法的に入手したということだ。
匿名データセットから、驚くほど簡単に個人を再特定できてしまうことを、研究者たちは何年間にもわたり示してきたが、今回の研究の最大の成果は、あらゆるデータセットからどれだけ簡単に個人を特定できるかを見積もれる統計モデルを構築したことにある。
彼らは、データのマッチングが正しい可能性を演算することで、これを実現している。そのため、基本的に、マッチの一意性が評価される。また彼らは、小さなサンプリングの断片がデータの再特定を許してしまうことも突き止めた。
「人口統計と調査データからの210件のデータセットを使って私たちのアプローチを検証したところ、非常に小さなサンプリングデータの断片であっても、再特定の防止や個人データの保護の妨げになることがわかりました」と彼らは書いている。・・・
■■略
[原文へ]https://techcrunch.com/2019/07/24/researchers-spotlight-the-lie-of-anonymous-data/
(翻訳:金井哲夫) 毎日同じ電車に乗ってるおっさんを知ってるけど、興味がないデータだからって特定できても、仕方がないんだな データの匿名性は破れてるのいやまだだのと何年もやってたけど結局特定可能って事? 数百万の架空の有名人まで含むデータの中から
十数個の質問で一個を特定してしまう
アキネの存在がすべてを物語っている >>5
そういう事言うやつよくいるけど
結局お前がデータを活用できないって言ってるだけなのに悲しくならないんか?
自分の発想の乏しさを興味のなさに転換してるだけや キャッシュもIPも抜きまくりだろ
Andromedaなんか端末再起動してもファイルで保存してるし それより
ネットでなんか買うと
ずっと「オマエこれ買っただろ」って出てくる広告
なんとかならんかな
ズラッとTENGA広告が並んだときは
顔から火が出たわ プライバシーなんてあってないようなもんなんだよねえww
いくつかのデータがあればネット上はある個人を再現できるんだから、死んでも
死なないってことにもなるんだろうけどww >>11
買ったのかよw
ブラウザに保存されてるクッキーを消せば消えるよ "お前は見られている"
とか常に思ってるほうがモラルは高くなるかもしれんがな
ネットでも変な言動を取りづらくはなるかも
監視者が邪悪な恐怖政治組織とかじゃなけりゃあなあ
"グーグルさまが見てる" >>115
5chも特定されとるのにヘイト消えんだろ
お隣の国なんてもっと嫌がらせえせ歴史からヘイトしまくってるのも放置だろ できるだけデマをバラ撒くしかないな
ビッグデータをゴミにするほどの量で 一番いいのはネットにアクセスしないこと
次はデータが入っているものを物理的に壊すことかな 行動統計学の論文で、日本人1億2千万人なら8〜12,3項目くらいあれば
80%前後の確率での個人特定が可能だっていうのを読んだことあるよ
>>1の数字もまあ、あり得るのかなと思う 生徒の成績のデータをUSBメモリに入れて持ち歩くのは危険?
生徒の名前をidに変えて匿名化してもあかんの? >>1
ネットの遊びの魔神が適当に有名人を出してくれるヤツ おれが実況スレでおっぱいおっぱい言ってるのが特定されるのか GAFA「余計なことを言うな。由らしむべし知らしむべからず。」 よくある映画とかで、銀行に忍び込むために同じビルに入っている小さな会社の社員の個人情報を掴んで
なりすましたりするとか、清掃会社社員の個人情報をつかってビルに侵入するとか、あるよね。
DDoSアタックも初期は個人のパソコンをハッキングしまくって攻撃してたし、個人情報って思ったよりも使い勝手があるよ。
冤罪攻撃もあるし。 献血した奴で皇胤はすべてマークされているだろうなwww 再生核研究所声明 470 (2019.2.2)
ゼロ除算 1/0=0/0=z/0=\tan(\pi/2)=0 発見5周年を迎えて
http://vixra.org/pdf/1908.0100v1.pdf
Unique-IP document downloads: 506 times
Fundamental of Mathematics; Division by Zero Calculus and a New Axiom 完全の安全が不可能なように完全な匿名化も不可能性しょう。 >>2
男か女か程度のデータなら特定できない
はい論破 >>1
スノーデンは今日(米国時間2014/10/12)、New Yorker Festivalの中でリモートインタビューを受け、
プライバシーを守るために、何がわれわれにできるかについていくつか質問に答えた。
最初の回答は、政府方針の改革についてだった。
自分には「隠すものは何もない」という立場を取る人々に対して、
それは「権利のしくみに関する責任の在り方を覆すことだ」と反論した。
「私には隠す物など何もない」と言うことは「この権利のことなど私にはどうでもよい」と言っているのと同じだ。
つまりは「私はこの権利を持っていない、なぜならそれを正当化しなくてはならなくなったからだ」とあなたは言っている。
本来、政府によるあなたの権利に対する侵害は、政府が正当化しなくてはならない。
*****
665 名前:名無しさん@1周年 Mail: 投稿日:2019/01/05(土) 16:56:28.80 ID:PO/FMEdW0
結局自分が正しくないとわかってる奴は論点をずらしてわめき散らすしかない
>>19
ゲイツが早い段階で警告していたw
まぁ〜セキュリティー企業などあまり信用しない方が良いw 政府の統計目的ならともかく、民間企業が使う場合は個人の氏名と紐づけされて
ないとあまり意味がないからね。
表向きは匿名化したデータということになってても、まず個人情報と紐づけているとみて
間違いはないと思う。 この手のスレは収納こに保管されて書き込み出来ないのが通例なんじゃね?
書き込みテストして見たんだけどw 何年か前にキャッシュレス決済のいくつかの情報だけで個人を突き止めるとこが可能って記事を読んだ スマホにあらゆる情報を入れてるやつが信じられない
銀行やクレジットも一本化してこれ一台で何でもできるウェーイ >>11
トヨタのTNGA技術を調べてただけなんです!!
って必死に言い訳すると、みんな生暖かく見守ってくれるよ ■ このスレッドは過去ログ倉庫に格納されています