【IT】Amazonプライムデー初日にサーバーがダウンしたのは「DBをOracleから自社製に乗り換えた」ことが最大の理由
■ このスレッドは過去ログ倉庫に格納されています
日本時間で2018年7月16日の正午に始まったAmazonプライムデー2018では、セール開始直後にサーバーがダウンして約1時間にわたってアクセス障害が発生しました。Amazonが内部調査を行って作成した報告書によると、この問題は取引のデータベース(DB)を従来のOracle製から自社製に乗り換えたことが最大の理由である可能性が高まっています。
Amazon move off Oracle caused Prime Day outage in warehouse
https://www.cnbc.com/2018/10/23/amazon-move-off-oracle-caused-prime-day-outage-in-warehouse.html
Amazonプライムデー2018は同社にとって「史上最高」となるセールス記録を樹立しました。Amazonは売上高を公表しないことで知られていますが、2018年にはセール期間中に1億点以上の商品が売れたとしており、日本円で2000億円規模の売上高があったとみられています。
Amazon、プライムデーで過去最高の売上を記録 1億点以上の商品を販売 - iPhone Mania
https://iphone-mania.jp/news-219376/
世界的な「ネット通販絶好調」を改めて認識させる実績だったわけですが、実はその裏ではセール初日にサーバーがダウンして、日本円で100億円以上の機会損失が発生していたことも明らかになっています。
Amazonの調査報告書を入手したというCNBCが報じたところによると、オハイオ州にある北米最大のAmazonの倉庫(フルフィルメント・センター)で起こった障害は、DBの処理能力がネックとなって発生したものであると分析されているとのこと。Amazonは2020年までに商品管理のDBをOracle製から自社製に入れ替える方針を定めており、既に多くの工場ではAmazon Web Service(AWS)のAmazon Aurora PostgreSQL(Aurora)の導入が進められています。しかしこの新DBが爆発的に増加した注文数に対応しきれなくなったことで、システム全体がダウンする事態に至った模様です。
大きな問題を引き起こすことになった要因の一つが、OracleとAuroraの間で「savepoint」の扱い方が異なる点にあるといいます。savepointは個別の取引をトラッキングあるいは復元するために重要なDBツールなのですが、プライムデーに発生した極めて大量の注文により膨大な量のsavepointが作成され、システム全体の処理速度が異常に低下してしまったと報告書では示されているとのこと。
イリノイ大学アーバナ・シャンペーン校のコンピューターサイエンティストであるマット・シーザー氏はCNBCが入手した資料に目を通して、「もしAmazonがOracleを使い続けていたら、この問題は起こらなかったでしょう」と述べて、DBシステムの乗り換えが障害の最大の要因であることを指摘。さらに、増大する取引量の規模に見合った事前の対策が行われず、問題が発生した際の対処マニュアルなどの準備が不足していたために、障害を取り除くまでに1時間もかかってしまったという問題点も指摘されています。
このように、Amazonの大規模なシステム障害は「起こるべくして起こった」という側面は否定しきれない模様。この件とは別に、Oracleの会長で共同設立者でもあるラリー・エリソン氏はAmazonがOracleから距離を置くという方針を示したことに対し、「Oracleなしでは無理だ」という発言を過去に行っています。また、Moor Insights & Strategyのアナリストであるパトリック・ムーアヘッド氏は「AWS Auroraは、将来志向のアプリケーション向けに設計されているのに対し、Oracleはレガシー的なアプリケーションに適した設計となっています」と語っています。
https://gigazine.net/news/20181024-amazon-prime-day-outage-database/ AmazonよりZOZOTOWNの方が優秀だよ(´・ω・`) なるほど・・・オラクル止めれば、長い目で見たら相当なコスト削減になる OracleとPostqresってそんなに差があるのかな?
savepointの実装や使い方がOracleに最適化されていてそのまま使ったことが問題だったとかはないのか?
AWSのインスタンスとかストレージとかは同じ条件で比べてるのか?
そもそもリレーショナルDBを使うほど否定的の問い合わせが多いのか? >Amazonプライムデー初日にサーバーがダウンした
おまえいつも落ちてんだろうが。
落ちないデーなプライムデー初日がまったくないだろうが。 oracleからいくらもらってこの記事書いたんだ? CloudSpannerならこんな問題起きなかった でもこれで経験値稼いで次からあのとんでもないトランザクションをちゃんと処理をこなせるだろ DBってスレタイでも、もう淫夢スレにはならないんだな
時の流れを感じるわ 1時間で直って問題も洗い出されたからOracleに金を払い続けるよりはいいんじゃないか? ボラクルは最近使いづらさの限界点を超えちゃったからな
バージョンアップする度に、変なオプションつけないとまともにメンテ契約できなくなるし 「データベースは接続技術(キリッ)」
変な顔のAAを使う奴がいたら、そう言ってやろう
発狂するよ >>5
マルチスレッドの使い方はoracleの方がスゴイよ。 鈍重だけど、お金と人をかけてちゃんと最適化してやれば、
どんだけ負荷をかけても耐えられる化物に進化可能なのが Oracle
でもまあ、お金食い過ぎだよね…… ボラクルが何を言おうが、もうoracle脱出動きは止まらないよ。 オラクルはデータベース製品としては凄いんだけど会社とそこにいる人間がクソ オラクルだと落ちなかったという保証は全くないんだよね。
むしろプライムデーの大量アクセスに対して1時間で復旧できたなら
オラクル並みかむしろそれ以上かもしれない、と思うけど。 Amazon的には自社のDBにノウハウがたまってラッキーと思ってんじゃね? >>5
>OracleとPostqresってそんなに差があるのかな?
ある。
>savepointの実装や使い方がOracleに最適化されていてそのまま使ったことが問題だったとかはないのか?
そのままなんて使わない。
バカは本文の意味がわからないね。
>AWSのインスタンスとかストレージとかは同じ条件で比べてるのか?
バカ?なんで、AWSのインスタンスなんかと比べるの?
>そもそもリレーショナルDBを使うほど否定的の問い合わせが多いのか?
は?NoSQLでは手に負えないレベルの話はほぼRDBMSですよ?
ど素人はまずITパスポートレベルからやり直せ、 Amazonや銀行みたいな所はともかく、
普通の企業で何が何でもオラクルじゃないと駄目だという場面は
ほとんど無いだろうな。 >>7
まあ、地道なトランザクションはオラクルはチューニングすれば大体なんとかなる。
DB2は危なっかしいが、設計する側が優秀なことが多いから力技使ってもなんとかする。
MySQLやPostGressは差が大きいね。
MySQLはデータベースモデル変えて、オンザフライで動かせばNoSQL並みの速度になる。
PostGressはそもそも速度優先のデータベースじゃない。 >>1
}l 'ヾミミヽ rz彡‐`ヽ |::fYj
{| 、_tッ、,゙ ' r' rtッ_‐ァ' |::}}!
゙l `ー 'ノ !、`ー ' |::リノ オラクルはぼったくりが過ぎるので、本当にもう使いたくない。 AmazonのDBはおかしいな。応答が異常に遅い。 ベゾスが怒り狂ってDBの速度改善を命令するだけだろう
金は腐るほどある posgreと書いてあるから一から作ってるわけではないだろうが
果てしない開発業務をこなしてるんだな。
たぶん、1秒間に数百万リクエストとか、ほぼ未知の領域の
処理を求められてるんだろう。 アマゾンのセールは見づらいから
PDF30ページぐらいのチラシで頼む オラクルに無駄金使うより自社DB技術者にノウハウ溜まる方が得やん Aurora、バグだらけ(特に全文検索)な上に、「将来を保証するものではありません」と、極めて腹立たしい回答が帰ってくる。
うちなんか、DBが毎日のように勝手に再起動する。プログラムの書き換えでバグの回避中。とんでもない工数だわ。 彡⌒ ヾ
( ^ω^)何を言ってるのか全然わからん AWS Auroraで構築したけど、Oracleの方が遙かに優れている
けど信者たちはAWSを信じ切っているだけ もう説明するの疲れたよ
「何でこんなに高いんだ」
「つまりサーバの価格はほぼオラクルの価格なので」
「馬鹿なことを言うな。サーバより高いソフトなどあるはず無いだろ」 要するに、高いソフトだけの性能はある
ってだけの話っすよね 、_、ト'i从ト,、_、
、y':::::::::::::::::::::`:`'w、
_'シ::::::::::::::::::::::::::::::::::厶、
_z':::::::::::::::::::::::::::::::::::::::::::::そ_
彡::, '" ̄``ー、≦==、:::::::::ミ
彳j `` ` ヾ::::::ミ、
l:f __ ・ _,.、 `!::::::ミ
}l 'ヾミミヽ rz彡‐`ヽ |::fYj
{| 、_tッ、,゙ ' r' rtッ_‐ァ' |::}}!
゙l `ー 'ノ !、`ー ' |::リノ
l . ,イ 'ヽ }チ'
'、 ゚ ´...:^ー^:':... ゚ 卞、
ヽ r ζ竺=ァ‐、 ,ハ
丶 `二´ 丶 // ',_
_ノ丶、 ,. ' / ! ` ―- 、
_,. - '´ ヾ` ̄´ / l `丶、 オラクル切りは正しい
事故ったのはいい勉強になっただろ
1時間で直ったのはすごい、単なる再起動じゃなく原因特定して問題解決させたのなら
MySQLのAuroraはコスパ悪い
1時間で何億円の損失が予想されるの? AWSがどんなサービスかも分からず地方住み高卒の頓珍漢な書き込みが続くんだろうなあ >>1
彡⌒ ヾ
( ^ω^)oracleを排除、今後も加速して頑張ってくれ >>Amazonプライムデー2018は同社にとって「史上最高」となるセールス記録を樹立しました
じゃあいいじゃんw >>6
こういうのは「いいか!押すなよ!絶対に押すなよ!」と同じで鯖落ちするところまでが祭りのお約束だよね AmazonはOracleにどれくらい払ってたんだろう >>27
お前のが馬鹿だろ
ec2やebsが同等なのかって話だろ あー、こりゃバグだな。
savepointってトランザクションの途中まで戻るやつだけど、
大量の処理さばききれなくてロック多発しまくって、全体のパフォーマンスが大幅に落ちたんだろ。
逆に1時間でどう解消したんだろな?ひたすらロックしてるSQLをKillしまくったんかな? ORACLE切りの流れは続くよね。どう考えても高すぎるから。 負荷試験が甘かったか。
でも、プライムデーの状況は、事前テスト可能なんだろうか?どうしても事前にテストできないような状況だったのから、この障害が起きたのかも。 oracleはライセンスの買い方がワケわからないしそもそも高すぎるし
サポートはレスポンス良くないし
まあ控え目に言ってゴミ 付属のツールが使いやすいしSQLServerでいいわ SEだけどアマゾンはMySQL知らんのか?
PostgreSQLなんて聞いたことないぞ
なんでそんなマイナーなもの使ってんの?w 結局
オラクルに100億円払うか
機会損失で100億円失うか
しかし失った100億円で自社製DBに乗り換えられたなら消して損ではないな
素晴らしい投資だよ 流石に世界中で長年使われてきたデータベースは信頼性が違うな。
Oracleより遥かに資金力がありドッグフーディング開発が
できるAMAZONなのだからすぐに追いついてくるとは思うが。 >>63
そこが気になる
killしまくっても根本原因の解決にはならないし… >>1
プライムデー1時間の機会損失よりOracleのを将来にわたって使い続けることによる発生するライセンス料の方が高いんだろ? たぶん某社のサポートだったらDBごと消失だろうなぁ 1hで障害を回避し、今はPostgre で普通に運用できているなら、oracle なしでもやっていけることを証明できているのでは?
障害で機会損失があっても、この先取り戻せる相当なコストダウンになるよな。 開始すぐダウンの方がニュースになって
人気殺到してるんだなぁって集客上がるんじゃないかと とりあえずID:S6iGErxmはawsドキュメント一読するまでromっとけ無能 自社でやるとかamazon凄すぎだな
oracleからamazonDBに変えるか ところでoracle製のdbってmysqlのこと? 売れてまっせのアピールにはサーバーダウンはお決まりだからな。 >>10
DB7つ集めてシェンロンに元に戻してもらえ その昔
informixというDBがあってだな…… >>20
将来的に金食い虫になるリスクがある製品を選ぶかねぇ。 自社サービスのβテストにコジキを使う
正しい戦術だな 【ヤフオクの評価欄】
落札者からの コメント:あなたから雇われたという探偵社から連絡がありました。2ちゃんねるには
私の名前やIDが沢山書き込まれています。この出品者はキャンセルすると報復をするようです。
店名で検索すると他にも被害者が沢山います。とても普通の方とは思えません。警察に相談します。
(評価日時:2015年 4月 29日 17時 43分)
販売業者の名称 有限会社コー ルドターキー/DC BANK 代表取締役渡邊弘宣
販売業者の住所 〒160-002都新宿区新宿3-12-11 石井ビル2F
Phone:03-5269-3675
http://rating7.auctions.yahoo.co.jp/jp/show/rating?userID=dcdcbank&author=zihardiy&aID=184888178&bfilter=&bextra=&brole=&bapg=1 Oracleから別DBはマジ大変そうだな
PL/SQLとか殆ど使ってなかったんだろうな >>28
下請け掻き集めて作ってる限り必要
なんと言ってもクソみたいなクエリでも結果が返ってくるからな > 極めて大量の注文により膨大な量のsavepointが作成され、システム全体の処理速度が異常に低下してしまったと報告書では示されているとのこと。
処理量・負荷に対するリソース見積もりが甘かっただけやん
しょぼ ■ このスレッドは過去ログ倉庫に格納されています