【ネットワーク障害】AWS東京リージョンで障害、EC2やRDSに影響
■ このスレッドは過去ログ倉庫に格納されています
Amazon Web Services(AWS)の東京リージョンで8月23日の午後1時頃、通信障害が発生し、Elastic Compute Cloud(EC2)とRelational Database Service(RDS)が利用しづらい状況になった。同日午後3時現在、AWSは東京リージョンにおける1つのアベイラビリティゾーン(AZ)で接続性に関する複数の問題が起きており、根本原因を特定して復旧作業中だと説明している。
この障害によりAWS 東京リージョンをシステムを運用する多数の企業のサービスやウェブサイトなどに影響が発生し、エンドユーザーらが利用できない状況が生じている。
最新状況はAWSのService Health Dashboardで確認できる。
https://status.aws.amazon.com/#AP_block
・Update
日本時間2019年8月23日午後3時40分現在、AWSは、EC2ではサービスが復旧に向かってるとし、RDSでも根本原因を特定して復旧作業を進めているとしている。
https://japan.cnet.com/storage/2019/08/23/d42493c8f25dbb35e70a32410c4fb32c/aws_tokyo01.jpg
日本時間2019年8月23日午後3時現在のAWSのステータス
(様々な分野で障害が出ています、参考ページとしてGoogle検索を置いときます)
aws 障害 - Google 検索
https://www.google.com/search?tbs=qdr%3Ah&q=aws+%E9%9A%9C%E5%AE%B3
2019年08月23日 15時14分
CNET Japan
https://japan.zdnet.com/article/35141677/ >>1
多摩のデータセンターも建設中に燃えるし大変だなw こういうのって他の地域の鯖に切り替わったりしないのん? 社外秘の情報や個人情報を扱うのにクラウド利用する企業って、セキュリティ意識が低すぎると思う >>8
おじいちゃんおやすみのお時間ですよ(^^) >>8
大企業でさえUPSのファームウェアの更新もしない日本企業が言うと笑い話にしかならん これのせいでBacklogが死んでるんだが
アマゾンまじクソだな AWS「ごめんねテヘッ」「規約どおりなんも保障なしね」 >>7
複数の地域に分散させるマルチリージョン構成は
余程大きなシステムじゃないとコストの関係で蹴られるんじゃないかな
AWSは、地域の中がAZ(availability-zone)に分割されてるから
重要なサービスはマルチAZ構成にしてて、今回止まってないと思う。 >>22
同じリージョンに2台目のサーバ建てるのと
別のリージョンに2台目のサーバ建てるのではコストはさほど変わらない。
(設定は面倒になるけど)
むしろ東京リージョンは単価高いから別のリージョンに建てた方が安くなることすら考えられる。 ap-northeast-1a = apne1-az4 ←今回ここで問題発生
ap-northeast-1b = apne1-az3
ap-northeast-1c = apne1-az1
ap-northeast-1d = apne1-az2 こう言う時のためにAZがあるんだから
それ使ってない奴はオンプレだろうと信頼性の低いシステムしか組めないでしょ ケチってマルチAZで組まなかったのにシステム担当に文句言うのはお門違い。
馬鹿な社内のジジイどもに偉そうになんで使えねーんだ、アマゾン呼べとかw
SIerじゃないんだからアマゾンが来るかよ。
アマゾンより立場が上だと思ってる本当に馬鹿すぎるジジイども。 グーグルとマイクロソフトはいい営業の材料ができたな 俺が作った業務システムはSQLServerはExpressで、MultiA-Zにしてないt2.micro
という最弱構成だが全く問題無かったわ
月々数千円でホント助かってます >>31
結構な大手も影響受けてるから、multi-AZ構成でも影響受けたとこ多そう
今回、空調トラブルで完全に停止した機器のとこはHA作動しただろうけど、その周辺だかでスローダウンしたとこはpingには応答するし静的HTMLは返すのに、実際のリクエストはタイムアウトするような状態になって手動切り替えが必要になったんだろう ちゃんとMulti-AZ構成にしていないと、大変なことになるな。
まぁ、完全にサーバーレス移行組は高みの見物をしていただろう。 AZ複数使うのが当たり前と思ったが違うんか?
チュートリアルでもそう書いてあったろ?
それとも今回のはそんなのじゃ防げないとか? >>46
完全に死んでくれたならなんとかなってた
中途半端に死んでたから大混乱になった
その中途半端に死んでるサーバーを切り離そうとしても
ブラウザの管理画面もコマンドで操作するapiもかなり混んでてなかなか作業が進まない MultiAZにしとけばとか知ったか言ってる奴恥ずかしいぞ
RDSはMultiAZ設定にしててもフェールオーバー遅かったしその後も書き込み遅いまんま
ElasticBeanstalk等でも障害起きて直すの大変だった おかげで午後は暇だった
復旧後の残業強いられたけど・・・ マルチリージョンとか基本的にオーバーテクノロジーだから笑
手段が目的化して苦しむだけだよ
そんな構成でいいのは海外でもがっつり展開してるようなサービスだけ マルチAZ組んでてもインスタンスが半死半生だと上手くフィルオーバーしなかったケースはあるから一概に構成が悪いともいえない 俺はシングルAZのサービスもあって障害起きたけど
何度か自動再起動が走って普通にサービス維持出来たわ 結局、AZによるアベイラビリティ確保って何だったの?という印象しかないな
アマゾン側にも課題が残ったね
まあ、再発防止策を出せとか言われる日本のIT屋さんもこれから大変だろうけど
>>31
メッチャありそうで笑えるwww
こういうの嫌でユー子卒業したのよね >>36
それだったらlightsailで良いのでは? >>1
また東京か
震災対策とかどうなった?
地震起こったら止まりそうだな おかげでオンプレSIerは少し延命できるかもしれんな アマゾン火災の影響がこんなとこにも・・・
ああこれもアベ政権のツケか 基幹システムがAWS使ってるみたいだけど
昼に10分ほどおかしくなっただけだったよ
数時間も止まったら大問題になるわ コンタクトセンター止まっててウケたわ
サービス提供会社のステータス画面に記載されたトラブル時間より、実際に利用できなかった時間の方が圧倒的に長い
可用性99.9%とかいうのは嘘っぱちであることがよく分かった >>55
どうしても止められないようなシステムなら
最初からオンプレミスや別のクラウド業者に災対環境作るなりして対策してる。
そういうことも説明せずにやってないなら責められて当然だろ。 >>49
今回はそれで回避できたかもしれないけど
リージョンごと、もしくは複数のリージョンが繋がらなくなる事故もあるからMultiAZなんて気休めにしかならないね。 >>49
それはシステム設計そのものに問題があったんだろう。 >>67
設計に問題というのはRDSのフェールオーバーの件ね。 冷房故障の原因はなんだろう。
そっちの方が気になるわ。 センターの2つ3つが死んでも問題なく継続できます
お客さんは気にしなくて結構です
どーんと任せてコンクリ岸壁に固定した大船に乗った気でいてください
という対策を、Amazonが黙ってAWSに実装するのが筋 文句言っていいのは MultiAZで failoverが遅かったとこだけだろ
金をケチって冗長しないヤツはどうでもいい >>8
金融や官公庁もつかってるんだから
当然、秘匿するサービスはある
実装するしないは利用者の判断
おじいちゃん、情報古すぎ 分析機器なんかでも、アメリカに本社がある外資だと
日本向けに、平気で中古品を梱包してくる。
何らかの嫌がらせ。 複数の利用者が雑居してるシステムだとシステム全体を再起動とか出来ねーから大変だな
新しいノード作ってそこに移動してからとかいう手作業・・・
ネットワーク系の障害だったらすぐ直るんだけどな インフラベテラン勢ならわりと常識なんだけど、サーバー監視やHA入れたところで、綺麗な死に方をしてくれるケースなんて極めて稀なんだよねぇ。だいたい死んでるくせに元気よく「生きてまーっす!」と返事をしたりするゾンビランドサーバ。 米国リージョンでも大事故起こしたのに、相変わらずダメやな。
やっつけで構築したのだろう。 >>27
止まるとこはまずケチってるからな
どこでシステム稼働させようが障害時には同じことになるわな マルチAZにしとけばとかいってる勢は
アプリレベルで切り替えに対応してたり、
データベーキャッシュレベルで対応出来てるんかな?
場合によってはアプリのライブラリ本体に手を入れなきゃいけなかったりするけど 障害が起きるのは仕方ないけど、復旧はもう少し早くないとな 去年の多摩のDCの火災が無ければもう稼働しててバックアップになった筈なんだよなぁ >>8
普通情報の機密基準で社外と社内サーバー使い分ける これAmazon自体は関係なかったの?
まぁ当たり前の話なんだろうがAmazon自身が動いてるインフラは全然違うんだろうな…
GCPだったりしてw >>94
アマゾンの障害
特定のEC2鯖の熱暴走が発端 >>94
あ、「Amazon自体は」ってのは
Amazon(のネットショッピングサービス)自体は、って意味か?
ショッピングにも動画視聴にも影響なかった模様 >>96
ありがとう
さすがにco.jpの方は日本のサーバーなのかなと思うけど、AWSとリンクしてるとは限らないよねぇ… 頭の良い奴に金払ってきちんと仕事をしてもらう、
当たり前の事
彼らに払える金が即ち国力と言って良いだろう データセンターの屋根にあるTeslaのソーラーパネルが燃えて、電力系だダウンしたとか >>94
商売に影響ないように冗長構成になっているから、
amazonってセール中でも重くなったり繋がらなくなったりしない
今回、影響受けたところはAWSの冗長化の課金をケチっていた ■ このスレッドは過去ログ倉庫に格納されています