X



【IT】三菱UFJニコスのシステム障害の原因が判明、3個のHDDが同時に故障
■ このスレッドは過去ログ倉庫に格納されています
0001ノチラ ★
垢版 |
2018/02/09(金) 00:02:10.35ID:CAP_USER
 三菱UFJニコスは2018年2月7日、2017年末に発生したシステム障害の原因や影響範囲などについて発表した。同社のクレジットカード「NICOSカード」の基幹システムで、ハードディスク(HDD)が3個故障したのが原因だ。2018年1月末時点で一部の会員に対する請求が遅れているなど、事態を収束しきれていない。

マスターデータから中間加工ファイルを作成するバッチ処理のシステムでHDDが故障し、障害が発生した。三菱UFJニコスによれば、HDD15個で一連の機能を果たしており、そのうち3個が同時に故障した。「2個までの同時障害は自動復旧可能な仕組みを設けていたが、3個の故障は想定外だった」(広報)。同社はシステムやHDDの開発企業を明らかにしていないものの、「発生確率は極めて低いとの報告を受けている」という。

 故障したHDDは、障害が発生した2017年12月26日中に交換したが、利用会員の売上データ処理などに遅れが発生した。一部の利用会員に2重請求が発生したほか、請求が遅れるなどの事態につながった。同社はシステム機器の監視体制を強化するなどして対策を講じるという。
http://itpro.nikkeibp.co.jp/atcl/news/17/020803126/
0005名刺は切らしておりまして
垢版 |
2018/02/09(金) 00:11:06.70ID:89JTlr1N
3個壊れた事が原因じゃなくて、3個同時に壊した何か外的要因を見付けないと再発するんじゃ…
0007名刺は切らしておりまして
垢版 |
2018/02/09(金) 00:15:32.33ID:PO0Yufgv
HDDが3個同時に  ね。
電源だろ。
0008名刺は切らしておりまして
垢版 |
2018/02/09(金) 00:16:33.84ID:IXeb3oF/
ガチで壊れることもあるとか想像できんのかここの馬鹿は
0010名刺は切らしておりまして
垢版 |
2018/02/09(金) 00:17:41.75ID:4kNzW4H3
これまでどう補修してきたかだねぇ。壊れるごとに1つずつ交換していくと
だんだん壊れる確率は上がってくるんだが...
0012名刺は切らしておりまして
垢版 |
2018/02/09(金) 00:20:29.17ID:pysNJWC7
ニコスを語った詐欺メールも最近出回ってる
情報も漏れたな
メールにちゃんと本名書かれてる
0013名刺は切らしておりまして
垢版 |
2018/02/09(金) 00:21:37.11ID:ShDC5c8h
核EMPだと 全システムこれだもんな
北朝鮮危険すぎ
0014名刺は切らしておりまして
垢版 |
2018/02/09(金) 00:22:19.24ID:YCtvFpAO
 


こういうのはさ、本当の原因を明らかにしないこともある。
とりあえず出して来た報告はRaid6?の訂正不能エラーだけどさ。


 
0015名刺は切らしておりまして
垢版 |
2018/02/09(金) 00:25:16.00ID:LJNXpp/8
「同時に」ってのがどのくらいかだよなあ
例えば1週間かけて壊れたなら、監視体制が完全に悪い
本当に1秒の狂いもなく同時に壊れたなら、外的要因だからそれを解決しないといかん

偶然では済まされない話
0016名刺は切らしておりまして
垢版 |
2018/02/09(金) 00:26:04.20ID:vpkyRkbn
>7
俺もそう思うけど、そんなしょぼい電源つかうのかな。。原因教えてほしいな
0017名刺は切らしておりまして
垢版 |
2018/02/09(金) 00:27:08.11ID:lfcdj57a
SDDに変えよう
0018名刺は切らしておりまして
垢版 |
2018/02/09(金) 00:28:30.29ID:lfcdj57a
SSDです ごめんなさい
0019名刺は切らしておりまして
垢版 |
2018/02/09(金) 00:28:39.07ID:YCtvFpAO
 


ハード的には15HDDで2台故障を許容というのは、
まあNICOS程度の重要性ならいいかなって思うけど、

>一部の利用会員に2重請求が発生したほか、

これはダメっしょ。
ジャーナルとかシステムの欠陥臭い。

それから3台壊れたのも特定の原因が無いか調べた方がいいね。
本当に偶発かどうか。
HDDに負担の大きい周波数の振動が伝わってないかとかだけど。


 
0020名刺は切らしておりまして
垢版 |
2018/02/09(金) 00:30:28.89ID:YCtvFpAO
 


SSDは増えてるよ。法人向けでは多少高くても。

でもクレカ業界は競争が激しいからなあ。


 
0021名刺は切らしておりまして
垢版 |
2018/02/09(金) 00:38:44.67ID:RmQKJzpz
RAID組んでたHDDが2台同時に逝った事はあったわ。
HDDに、データ転送量が一定量に達すると使用不能になる致命的なバグがあった。

Seagateめ…
0022名刺は切らしておりまして
垢版 |
2018/02/09(金) 00:45:07.50ID:VB+2KkqN
15個くらいSSDに替えろや
0023名刺は切らしておりまして
垢版 |
2018/02/09(金) 00:46:32.24ID:eAXN28r5
何処製だよww
0025名刺は切らしておりまして
垢版 |
2018/02/09(金) 00:50:52.72ID:tmEHgwEz
同一の初期ロットで何か問題あつろたと考えれるよ
多分公表しないけど
0026名刺は切らしておりまして
垢版 |
2018/02/09(金) 00:52:23.42ID:9Cig+Mwd
同時故障なんて普通ない
ディスクを収容してるハードウェアの問題を疑う
0028名刺は切らしておりまして
垢版 |
2018/02/09(金) 00:54:38.87ID:c43aajtC
3個でシステム障害ってRAID6か何かかしら
SOHOとか小規模オフィスレベルの冗長性だのう
0029名刺は切らしておりまして
垢版 |
2018/02/09(金) 00:58:05.28ID:Dk9PEcFI
>>1
なか〜ま
俺もバックアップ含めて3つの同時に飛んだ
物理的にぶっ壊れてだからしょうがないけどね

でも企業がこれはだらしないね
0030名刺は切らしておりまして
垢版 |
2018/02/09(金) 01:00:40.96ID:fM5kS862
>>15
文系の経営は馬鹿だからこういうことがわからんのです
対応は講じても原因を追求するという研究心がない
0031名刺は切らしておりまして
垢版 |
2018/02/09(金) 01:08:05.92ID:d76LDMDA
RAID6での複数HDD故障は、業務用ならありえる話。

品質の悪い某社製のHDDが多数出回っていて、そいつが連鎖的に壊れる糞製品で、ババ抜き状態に陥ってる。

全部、茨城にあるあの会社のせい!!
0032名刺は切らしておりまして
垢版 |
2018/02/09(金) 01:12:30.62ID:cdTJEH2l
昔似たようなことを経験したなぁ。
実際には HDD は故障していないにもかかわらず RAID カードが故障と
みなしてちょいちょい HDD が故障が頻発、データロストしてくれましたよ。
たまたま別サーバ増設時に再発して、新規サーバの RAID カードに
交換してみたら直って原因が発覚したが。
0033名刺は切らしておりまして
垢版 |
2018/02/09(金) 01:16:40.15ID:YCtvFpAO
 


新品で導入すると、

HDDで最初の1台が故障すると、短期間のうちの次々と故障することがよくある。
まあ当たり前なんだけどね。

最初の1台故障でHDD全台入替でもいい気がする。


 
0034名刺は切らしておりまして
垢版 |
2018/02/09(金) 01:22:13.21ID:x6rPOQeg
>>5
0035名刺は切らしておりまして
垢版 |
2018/02/09(金) 01:22:17.52ID:d76LDMDA
因みに対策は、バックアップを取るかレプリケーションを構築することな。

金をけちって、ストレージ1台でやろうとするから、こんなことになるんだよ。

警報監視の強化とかは短期的な施策であって全然根本解決にならない。
基幹システムなら、金をかけて2重化しろってこと。
ニコスの担当役員がアホなんだろうな。
0036名刺は切らしておりまして
垢版 |
2018/02/09(金) 01:23:33.33ID:cdTJEH2l
復旧後に重複請求やらかてるあたり、トランザクションDBだと思うので RAID は 10 かな。
3個同時に壊れたとかいってるけど、プレスリリースで対応策のいの一番に監視強化とか
出してる辺り、監視システムの設定忘れなだけだと思う。
0037名刺は切らしておりまして
垢版 |
2018/02/09(金) 01:23:53.43ID:EuIVe8xz
同じロットのHDDは同じタイミングで壊れる。何台並列にしていても無意味
0039名刺は切らしておりまして
垢版 |
2018/02/09(金) 01:31:31.06ID:cdTJEH2l
>>25
RAID 製品はロット不良回避するためにシャッフルしてメーカが出荷してくるよ。

>>26
RAIDカードが誤動作して(実際には故障してないのに)HDD故障連発してくれるやつを
引いたことがあるんで、その可能性はあるね。

>>27
3.5インチの HDD なら 2U で12個収容なので、HDDx15構成の場合はエンクロージャ
2台目にHDD3個収容。 これもありうるね。
0040名刺は切らしておりまして
垢版 |
2018/02/09(金) 01:33:21.64ID:s3sMwtXw
ニュータニックスのコンバインドサーバーならしのげたんか?
0041名刺は切らしておりまして
垢版 |
2018/02/09(金) 01:43:06.34ID:uBWOMnNT
3台に共通してる部分がなんかしらあるはず
0042名刺は切らしておりまして
垢版 |
2018/02/09(金) 01:43:19.27ID:WmwrP9Ne
だから同一メーカーの同時期導入は辞めろと
0043名刺は切らしておりまして
垢版 |
2018/02/09(金) 01:49:22.12ID:cdTJEH2l
>>40
Nutanix オンリーでDB組んでも速度でず使い物にならないないから普通は
ストレージだけ外出しにするね。 そうなると Nutanix でもしのげない。
0044名刺は切らしておりまして
垢版 |
2018/02/09(金) 01:51:05.56ID:R+80gUvC
Quantum Fireball に違いない!
0045名刺は切らしておりまして
垢版 |
2018/02/09(金) 01:55:01.78ID:Yqt7ekpz
シーゲートだな
0046名刺は切らしておりまして
垢版 |
2018/02/09(金) 01:55:35.87ID:RLkByZkM
同時3個のハードディスクじゃなく
壊れてたけどほったらかし状態だったハードが
3個目でトラブルが出たって言う事でしょ
サーバー的なハードって2個で同じ情報を管理し
1個が壊れても修復が出来るって言う品物
0049名刺は切らしておりまして
垢版 |
2018/02/09(金) 02:03:09.24ID:Z5TAscFK
他の基幹システムでも、同じ程度の基準で作られていないか?
同程度のあり得ない確率の障害試験も実施を義務付けないと。
0050名刺は切らしておりまして
垢版 |
2018/02/09(金) 02:03:10.41ID:xPWn4LlO
基幹システムはraid0+1の考え方の3重ミラーじゃないと駄目なんだよな。
2重だと片ミラー状態からの復旧時にコピー元が壊れてはいさようならになるし。
raid5とか6なんて信頼性無いと思う。
0052名刺は切らしておりまして
垢版 |
2018/02/09(金) 02:13:37.06ID:qowKPVFI
誰かが意図的にやったか、HDDが故障するような環境状態になったか
まあいずれにしても無理やり偶然だったことにするか
0053名刺は切らしておりまして
垢版 |
2018/02/09(金) 02:41:19.50ID:eFUW9kf7
RAID6って、全く同じ情報を二つ持っておくやり方と比べて
どっちが安全性が高いですか?
0056名刺は切らしておりまして
垢版 |
2018/02/09(金) 03:21:20.04ID:vO6jAkdx
こりゃ、ApplePay対応は期待出来んか。
0057名刺は切らしておりまして
垢版 |
2018/02/09(金) 03:23:05.06ID:vO6jAkdx
ユーチューバーと大差ないストレージ環境でカード会社を運営してるのだろうか?
0059名刺は切らしておりまして
垢版 |
2018/02/09(金) 04:15:16.50ID:Zneo5ew7
個人でもHDD15台って運用している奴いそうなのに、何だろな
0061名刺は切らしておりまして
垢版 |
2018/02/09(金) 04:20:45.34ID:Zneo5ew7
故障という意味ではどのメーカーも故障する
RAID6だから安心ってアカンやろ
0062名刺は切らしておりまして
垢版 |
2018/02/09(金) 04:24:56.08ID:Zneo5ew7
社内にメイン、サブ、遠隔地にバックアップって3重ぐらいの安全策取ってるかと思ってたけどそうでもないのね
0063名刺は切らしておりまして
垢版 |
2018/02/09(金) 04:29:51.73ID:VM7EbZlf
Raid10
Raid60
0064名刺は切らしておりまして
垢版 |
2018/02/09(金) 04:37:10.24ID:Zqh//k6c
流石クレカ業界のみずほと言うべきか
0065名刺は切らしておりまして
垢版 |
2018/02/09(金) 04:41:26.41ID:qB9Jvxmk
今までで数回、RAIDコントローラーが故障したことある
あれは泣ける
0066名刺は切らしておりまして
垢版 |
2018/02/09(金) 04:43:30.08ID:pEDaao/A
RAID6か
2台壊れてリビルド中になんてことも割とある
同じモデルや近いロット使うから時期はかぶりやすいよな
0067名刺は切らしておりまして
垢版 |
2018/02/09(金) 04:43:52.07ID:VM7EbZlf
>>53
同じ情報を持っておくやり方が「3冗長Raid1」であるなら
3冗長Raid1のほうが安全とされる
Disk8枚分の 3冗長Raid1 なら必要な枚数は
8*3=24枚必要
対してRaid6なら
8+2=10枚必要
0068名刺は切らしておりまして
垢版 |
2018/02/09(金) 04:46:51.27ID:e+e2LsnU
RAID6だね。こんな良く壊れるものを使ったら事故って当然だろう
RAIDは5とか6とかは設計に欠陥があるから使ったらダメって誰も指摘しなかったんだろうかねー

RAIDで使っていいのは、0+1だけだよ
ホットスタンバイとかバッテリバックアップのRAIDとか全てにおいてRAIDは使わない方がいい
常に3台に同じものを格納しておくのが今の普通のやり方
0069名刺は切らしておりまして
垢版 |
2018/02/09(金) 04:57:12.68ID:e+e2LsnU
>>67
HDDみたいな消耗品かつ値段の安いものをケチケチして、会社のイメージ失墜してたら意味ないよな

>>65
RAIDコントローラー自体が何か多重化されてないなら、それが壊れたら全滅だね
RAIDコントローラーは使わない、もし使うとしても、HDDを繋ぐポートが足りないから使う、程度の扱いじゃないとね
ありとあらゆるものがいつか、どこか壊れるのは必然
サーバーのマザーボードも壊れるだろうし、悪くするとラックの電源が切れるかもしれない
いろいろ心配な人は、無停電電源を入れると安心ですよなどと、いい加減なことを言うが、
無停電電源が故障する可能性をわかってない
何もせずに、電源系統を2つにした方がいい
LANケーブルのコネクタも壊れるし、ケーブル切断もするし、到底壊れそうに見えないものも確率で壊れる
信頼性向上のために、余計な装置を、例えばRAIDカードを使うのは、ダメ

唯一の解決法はどれがどう壊れてもいいように多重化すること、2重じゃ足りないので3重が今時
0070名刺は切らしておりまして
垢版 |
2018/02/09(金) 04:57:13.23ID:Ts13H19P
Seagateかな?
0072名刺は切らしておりまして
垢版 |
2018/02/09(金) 05:07:17.61ID:yRs8DHyw
繋げてる大元がパチッと逝けば連動して死ぬのはトーゼンだろバカかよそれでもシステム屋かよ
0074名刺は切らしておりまして
垢版 |
2018/02/09(金) 07:15:14.08ID:HOuDfKWO
どうせ新しい検証で破壊耐性調べてないロットを3つ使ってほぼ同時に壊れただけじゃないか?
普通製造週離すしアホ運用だったんだろう
0076名刺は切らしておりまして
垢版 |
2018/02/09(金) 07:53:05.66ID:tc5MmPBK
こういうのがあるから、いまだに金融期間はホスト使ってるんだよな。
くそ高いけど
0077名刺は切らしておりまして
垢版 |
2018/02/09(金) 07:55:54.89ID:cdTJEH2l
ちょいちょいしったかで RAID6 はダメ RAID 0+1 だとか言ってる奴いるが、まず RAID 1+0(orRAID10) だからな。
RAID 0+1 とは別。
あと通常のファイルサーバの類は大概 RAID6。 RAID10 を使うのはデータベースだけで、その理由も
RAID5/6 がランダム書き込みアクセスで IOPS 出せないから。
0079名刺は切らしておりまして
垢版 |
2018/02/09(金) 07:57:30.02ID:qTUjRNi0
意外とショボいハード構成なんだな
0081名刺は切らしておりまして
垢版 |
2018/02/09(金) 08:17:05.03ID:mIK2jUK5
もともと2台壊れていて、修理する前に3台目が逝ったんだろう?
保守がしょぼい部署はだいたいこれ。
0082名刺は切らしておりまして
垢版 |
2018/02/09(金) 08:33:45.22ID:Dcz3C0qs
>>81
うがった見方をすれば、メーカーを明かさないのはその辺が理由かな。

でも3発同時故障が無いとも限らないし、原因解析・解明結果で役に立つ情報は公開してほしい。
0083名刺は切らしておりまして
垢版 |
2018/02/09(金) 08:36:48.54ID:ZhzugMWe
バックアップとってないの?
0085名刺は切らしておりまして
垢版 |
2018/02/09(金) 08:44:47.13ID:4fTlrefM
HDDのメーカーはシーゲートかw
0089名刺は切らしておりまして
垢版 |
2018/02/09(金) 08:54:48.87ID:ydeS8Hxc
1個壊れる→RAID6だからいいか
2個壊れる→保守会社に連絡しないと・・・
保守会社がやって来てHDD交換とRAID再構成が終わる前に3個目故障→/(^o^)\

とか?
0090名刺は切らしておりまして
垢版 |
2018/02/09(金) 09:04:37.03ID:8OIpVRML
>>31
同じロットの製品を同時交換だとあり得るよなぁ。
今回は電源とか冷却が怪しそうだけど。
0091名刺は切らしておりまして
垢版 |
2018/02/09(金) 09:05:35.46ID:OV7T3R4t
>>1
RAID 6?
0092名刺は切らしておりまして
垢版 |
2018/02/09(金) 09:06:56.57ID:MPjJy37d
電源が不安定だったんじゃね?
0093名刺は切らしておりまして
垢版 |
2018/02/09(金) 09:09:41.99ID:GozRh4PW
「故障は2個までOK、3個だめ」ニコス
0094名刺は切らしておりまして
垢版 |
2018/02/09(金) 09:10:07.76ID:1mkdNrXi
1月の請求書が来なかったのはこのせいなのか?まー、Webでは請求額乗ってたから引き落としはされたけど。
0096名刺は切らしておりまして
垢版 |
2018/02/09(金) 09:13:59.75ID:TmmZLzBz
おれもストレージの障害出てたの見落として危うくデータ飛ばすとこだったから
こういうの見ると思い出して背筋が寒くなる
0098名刺は切らしておりまして
垢版 |
2018/02/09(金) 09:33:03.71ID:HV1FeXsY
基幹系システムはRAID6+1は必須だろ
6で留めるからこうなる
0100名刺は切らしておりまして
垢版 |
2018/02/09(金) 09:42:25.52ID:OQiM2+ag
RAID5で安心だと思ってた馬鹿か・・・

NTT DATAがまたやらかしたのか・・・

RAID5で組んだRAIDアレイ2組をRAID10で二重化するか、DBを冗長化しとけば
ハードウェアの物理故障なんてそもそも影響を受けない

システム設計した奴が無能すぎ
素人以下だわ
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況