【IT】日本HP製ソフトの不具合で京大スパコンのデータ77TBが消失 [田杉山脈★]
■ このスレッドは過去ログ倉庫に格納されています
京都大学学術情報メディアセンターは28日、日本ヒューレット・パッカードが開発したスパコン用ストレージバックアップするプログラムの不具合により、大容量ストレージ(/LARGE0)の一部が意図せず削除されたと発表した。
不具合が発生したのは、2021年12月14日〜16日の内、12月3日17時32分以降更新がなかったファイルで、消失ファイル数は約3,400万、容量は約77TBに達する。ファイル消失の原因は、バックアッププログラムの機能改修において、不用意なプログラムの修正とその適用手順に問題があったことで、本来は不要になった過去のバックアップログファイルを削除する処理が、/LARGE0ディレクトリ配下のファイル群を削除してしまう処理として誤動作した。
日本HPでは、京都大学宛の報告書で「弊社100%の責任によりLustreファイルシステムのファイル消失の重大障害を来し、多大なるご迷惑をお掛けしたことを深くお詫び申し上げます」と述べている。
現在はバックアップ処理を停止しており、プログラムの問題を改善し、確実に再発しない対策をした上で1月末までにはバックアップを再開する予定。
また、ファイル消失後にバックアップが実行されてしまった領域のファイルの復元ができない状況となったことから、将来的にはこれまでのミラーリングによるバックアップだけでなく、1世代分の増分バックアップを残す等の機能強化を検討する。
https://pc.watch.impress.co.jp/docs/news/1378005.html 77TBってすげーな
うちの会社なんて全体で40GBのデータしかないのに 「弊社100%の責任」という表現が出てくるのがすごいな
対処を間違うとHPEクレイが日本のスパコン市場から撤退せざるを得なくなるような事態なんだろうな hpはクライアントPCでも独自クソソフト入れてくるからなぁ PSOの奴は全ユーザー合計したら何TB位だったのかな バックアップとってるなら復元できるんじゃね?
ドンぐらい時間かかるか知らんけど >>12
まず最初にhpのソフトを全てアンインストールして復元ポイントを作ってようやく普通のPCの出荷状態になる >>10
それはいくら何でも少な過ぎじゃね?
今時40GBはスマホだぞ 一般企業の業務のデータならすんなり金で解決で良いだろうけど
学術研究データだと、研究者にとってはなかなかつらいだろうな
セクター読んでデータサルベージ出来るならよいけど、テラバイトもあると厳しいか >>19
WordとExcelだけなら1年分のデータが数GBで足りる 俺のPCのHDDでも8TBはあるぞ
SSD入れたら10TB
大したことないだろw 77T分か
俺の無臭ファイルは10Tしかないから、その8倍近くだもんな
俺だったら、ショックで勃ちなおれなくなるわ 本当に必要なデータは必ず2か所以上に格納しておきましょう
ただし一つの不具合で同時にクラッシュするトコロはいけません 20年以上前にHDDからCD-Rへの退避で同じようなことをしたのを思い出した
600MBくらいだったけど、(当時の)貴重なエロ動画を多数失ってショックだった
77TBかあ…… バックアップ用のDBで不要になったテーブルを
TRUNCATEしたら本番環境だったことはある こんなシステムなのになぜ複数箇所にバックアップが無いんだ
RAIDなんてゴミじゃなく複数ミラーリングのほうが維持も冗長性も優れておる、RAIDは絵に描いた壮大なくそ >>14
まず本体の元データを削除して、その更新を元にバックアップを削除してるから
本体もバックアップも両方ファイルは消失してるんだわ。 百ぱーの責任と認める所がいいね、支那や韓国の
企業ならとことん責任転嫁するだろうな。 >>19
必要な情報はASPタイプのソフトに入ってるから、自社で保管しているデータはサーバー上だとそんなもんしかないんだよ。
各自のパソコンにどの程度のデータが保存されてるかは知らんけど。 ちゃんと不具合認めてるならマシだよな
単なるミスでやらかした時に
ごく稀に起きる大層な理由を考えて
それに対する対応策も考えて全て捏造されたのを
報告するのが普通だから 京大のスパコンは長年富士通だったが2012年からクレイ(現HPE)が受注、2016年の更新でもクレイ製だった
ちょうど次期更新の入札時期が来ていて、来年2月締切になっている たった2日間の不具合で、上書きされた領域分の77TBが消失したということは
1日30TB以上書き込んでるのか
データ全体では何テラバイトくらいあるんだろうな 日本のメーカーだったらユーザーのせいにして追加料金ぼったくりそう こっわ!
rm -rf /LARGE0
(^o^) >>6
清岡純子先生の作品なら、俺が提供できるぞ。 77TBって
俺のエロデータに匹敵するレベルの容量でビビるわ 77TBなんて
動画や画像なら大したことないが、
研究記録などのドキュメント原本なら悲惨。 意地でも復元求めないならそこまでのデータ
どちらも想定が甘い 1世代前のバックアップなんてこの業界では当たり前なんじゃないの?
特に大事なデータは 77T分か
俺の無臭ファイルは10Tしかないから、その8倍近くだもんな
俺だったら、ショックで勃ちなおれなくなるわ 77T分か
俺の無臭ファイルは10Tしかないから、その8倍近くだもんな
俺だったら、ショックで勃ちなおれなくなるわ あまり詳しくないがこういうのってバックアップ二重にしてたりするんじゃないの? >>1
本当に不具合なの?
中国韓国あたりが紛れ込ませたとかでなく? プリンタの会社の社員に運用を任せるほうがどうかしてる 謝らない・黙り込む・事故扱いにする
担当者をスケープゴートにする・何度も再発を繰り返す
そういう行為をしないだけある程度の理解はできるが…
前述行為コンプリートした銀行がこの世界にはあるらしいが本当だろうか
ここのは作業者が買収等されていないか身辺調査が必要な位の運用だが… >>1
これやった奴は間違いなくわざとだから捕まえて10年ぐらい自衛隊に拷問させないとだめだぞ 関数電卓良かったな。
メーカーだけでは食えないから大変だよな。
銀行とかにも下請けで入ってるの見かけるし。 77TBともなるとデータベースとかそのあたりな感じがするね。 京大ともあろうものが完全に
切り離した状態で保存してないのかよ
任せるほうも問題だわ >>1
元記事では
>日本ヒューレット・パッカードでは...
って書いてあるのに何で「日本HPでは...」に直してるの
日本ヒューレット・パッカードは日本HPE
Enterprise製品を扱う会社で今回やらかしたとこ
日本HPは株式会社日本HPで別の会社。PCとプリンタを扱う
別の会社
もとは同じ会社だけど2015年に分社した 複数並列バックアップシステムじゃねぇのかい・・・らしくねぇな >>36
富岳ベースで1大学用に縮小したのを入れればいいのに 消失したものの内容はなんだろ
エロ動画なら問題はないように思えるが > 深くお詫び申し上げます
え?お詫びだけ?
「ごめ〜ん。テヘッ♡」
ってやつ? >>85
フジフイルム「弊社にお任せを環境にも優しいですしお寿司」 これがコロナの薬開発だったら意図を疑わざるを得ないな
データの詳細は発表した? twitterで重いシェルの実行中にシェルを更新したとかなんとか スパコン扱うエンジニアのやるミスじゃないな
https://www.itmedia.co.jp/news/articles/2112/29/news040.html
ファイル消失が発生した原因
バックアッブスクリブトには、findコマンドにより10日以L古いログフアイルを削除する処理が含まれています。
スクリプトの機能改善と合わせて、findコマンドの削除処理に渡す変数名を視認性・可読性を高めるため変更いたしましたが、
この修正したスクリブトのリリース手順に考慮不足がありました。
bashは、シェルスクリプトの実行中に適時シェルスクリブトを読み込みます。
この挙動による副作用を認識できておらず、実行中のスクリプトが存在している状態でスクリブトの上書きにより
リリースしてしまったことで、途中から修正したシェルスクリブトの再読み込みが発生し、
結果的に未定義の変数を含むfindコマンドが実行されてしまいました。
この結果、本来のログディレクトリに保存されたフアイルの削除をする処理ではなく、/LARGE0のファイルを削除して
しまいました。 HPもいよいよダメか。
おれもいままでHPを使ってきたが最近のサポセンは事務的になって昔のような
丁寧さはなくなった。いまやあさらばを考えているところダニ。 ■ このスレッドは過去ログ倉庫に格納されています