【IT】Oracle DBのバグでファイル破損、大阪市がシステム障害の原因を初公表
■ このスレッドは過去ログ倉庫に格納されています
大阪市は2019年6月24日、6月7日から翌8日にかけて発生した基幹系システムの障害について、原因を特定したと明らかにした。米オラクル(Oracle)のデータベース(DB)ソフト「Oracle Database」のバグが原因だった。
システム障害を起こしたのは基幹系システム「大阪市統合基盤システム」である。2015年1月に運用を開始し、住民票や税務、国民健康保険、福祉、介護保険など市民向けサービスを提供している。
同システムのOracle Databaseはログイン時の認証に必要なデータや印刷履歴などを管理している。今回の障害により、区役所や出張所などで住民票などの発行ができなくなり、7994件の発行業務に影響が出た。
同システムで2019年6月7日の午後0時5分ごろに発生したシステム障害では、2ノードあるDBサーバーがほぼ同時に停止した。担当者が再起動を試みたが再起動できなかった。
この原因について大阪市ICT戦略室は「Oracle Databaseには(データを格納するストレージとDBサーバーをつなぐ)通信経路で伝送エラーが生じた際、システムファイルが破損するバグが存在していた」と明かす。システム開発を担当したNTTデータ関西を介して「日本オラクルにバグの存在を確認した」(ICT戦略室)。
今回のトラブルでは「停止したDBサーバーの再起動」「ハードウエアの交換」「システムファイルの修復」の順で復旧を試みたがいずれも復旧に至らなかった。そこでバックアップファイルからDBそのものを復元する手法に切り替えて、障害発生から約21時間後の6月8日午前9時30分ごろに復旧を完了し、同日午前10時から業務を再開した。
この先は有料会員の登録が必要です。
https://tech.nikkeibp.co.jp/atcl/nxt/column/18/00001/02456/ バグ(笑)
やっぱりアメリカ製はダメだな
日本企業が作れば世界最高品質になるはず
ソニーとか >>1
}l 'ヾミミヽ rz彡‐`ヽ |::fYj
{| 、_tッ、,゙ ' r' rtッ_‐ァ' |::}}!
゙l `ー 'ノ !、`ー ' |::リノ さすが天下のOracle様
Javaだけじゃなく本家のDBまで腐ってきた }l 'ヾミミヽ rz彡‐`ヽ |::fYj
{| 、_tッ、,゙ ' r' rtッ_‐ァ' |::}}!
゙l `ー 'ノ !、`ー ' |::リノ バカ高いけど安定してるから使われてたoracleなのに
バグあるんじゃ高い金払う意味ないじゃん linuxの上でmysqlが動いてるのとは訳違うのか?
ファイルサーバーとのネットワークに障害出ると、システム破壊すると読めるんだが 嘘くせぇな
Oracleのバグなら、もっと多くのところでこの現象が起きてると思うんだけど・・・
NTTデータ関西が怪しい >通信経路で伝送エラーが生じた際、システムファイルが破損するバグが存在していた」
これWindowsのバクだろ 性能はともかく故障の少なさはSQLServerの方が上だな。 >>19
?
どうしてWindowsだと決めつける?
Linuxって知ってる?
Solarisは……いやこれは忘れろ 冗長化システムで冗長化のバグが悪さをして
両系統のデータが吹っ飛ぶって昔ながらの伝統芸だよね なんで税金使ってオラクル???
Postgreじゃダメなのはなぜ??? >2ノードあるDBサーバーがほぼ同時に停止した。
ギャーw 456:名無しさん@12周年 :2011/11/17(木) 10:06:30.17 ID:IDY0yViL0
テレビで大阪市の天下り企業の話がでたけどすごすぎてわらた。
従業員100人のうち48人が役員で、平均年俸2000万だと。
どんな会社だよ。
独裁でも何でもいいから一回ぶっ壊してくれ バグってことでオラクルのせいにしてるけど修正パッチ当ててなかっただけだろ
オラクルなんてもっとトラフィックの多い金融系でもバンバン使ってるのに
大阪市でだけ起きたってのが怪しい
オラクルのバグには違いないけどオラクルとしてはとっくに対応してるから
大阪市以外じゃ起きてない
そう考えるのがプロ むかし読んだSF小説で
「すべてがコンピューター化された未来の国を崩壊させたのは1匹の虫だった」
ってのがあったけど、現実にそうなりそうだな Oracleはクラウドで出遅れ
オンプレミスもシェア低下で完全に落ち目なのに
強みであるはずの信頼性にまでケチがつくとは
まさに「泣きっ面に蜂」だな 大阪市っていうだけで役人が何かミスしてそうに思える
坊主憎けりゃなイメージで話してる部分もあるけど、
聡明な印象は少なくとも大阪人にはない >通信経路で伝送エラーが生じた際、システムファイルが破損するバグが存在していた
バグなのか?
全くリトライしなかったとかならともかく、
通信路切れてちゃファイル読めないのは当然。
どこかで諦める必要もあるだろう。
程度によるな。 Oracle様から信頼性をとったら何も残らないんだけど。。 いやーこれ本当にバグか
フロント側に問題があるとしか思えないんだが
またはバッチあてていないとか
DB側の不具合でシステムファイルが破損するってどうよ 大阪市「オラクルのバグでした!(とっくに修正パッチでててんけど当ててなかったのは黙っとこう)」 このバグは、他国で報告されてるの?
大阪市が世界で始めて遭遇した不都合だったりしたらちょっと… >>40
なぜそうとしか思えない?
しかもバッチってなに?
パッチのこと? ボラクルはクソ
クラウドやたらすすめてくるがあれは本当にクソだからな >経路で伝送エラーが生じた際、システムファイルが破損するバグが存在していた
NTTの作ったシステムに伝送エラー(バグ)があって壊れたんだろう
ホームラン級のバカが作ったんだろうね >通信経路で伝送エラーが生じた際、システムファイルが破損するバグが存在していた
システムファイルって何だ?
制御ファイル?
動的パラメーターファイル?
System表領域?
SysAux表領域? DBの復元で治ったってことは、SQL文を書き間違えて全部削除しちゃったんじゃねーの オラクルのバグでも損害賠償とか一切応じないんだろうな。 Oracleはぼったくり
パッチ当てるのですら高額請求
セキュリティ・ホールはお前らのミスじゃん >>18
オラクルとNTTデータと大阪市
信用できない順で大阪市、NTTデータ、オラクルだわな この手のシステム管理を行政が自部でやることはないよ
金を払うの行政だけど、やるのは委託業者、今回の元受けはNTTデータじゃないの >>30
その可能性も全く捨てきれないよな
なんかいかにもオラクルが悪いみたいに書いてあるけどさ
実際悪いんだけど この手のシステム管理を行政が自部でやることはないよ
金を払うの行政だけど、やるのは委託業者、今回の元受けはNTTデータじゃないの オラクルのバグって誰が責任取るん?元請けの業者かね。 Oracleはバージョンアップやアップデートでチョイチョイやらかすなぁ。
しかも対応が遅い。責任逃ればっかりやってる。 オラクルの新製品を使ったシステムの開発中にバグを見つける事はあるけど
4年も本運用してての発覚って珍しいな 商用のものは例外処理がものちょっと真似できないレベルなのに
今回はクリティカルなバグ引いたなw
オラクル「バグはどこにでも潜む隣人である。いままでも、そしてこれからも」 外国企業って公式ホームページでこういう話を報道してくれないよな >>16
インストールしたdbのシステムファイルが破損したんじゃね この前偶然オラクル本社の前を歩いたけど
やたら遠くからでも目立つ看板w システムファイルの破損で、
システムファイルの修復を試みても治らないという事実。 他のユーザーでは問題が出てないのに大阪市だけで問題が起こるのはなぜ? >>16
ストレージとのFibre Channelでのネットワークだと思うよ なぜホストコンピューターにしねえんだ
UNIXサーバーなんてクソに決まってんだろ 共有Oracleホームの障害らしいので
大阪市のサイトの時系列からこんな感じと推測
1.共通部の共有Oracleホームの破損?でDB全停
2.ハードウェア交換したがハードウェア障害ではないので復旧せず
3.制御ファイルのリカバリだけでは復旧せず
4.Oracleを再インストールしバックアップからリストア・リカバリで復旧
共有Oracleホーム
ttps://www.oracle.com/technetwork/jp/content/oh-rac-1-133511-ja.pdf
しれっとゴールデンゲートを売り込みに来るパターンだなw チョンウイルに感染したんじゃね
G20期間中にもやらかしそうな大阪市
市長公用車は禁煙した? >>40
あのオラクルがバグだと認めてるんだからバグだろう
既存バグに対してパッチ当ててない可能性は大いにあるけどな >>72
DBの再起動、ハードウエアの交換、システムファイルの修復、DBリストアとやってたらこんなもんだろう
おそらく原因もわかってない状態での作業だと思うし >>68
パッチ当ててないから
それを理由にすると公務員様の経歴に傷がつくから仕方なくオラクルが悪役買って出て恩を売った…とかかな >>82
パッチ当てるのは大阪市の責任なの?保守も含めてベンダーが責任を持つのが普通じゃないの? >>83
それは保守契約によるから何とも言えんが、公務員は変なところでケチだったりするから、パッチ当ては範囲外だったりしてもおかしくない
そしてそれが原因でいざ問題発生すると業者呼んで大騒ぎw >>83
あなたには前提知識が欠落しているようなので、話に加わらない方がいいと思います
話に加わりたい気持ちは分かるけど あー、これとは別でORACLEのデータファイルが0バイトになったことあるわ。 そもそもバグを出しているのは欠陥だから無償でサポートするべきなんだけどね。 >>30
お前がDB管理の実戦経験が無いのは分かった。 >>1
> この原因について大阪市ICT戦略室は「Oracle Databaseには(データを格納するストレージとDBサーバーをつなぐ)通信経路で伝送エラーが生じた際、システムファイルが破損するバグが存在していた」と明かす。
これだけを読むとオラクルは悪くないように見えるけどな。
ディスク装置にどこのメーカー使ってるか知らんがディスク装置とサーバーの通信失敗した場合、OS側に書き込み失敗した旨を伝えるのはディスク装置側の仕事やろ。
OS上で動いてるオラクルからしたら知ったこっちゃないわな。
まさかRAWで作ってんのか?w今時そんなわけないよな。 導入コストも維持コストも異常に高くなぜか数年に一度唐突に値上げするけどろくに保守もバグも直さない
ぼったくりで有名なオラクルさん うーむ
この文章じゃ
意味ワカラン
想像の世界だわ プログラムにはバクが残るのである程度は仕方ないが
オラクルのバクでとしっかり書いてるからには
理由ははっきりしていて致命的なのがあったんだろうか オラクルがバグを認めたなら、そりゃニュースになるな。 >>89
Oracle はハードも売ってるからね。ExaData のハード障害ってことなんじゃね? オラクルから『いや、使い方が悪かっただけ』っていわれんじゃない? >>89
システムファイルはDBサーバー側だろJK あんだけクソ高いライセンス料払ってこのザマとは…
Accessでも使ってろw ん? システムファイルをミラーリングしてたのか?
https://it.srad.jp/story/19/06/12/1441216/
それを Oracle 側のせいにするのは……
うーん…… バックアップとかミラーリングで失敗したのか
まあ通信失敗で壊れるようなんも設計上クソだろうが ファイル破損で起動できず、よくある話
復旧手順の見直しをしたほうがいいね >>14
最近の金融はDB2に移行したところが多い >住民票や税務、国民健康保険、福祉、介護保険など市民向けサービスを提供している。
今後、大阪だけこーゆー重要なものは中華に預けろ >>13
グループ企業のシステム作るときにアレだけは使わないでくれと注文入れられたわw 大企業でもサポート切れてる古いバージョンそのまま使ってるとこなんて珍しくないぞ やっぱsqlserverだな
しかもオラクルより安上がり うーんこれはオラクルのバグじゃないだろ
データ転送中に未知の通信エラーが発生
データファイルがぶっ壊れたならわかるけど、何故にシステムファイルを書き換えてしまうの?
メモリ破損させてしまって、書き込み先ファイルがどっか別物になってしまって、たまたまシステムファイルがぶっ壊れたってこと?
最初ハードウェアのバグかと思ったけど、やっぱオラクルの通信周りのバグっぽいわ >>120
顧客がクソ高い費用を払ってくれさえすれば Oracle DB が一番優れてるからなぁ >>1の内容がザックリすぎて何があったのかよくわからんな…
OracleをRAC構成にする意図としては大きく
・負荷分散
・1台のサーバーが障害になってもサービスを止めない
がある
RACの両系同時ダウンと聞けば、何があったのか気になる人や企業は多いはず
せめて既知の問題か否か(修正パッチ公開済の問題か否か)は早急にアナウンスして欲しい >>115
AWSもOracleDBに対応してるんだよなぁ Oracleは保守契約をしていないとパッチどころか不具合情報すら出てこないし、
保守契約していても〜というバグがあるという事を口にすることすら出来なかったよな。
だからバックヤードにOracle使ってて問題が起きてもお客さんに詳しい説明ができないって
なんやねん? みたいな…。 そんなバグあるのか?
冗長化しててDB1が空になったからDB2も了解空にします。
みたいな?
ダメダメでエラーも公開してないから最近作ってないがこれは考えにくい? 修正パッチ出てたらしいけど稼働中システムに対して手軽に当てられるもんなのか? エラー起こしたファイル上書きしたってことだろう
それで同期とってたバックアップもそのままエラー感知せずにそのままダウンした 今どきシステムをオンプレで組むなよw
DCが国内に有りゃ良いんだろ?
無駄な金使うな。
だいたい、日本の商習慣がITを滅ぼしたんだよ。
日本の発注者は「機能」や「性能」「品質」に金を払わず、
ハードやソフトなどのモノと人足仕事の役務にだけ金を払う土人だ。 おいおい、オラクルの許可なくOracleの悪口言ってええんか? >>128
ユーザに Oracle バグの詳しい説明する必要なんかないだろ?
どうせ理解てきないし >>139
報告書に書くから詳しく教えろという話は普通にあるよ
理解出来ずに嘘説明して拗れることはザラだがw 通信経路の不具合って
特定できたってことは
エクサかなあ 大阪だけに,維新がメンテの予算を削ってたのだろうな 主系がトラブル起こって副系にフェイルオーバーしてもトラブル起こったままとか
よくあることで珍しくも無い >>144
オレもそう思う
多様な環境だと、こんなカタチで特定して発表なんぞしづらいよな でも欠陥だと認めないのがIT屋、んで使い方が悪いとか逆ギレしだす。 Oracleはクソというと、Oracleから守秘義務違反で訴えられるぞ ますますOracle離れが加速するな
DBだけが売りだというのに これ他の自治体や企業はどうなのかね
ふわっとした原因を聞く限りではしょっちゅう起こりそうだか >>62
特殊なタイミングだけで起きるケースはママある。
ただ、こういうケースは原因追求は難しい。 >>154
いまはLinux版のSQL Serverもあって
性能測ったらWindows版よりむしろ性能良かった
って話を先日やってたRedhatのイベントで中の人が言ってた >>158
元になってるSYBASEがunix用のデータベースだったからw 文系のIT土方が作ったプログラムの品質はどこでもそんなもん >>16
NASやSANと呼ばれるネットワークストレージ。 DBなんて、バグを前提にシステムを組むんではないのか?
SIerが責任をなすり付けているようにしか思えん。 >>163
文系理系という区分はアメリカには無いのでなんとも。 >>89
oracleというか旧sunのストレージなら昔エライ目にあったことがある
あいつら冗長化というものを理解してない
ストレージのコントローラのロジックがおかしい 大阪都構想って、在日特区と言うわけにはいかないから都構想とよんでるんやで?
分かってないやろ?www
憲法改正がやりたいならば
言うことを聞けと言う
バーターで呑まされるのは
統治機構改革という道州制
問題は条例制定で
現行の法律が上書きされる権利を
寄越せと言ってること
沖縄独立だとか
北海道独立だとか
皇統は国民の総意でだとか
調子こいてるが維新は基本的に反日政党 >>153
大国町のブラック風俗は摘発して少しだけクリーンになったぞ お疲れ様だろ。エンジニアは生きた心地しなかったろうな > 二宮町は栃木県にある人口約1万7000人の町。二宮尊徳ゆかりの町名と「いちご産出量日本一」で知られる。
>同町は,町役場の事務用パソコンのすべて,約140台をLinuxに入れ替えるという前代未聞の挑戦を行っている。
>OSをLinuxにするだけでなく,オープンソースのOpenOffice.orgやFirefox,Thunderbirdでワープロ,Web,メール
>による業務を行う。記者の知る限り,日本で例のない試みだ。
https://tech.nikkeibp.co.jp/it/article/OPINION/20060428/236610/ph5.jpg
https://tech.nikkeibp.co.jp/it/article/OPINION/20060428/236610/
2006年の記事、今どうなってるかは知らない。 商用UNIXがほぼ滅んでしまって
いまはサーバーOSはLinuxかWindowsかの2択だよ 伝送エラー?
LANケーブルのカシメが甘かったんだろ }l 'ヾミミヽ rz彡‐`ヽ |::fYj
{| 、_tッ、,゙ ' r' rtッ_‐ァ' |::}}! 私は存在がバグだ
゙l `ー 'ノ !、`ー ' |::リノ >>165
じゃあ>>160はおかしいのか
作ったのアメ公だから文系の土方ではないってことだし さて、そろそろ「ユーザーが悪い」の大合唱が始まるかな? G20や万博の大事な予算案に、共産党と維新は反対しましたよね?
共産党と組んでるのは維新ですよネ〜!
沖縄浦添市長選挙で、翁長知事と共産、維新が連携しましたよね?
安全保障関連法案に、維新は反対しましたよネ?
尖閣諸島を守る決議案に、共産党と維新は反対しましたよネ? https://t.co/Ete3SC9JDs 👀
Rock54: Caution(BBR-MD5:b73a9cd27f0065c395082e3925dacf01) >>183
Redhatを買収したIBMは今や最大の商用Linuxベンダー
既存ユーザー既存システムの更改の為にAIXはまだ残すとは思うけど、積極的な開発や販売はしないと思う >>186
いや
IBMにとってAIXはまだまだ主流
なんせハードからアプリまでIBMになるから
価格が高いが信頼性も高い でもクラウドはボロ負けで海の向こうではリストラ始まってるってさw }l 'ヾミミヽ rz彡‐`ヽ |::fYj
{| 、_tッ、,゙ ' r' rtッ_‐ァ' |::}}!
゙l `ー 'ノ !、`ー ' |::リノバグを売る お前らオラクルタイマー知らねぇだろ。5,6年すると突然自慰行為を始める現象。 >>191 起動して250日ぐらいでClientアプリがつながらなくなるバグとかやられたわ。 オラクルは曖昧さがあるから書きやすいけど、バグ出しやすいとかなんとか。
sqlは書く量が多いけどしっかり動作するとかなんとか >>189
オラクルは確実なエビデンス出さないとバグとは認めないので有名 >>158
今それ使ってるw
もともとwindows上で動いてたSQLserverをLinuxに移してくれって言われてどうしようかと思ったら、
Linux版のSQLserverがあるのを知って飛びついた次第。データの移行も問題なしだったよ。 >>201
お前は日本ペイントインダストリアルコーティングスに転職しろ >>199
しかも担当者がやる気出しても「何かあったら責任とれるのか」的なことを言われて潰されるからね
相応の金もらう訳でもないのに外注したのと同じ責任負わされるなら割に合わないから誰もやらなくなる >>189
そんな気がする
大阪市がバグだと言ってるだけで
NTTデータもOracleもバグと認めてないし > NTTデータ関西の保守担当者はDBMSが停止している事態を把握し再起動を試みた。
>しかし2ノードとも再起動できない状態が続いた。このためNTTデータ関西は日本
>オラクルなどと連絡を取りつつ原因究明を開始。その結果、午後3時30分頃にDBMS
>のシステムファイルが破損している事実を特定した。
> 破損していたシステムファイルはOracle RACを構成する各ノードがそれぞれの
>死活状況を共有ストレージに書き込む「投票ディスク」である。この内容が異常な
>データになっていたという。「投票ディスクを参照した2つのノードが共に異常を
>検知して、それぞれ自身でDBMSとしての機能を停止させた」(大阪市ICT戦略室)。
>保守担当者が再起動を試みてもできなかったのは、各ノードが再起動の過程で投票
>ディスクの内容を参照するようになっていたからだ。投票ディスクの異常値を検知
>して停止してしまった。
https://tech.nikkeibp.co.jp/atcl/nxt/mag/nc/18/020600011/070200035/
システムバグ以外でこういうものが壊されるのかな? >>205
ネットワークスイッチでデータ壊して送ってきたらしい
上位レイヤレベルでなんかしらのチェックデジットでも入っていれば
データ破損の判別もできるかもしれないけれど
投票DBへのデータを複雑にするのも設計としてどうかと思うし
このケースはバックアップから戻すで正解じゃないかな メチャクチャ信頼性のないシステムだな
そんな設計をNTTデータがやったのかよ 両系統DBが同時にぶっ壊れてハードウェア被疑の判断はありうるのか? >>208
ロットが同じだと同時に壊れたりというのはよくある。 DataGuardまで入れなかったデータの提案力不足だよね。
というか今時なら仮想化基盤で冗長化した方が安心だよね。
下手にActive-ActiveXでクラスタ組むより。 >>210
意味がないことはない。
外れロット引かなけりゃいいだけなので。 天才を呼びたいんだろう
ソフトとか数学とかは天才が圧倒的に牽引する分野だからなあ >>213
4年たってるんだから、外れでなくても壊れだす 流石にそういう壊れ方したら保守契約している意味が無いのでは? >>212
ライセンス量がべらぼうになるからOracleで仮想化は無理だろ
vSphereHAはクラッシュリカバリーだし ■ このスレッドは過去ログ倉庫に格納されています