いくらなんでもこれはない

大規模障害の概要と原因について(中間報告)

 

概要:ファーストサーバというサーバ屋で大規模な障害が発生して、ユーザのデータがすべて吹き飛びました。どうしようもないので復旧できません。終わり。

 

いや、障害が起こったことが「ない」わけじゃない。そりゃー障害なんて起こらないほうがいいに決まってるけど、人為的なミスはどうしたって発生するわけで。

 

なにが問題かっていうと、この「バックアップ」という言葉の使い方。

 

引用すると、

>>

脆弱性対策のためのメンテナンスはバックアップをしてあるシステムについても実施しておかないと、メンテナンス実施後にハードウェア障害が発生してバックアップに切り替えた途端に脆弱性対策が講じられていないシステムに戻ってしまうことが過去に発生し

<<<

ここでいう「バックアップ」っていうのは一般的に「待機系サーバ」と言われるものを指している。ちょっとだけ説明すると、安定的な稼動が求められるシステムってのは「待機系サーバ」と呼ばれる「普段は何もしていないサーバ」を準備しとくんです。

 

なんでかっていうと、もしいつも稼動しているサーバ(正常系サーバとも言うかな)で何らかの問題が発生して、よしんばダウンしてしまったとしても、待機系サーバに切り替えることによってシステムは継続的に利用することができるから。ある程度以上のシステムでは、大抵これが採用されてます。

 

でまあ、それはいい。問題は「待機系サーバ」を「バックアップ」と呼称していたこと。これは言葉の問題じゃないですよ。

 

普通、「バックアップ」はディスクのクラッシュとかがあって、データが失われた場合に復元させるための退避されたデータのこと。つまり一般的に考えりゃ、「バックアップ」と「待機系サーバ」はイコールで結び付きません。

 

でも、ファーストサーバでは「待機系サーバ」を「バックアップ」と呼んでいたんじゃないのか。これはハッキリ言って相当怪しい。多分有り得ないと思います。

 

その理由はこれ

>>>

誠に心苦しい次第ではございますが、お客様で取得されておられるバックアップデータによる再構築を行っていただきますようお願い申し上げます。

<<<

ほら。ここでの「バックアップ」は一般的な「退避されたデータ」という意味でしょ?つまり「分かって」て、「待機系サーバ」を「バックアップ」と呼んで説明したんですよ。

 

じゃあなんで、ファーストサーバは「バックアップ」という言葉にコダワッタのか。

それがこれ

 

画像の左下にご注目。「データのバックアップ・レストア(復元)」はファーストサーバの管理領域になってます。つまり、バックアップはファーストサーバがやるべきことだったわけです。

 

が、しかし、やってなかった、と。

ハッキリ言ってこれ、詐欺だよな。

 

この話、ネット界隈では「自分でバックアップしよう」と言う話でまとめているひとが多いけど、FTP経由で自分がアップロードするファイルならともかく、DBのデータとかはユーザがバックアップを取れる環境だったのか、それをちゃんと検証しないといくらなんでも自己責任論は横暴すぎると思います。

 

多分普通の人よりはその辺りの知識はあるオレでも、あの画像で説明をされたら「ああ、バックアップも取ってくれるんやー」と思いますし、まさか「バックアップとは待機系サーバのことでした」とは思いつきもしません。

 

まあなんしか、この親会社も含め、こういう詐欺っぽい手口は後を絶ちませんな。

で、孫さん、これ、どーすんの?