サーバー不具合に英語で戦った話
こんにちは、masaです。
毎日更新したいと思いつつ、ずいぶん日が空いてしまいました。
この間、今年から契約したサーバー会社が大きなトラブルを起こしていて、
ブログにアクセスできない状況がかなり長い時間ありまして、
ご迷惑をおかけしたかも知れません。どうもすいませんでした。
今から1週間ほど前のある朝、
突然ブログにアクセスできなくなりました。
原因についてはMySQLの障害としか聞いていないのですが、
そこから長い闘いの始まりでした。
サーバー会社のサポートへは最初電話をして、
ツイッターで一度メンションを送ったところ、
その後の主なやり取りは、「ツイッターのメッセージ」
になっていました。
おそらく、日本の大手サーバー会社であれば、
「トラブルで24時間以上サーバーにアクセスできなくなる」
なんてことはほとんどないんじゃないかと思いますが、
そのサーバー会社が悪いのか、オーストラリアだからなのか、
どちらなのかは分かりませんが、回復までにはずいぶん長期間
かかりました。
その間ダメになり、回復してはまたダメになり、ということを
何度も繰り返され、余計にストレスでした。
サーバー会社のサポート担当はエンジニアではないので、
こちらからのクレームをエンジニアに伝えることしか出来ないようでした。
なので、こちらから問い合わせた内容についてもエンジニアからの連絡が
なければひたすら
「まだエンジニアからの返答がないから待ってくれ」
と言うだけでした。
今回のサーバートラブルについては、こちらには全く落ち度はなく、
私は100%被害者でした。
最初はDBを全て吹っ飛ばされ、WordPressを使っていたブログ
へのアクセスが全て出来なくなりました
コントロールパネルを見てみても全てのDBがサイズゼロになっています。
この時点で自分で取得していた前日のバックアップはあったのですが、
前日のバックアップ以降にいくつか下書きを追加していました。
サポートによると「DBが消えた直前のバックアップがある」
ということだったので、その下書きが回復できることを祈り、
サーバー会社側での回復を待っていました。
ところが、回復されたのは直前どころか、消えた5日ほど前の
バックアップで、公開済みの記事までもが消えてしまった状態に
なってしまいました。
その後連絡を待てどもなかなか回復しません。
公開済みの記事へのアクセスも出来ない状態が続いてしまうので、、
私が手作業で新しくDBを作成し、自分で取得していた前日の
バックアップから復元を行い、サイトを回復させました。
そして、「このDBに2度と触るな」と伝えました。
その後しばらく経って、またアクセスするとDBエラーが
表示されるようになりました。
今度は「何をしたのか」と強い調子で言ったところ、
バックアップからの復元をしたところ、エラーになっていると
言ってきました。
こちらから「触るな」と伝えたにも関わらず勝手に
本番環境を更新するなんて、何を考えているか分かりません。
「一刻も早く作業前の状態に戻せ」
といったのですが、このときも
「エンジニアには伝えた」
としかフィードバックが戻ってこないので、
私が手作業で設定ファイルを修正して、回復させました。
このときもサポート担当には再び「2度とDBに触るな」
といったのですが、その翌日、今度は、
サーバーごとDBのアップデートを始めました
そもそもサーバーに不具合があったことで
DBが全部飛んでしまったのかもしれません。
それは修復してもらったほうがいいのは分かっているのですが、
このサーバーの更新でまた12時間程度
アクセスできない状態が続きました。
このバタバタが終わり、全てが回復したのは昨日の夜でした。
最初のトラブルから丸7日ほど経ってました。
この間私がツイッター経由で送ったメッセージ
総数112。
(もちろん、全て英語で)
すこし英語で文句を言うのに慣れたかもしれません。
でも、もう引っ越します。
さすがにウンザリです。