サーバーダウンについて

メイン記事

こんばんは!
昨日の夜20時半ごろ、Youtubeでハンバーグの作り方を見ていて、
なんかコメントとか読み込めないし、変だな〜と思ってたら、
その後Youtubeが完全に見れなくなってしまいました。

後々分かったんですが、Googleの方がサーバーダウンしていたようで、
Youtubeやら、ポケモンGOやら、Googleのアカウントで動作するものは軒並み停止状態だったようです。

原因はアカウント関連だったようですね。

仕事でGmailとかスプレッドシートとか使ってる場合も非常に困ったと思います。
こういうときエンジニアは「あの天下のGoogleでも落ちるんだ」と騒ぐとか騒がないとか。

Youtubeの場合はアカウント情報無しやシークレットモードなら使えていたみたいですね。

シークレットモードはまた別記事で書きたいと思います!

その後22時前には復旧したようですが、
1時間という時間、みなさんなら長いと感じますか、短いと感じますか。

私自身は非常に長い時間だと思いました。
別にハンバーグ見れなくて当たってるわけではないです笑

だってGoogleですよ、どう考えても精鋭のエンジニアたちが働いているわけです。
その人たちでさえ1時間かかる障害なんてきっととんでもないんだろうなって。

とはいえ日本とは時差が約14時間あるので、仕事前だったかも知れませんが、、、。

てなわけで前もどこかで書いた気がしますが、
今日の題名であるサーバーダウンはなぜ起こるのかについて少し。

やっぱり一番の原因はアクセス過多です。

サーバーの役目はユーザーのリクエストに対してレスポンスをすることですが、
ユーザーが想定よりも多い場合、命令が滞ることでどんどん負荷増加し、やがて落ちてしまうわけですね。

サムネの503エラーはその時に表示されるエラーです。

そのほかにも、サーバー自体の故障であったり、自然災害などの場合もあるのですが、
データセンターにサーバーを設置したり、サーバーを複数台用意して予備システムを構築しておいたり
(冗長性を持たせると呼びます)対策は結構させています。

アクセス過多については以前オートスケールを紹介しましたね。

また、各サービスのサーバーがどんな状態なのかは、Downdetectorで確認することも出来ます。

障害の概況

てことで今日はサーバーダウンについての話でした!

爆発的にヒットしたサービスってそれが長続きすれば、大規模なサーバーを用意したり出来るんですが、
多くの場合人気って一時的ですよね、それも年々流行り廃りのサイクルが早くなっている気がします。

人間の性格から生まれたエラーと呼べなくもないんじゃないでしょうか。(何急に)

それではまた!

2020.12.15 ガオ

コメント

タイトルとURLをコピーしました