ダウンタイムが 1 分経過するごとに、企業は金銭、信頼、そして競争優位性を失います。Akamai では、四半期ごとの SLA クレジットではなく、お客様がビジネスクリティカルな業務を行う際に当社のプラットフォームを頼りにする場面で、自社の信頼における価値を評価しています。この信頼は、当社の 25 年以上にわたる優れた運用実績の歴史と、「他社がダウンしてもお客様をオンラインに保つ」という最も重要なことを実現するための妥協なき注力によって築かれています。
この記事を執筆している今、別のクラウドプロバイダーは四半期で 3 回目のサービス停止を経験しています。イノベーションが称賛されることは多いものの、顧客のミッションクリティカルなアプリケーションを担当する今日の IT チームは、信頼性の欠如がもたらす真のコストについて、またしても痛ましい教訓を学んでいます。
誰もが経験したことがあると思います。午前 2 時のエスカレーションコール。何日も続くシチュエーションルーム。経営陣への説明。これは単なる技術的な失敗ではなく、組織全体に波及するビジネス上の失敗です。
優れた運用の実現は容易ではないが、私たちの責任である
Chief Operating Officer として、私は Akamai がいかにして優れた運用の実現を維持できるかに日々注力しています。私たちの目標はシンプルでありながら、野心的です。「プラットフォームをダウンさせないこと」。これは、ハードウェアの障害やソフトウェアの更新から、セキュリティインフラで日々防いでいる、巧妙化するサイバー攻撃まで、あらゆる事象を対象としています。現在、Akamai のプラットフォームは当社最大の収益源であり、世界で最も標的にされやすい企業からも信頼されています。
このレベルの信頼性を実現するためには、冗長性だけでは不十分です。プラットフォームのアーキテクチャと運用に対する根本的に異なるアプローチが必要です。メタデータの更新、ソフトウェアの展開、設定変更のすべては、カスケード障害を防ぐことを目的として設計された段階的なロールアウトと高度なテストプロトコルを経て実施されます。
Akamai は、数分ではなく数ミリ秒で問題を検知して隔離する自動化システムに多額の投資を行ってきました。また、Akamai のエンジニアは、数十年にわたるインターネット級の規模での運用に基づいて防御メカニズムを構築してきました。
クラウドテクノロジー担当 CTO の James Kretchmar は、ITPro の Rory Bathgate 氏との対談で、Akamai がいかにしてこの信頼性を実現しているかについて技術的な詳細を共有しました。当社のアップタイムの背後にあるエンジニアリング哲学に関心のある方は、今年の運用上の課題から得た実務上の知見と教訓、それをプラットフォームの改善にどう転換したかをまとめた教訓からの学びに関する Kretchmar の投稿をご覧ください。
テクノロジーの進化に伴い信頼性が重要に。しかも、その差は縮まるどころか広がっている
市場は大きく 2 つに分かれつつあります。1 つは、スケーリングと安定性を定義するコアプラットフォーム、もう 1 つは信頼性を軽視するプラットフォームです。
コアプラットフォームは、信頼性をビジネスモデルに不可欠な要素と捉え、予測可能なパフォーマンス、セキュリティ、信頼性を確保しながら、イノベーションを着実に推進することに重点を置いています。
一方で、他のプラットフォームは、迅速なイノベーションや継続的な展開を売りにして常に関心をもってもらうことに注力するあまり、信頼性の優先度を低く扱っています。
これが、サービス停止を避けられなくし、しかも頻繁に発生させてしまう慣例です。
一部の企業は、より安価なクラウドサービスと引き換えに四半期ごとの停止を受け入れていますが、そのようなことを受け入れるべきではありません。大手オンライン企業にとって、四半期ごとに 1 時間分の収益を失うことは、単なる技術的負債にとどまらず、競争上の不利を受け入れることにもなります。顧客体験が市場の勝敗を決める時代において、信頼性には妥協の余地がありません。
世界で最も要求の厳しい企業が Akamai を信頼する理由
大手銀行は Akamai のプラットフォームを通じて数十億ドルの資金を処理します。取引の失敗は許されないからです。ピーク時のトラフィックに最も重要なことは信頼性であるため、世界の小売企業は、Akamai のインフラを基盤にブラックフライデーとサイバーマンデーの営業を行います。メディア企業は、Akamai のプラットフォームを活用して世界中の視聴者が見守る大規模イベントを配信します。バッファリングは容認できないからです。このような組織には、ビジネスの成功と歩調を合わせられるパートナーが必要です。
Akamai とお客様の最も強固な関係は、当社チームが協力して複雑な課題を解決する重要な瞬間に築かれます。Akamai の技術者がお客様のビジネスをオンラインに保つため何日もブリッジコールに待機している姿をご覧になった時、当社のプラットフォームが巨大な DDoS 攻撃を怯みなく吸収する様子を目撃された時、そして実際の緊急事態において当社の「お客様第一」の姿勢を実感された時。その瞬間に、信頼がパートナーシップへと変わるのです。
ビジネスは約束ではなく、プラットフォーム上で動く
完璧なアップタイムは存在しません。そのように謳うベンダーは、事実とは異なる売り文句を使っています。しかし、「ほぼ完璧」と「標準的」の間の距離は、数百万ドルの収益損失、数千の顧客の不満、そして計り知れないブランドへのダメージに反映されます。
Akamai は、信頼性の最適化を優先することを選びました。それが、より困難で、コストが高く、複雑であってもです。なぜなら、ビジネスは約束ではなく、常に稼働するプラットフォームの上で動くからです。
サイバー脅威は 1 時間ごとに進化し、顧客の期待は高まる一方であるため、AI ワークロードにはリアルタイム推論が必要です。この現実において、信頼性とはアップタイムだけではありません。お客様が優れた運用実現することを自らの責任として扱うパートナーを持つことです。
信頼性を妥協してはいけません。ビジネスは、信頼性に左右されるのですから。
タグ