Innovation and Monitoring


Innovation and Monitoring


「オープンソースの製品や他の商用製品とあわせて検討しましたが、ライセンスも含めたTCO(総保有コスト)はPandoraがもっともよいと判断しました。実際、監視項目の増加に伴うシステムの増強を抑制でき、コストが既存のシステ ムに対し40%程度削減されました。」
根本 良雅 氏 グループシェアードサービス開発・運用部 グループインフラ構築・運用課 マネージャ
会社概要
なぜ、Pandora FMS のような監視システムが必要なのか?
楽天株式会社のインターネット・サービスは、だれでも、いつでも、どこからでも、利用できるサービスである。会員数が7,360万人(2011年9月現在)を超える巨大なインターネット・サービスを低コストで最適に運用するため、Pandora FMS Enterprise を採用。今後のサービス拡張に柔軟に対応する統合監視フレームワークを構築した。
背景: 「世界一のインターネット・サービス企業」を目指し、国内最大のインターネットショピングモール「楽天市場」に代表されるEC事業や、「楽天トラベル」のトラベル事業、「Infoseek」等のポータル・メディア事業、「楽天証券」、「楽天カード」等の金融事業、さらにはプロ野球球団「東北楽天ゴールデンイーグルス」の運営及び関連商品の企画・販売を手掛けるプロスポーツ事業に至るまで幅広い事業を展開する楽天株式会社(以下、楽天)。7,360万人(2011年9月現在)を超える楽天会員に様々なインターネット・サービスを提供することで、あらゆるサービスをインターネット上にてワンストップで利用できる”楽天経済圏”を確立している。
“国内最大級のインターネット・サービスを展開する楽天
Pandora FMS Enterpriseにより高信頼、低コストの共有監視基盤を構築”
“国内最大級のインターネット・サービスを展開する楽天 Pandora FMS Enterpriseにより高信頼、低コストの共有監視基盤を構築した”
楽天に高いサービスレベルが求められることはいうまでもない。たとえば、楽天市場だけでも、約37,000の店舗、8,800万点を越す商品登録数(2011年12月現在)の大規模サービスだ。
これらのサービスの稼働環境について、共有インフラ構築・運用グループ マネージャの根本 良雅氏は次のように語る。
「お客様に常に最適なサービスレベルで提供できるよう、楽天の提供するサービスは数千台のサーバからなる強力な共有システム基盤の上で稼働しています。共有システム基盤は柔軟性と堅牢性、そして最適なパフォーマンスが確立さていますので、サービスがダウンするようなことはありません。これによって、お客様が安心してサービスを利用することができるのです」
課題
安定したサービスの提供には、強力なシステム基盤だけではなく、障害の発生にも迅速に対応できるシステムの運用体制が不可欠だ。楽天では強力な統合監視フレームワークを2001年5月に構築。以降、最適な運用を行っている。統合監視フレームワークは楽天が提供する数多くのサービスを網羅しており、それぞれの職責に応じたサービスおよび項目の監視をオペレータに提供し、不測の事態におけるワークフローを備えている。万が一サーバがダウンしたとしても、すぐに適切な対応を取ることができる。
既存の監視システムで行っているのは主に死活監視であるが、監視対象や監視項目の数は新しいサービスが加わるたびに増加する。これまでの運用においては毎年20~30%程度増加し、現状で1万を超える。しかし、サービスの追加はとどまることはなく、さらに現在進められている共通システム基盤の仮想化やクラウド化に伴って、その数がこれまで以上に増加することも見込まれていた。もはやコストの増大は大きな経営課題へと発展しており、事業規模の拡大にも低コストで対応するための新しい仕組みが求められたのである。このような経緯により、10年以上使い続けた監視システムの刷新が検討された。
“安定したサービスを提供するには、強力なシステムインフラストラクチャと、障害に迅速に対応できるシステムの運用の両方が必要です。” / 竹田 茂馬 氏 共有インフラ構築・運用グループ
システムの刷新にあたり、注力された評価ポイント
導入および運用コスト
データ移行の容易性
冗長構成の可否
設定済みの監視項目を含めた既存環境の運用プロセスの継続」
今後追加する監視項目の適用
コスト削減はもちろんのこと、監視基盤の必須条件としての冗長構成、既存環境の監視内容を容易に引き継げることでのオペレータの負荷軽減が必要だった。
ツールの評価
Pandora採用の決め手は、すべての要件で他社製品より優れていたことだという。
根本氏はコスト削減効果を高く評価する。
「オープンソースの製品や他の商用製品とあわせて検討しましたが、ライセンスも含めたTCO(総保有コスト)はPandoraがもっともよいと判断しました。実際、監視項目の増加に伴うシステムの増強を抑制でき、コストが既存のシステムに対し40%程度削減されました。さらにコストが2倍になる見込みだった次年度を考えると大幅なコスト削減効果があったと考えています」
その他の技術的な評価ポイントについて、新システム検討を担当する共有インフラ構築・運用グループの竹田 茂馬氏は次のように語る。
「既存システムと同等の監視ができないとサービスレベルの低下につながるため、監視項目の対応を重視しました。他社製品ではデータ移行プログラムをフルスクラッチで作成するか、データを再入力する必要がありました。1万を超える監視項目を手入力することは現実的ではありません。」

“楽天はシステム移行の次へと進んでいます。 Pandora FMS の API を利用して、運用効率を高め、監視を簡単に追加できるようにするためのカスタマイズ計画を立てています。”
プロジェクトは2011年8月に開始。4カ月を経た12月より本番環境へ展開を始め、2012年第一四半期中には新システムに完全に切り替える予定だ。
Pandoraが採用された新しい統合監視フレームワークは、データセンター内に、監視サーバ1台に加え、以下の3つのグループで構成されている。
HA構成のSyslog/SNMP監視
5+1構成のIPv4サービス監視
1+1構成のIPv6サービス監視
この構成は別のデータセンターにも構築されており、データセンターをまたいだ冗長構成となっている。また、将来サーバを追加して、更に増強することも簡単な構成になっている。 楽天市場の運用も担当し、今回のプロジェクトにも参画する日本システム構築運用グループグループマネージャの藤巻 和人氏は実際に運用する側の意見として、Pandoraの導入効果を次のように語る。 「現場で監視サービスを利用する立場としては、これまでの監視システムとほぼ同じ構成で 導入でき、運用プロセスに変更なかったことが 大きなメリットです。運用プロセスがいろいろ ある中でスムーズに移行でき、様々なことがで きる点を高く評価しています」
“Pandora採用の決め手は、すべての要件で他社製品より優れていたことです。”
現場でも高い評価を得たPandora。その理由はデータ移行の成功と高い柔軟性に他ならない。その点について竹田氏は次のように語る。 「PandoraのAPIを利用したデータ変換プログラムを自作し、データ移行を行いましたが、既存データをExportし、必要な設定値を入力することで数万単位の監視項目を1日で移行できました。Pandoraの高い柔軟性のおかげで移行は極めてスムーズでした。Pandoraはオープンソースベースの商用ソフトウェアですが、他のオープンソースと比較してもサービスレベルが高く、監視システムの冗長性が確保できている斬新的な製品です。楽天規模となると冗長性と柔軟性が極めて重要なため、非常にマッチしていると思います」

今後の展開
楽天の取り組みは単なる移行では終わらない。運用効率を高めるため、PandoraのAPIを活用し、監視の追加が容易にできるようカスタマイズする予定だという。また、さらなる高いサービスレベルの実現のため、より高度な監視機能を追加する考えだ。藤巻氏は今後の展望を次のように語る。
「Pandoraの導入により、今まで導入しなかったり、他で独自で作りこんでいたものも統合監視システムに取り込むことができました。次のステップとしては、現状の死活監視に加え、Webが表示されるまでの時間やアプリケーションのコンテンツ監視など、よりユーザレベルの監視ができるようになればと考えています」
楽天のアールワークス(日本における Pandora FMS 開発・サポート・販売パートナー)への信頼は高い。竹田氏によると製品対応のスピードが速く、不具合修正なら早ければ中1日、機能追加要求についても1週間ほどでフィードバックがあるなど、迅速な対応に満足しているという。
また、アールワークスが手順書のベースを作成したことにより、楽天側での工数を省くことにも貢献できた ということだ。こうしたアールワークスの支援を踏まえ、今後の期待を根本氏は次のように語る。 「アールワークスに対しては、これまでの対応が速かったことを高く評価しています。これから本格的な導入がはじまりますが、今後のサポートにも大きな期待を寄せています。とくに自分たちの力だけで対応できないところを二人三脚でやってほしいと思っています」
楽天が掲げる「世界一のインターネット・サービス企業」という目標。その実現に不可欠な柔軟な監視フレームワークの構築。その重要な役割をアールワークスの「PandorFMS Enterprise」が担っている。
ÁRTICA ST と PANDORA FMS
Artica STは、独自のソリューションを開発する革新的な企業であり、Pandora FMSをはじめ、Integria IMSやBabel Enterpriseなどのソフトウェアソリューションを開発している企業でもあります。 Pandora FMS は、システムやネットワークを監視するための、市場で最も柔軟なソリューションの一つです。
Pandora FMS は、アメリカ、ヨーロッパ、ラテンアメリカの大学や、通信・IT分野の多国籍企業など、さまざまな組織や企業のデータセンターで利用されています。Pandora FMS は、アメリカ、ヨーロッパ、ラテンアメリカの大学や、通信・IT分野の多国籍企業など、さまざまな組織や企業で利用されています。
※本コンテンツは、日本における Pandora FMS の開発・販売パートナーである株式会社アールワークス(https://www.rworks.jp/)が翻訳しました。

成功事例を提供していただけませんか?
私たちの提案は魅力的でしょうか?