高可用性(HA)とディザスタリカバリ(DR)とは？何が違う？

こんばんは。今日はITシステム運用における高可用性とディザスタリカバリについて理解を整理してみようと思います。

Micrsoft AzureのHADR(High Availability – Disaster Recovery)機能について調べていたら、HAとDRを区別して言葉を使い分けていたため気になった次第です。

それでは参ります。

Contents

高可用性（High Availability/HA）とは

High availability (HA) is a characteristic of a system which aims to ensure an agreed level of operational performance, usually uptime, for a higher than normal period.
Wikipediaより

上の通り、Wikipedia先生によると”合意したレベルの運用性能（稼働時間）を通常よりも高い水準に確保することを目標としたシステムの特性”と説明されている。

信頼性工学における高可用性実現の原則は以下とされている。

単一障害点の排除：ある部分の故障がシステム全体の故障を意味しないように、システムに冗長性を持たせること
信頼性の高いクロスオーバー：ある部分の故障が発生した場合に信頼性高く（≒システム全体の故障に繋がることなく？）切り替えなどが行われること
故障が発生した際に発見できること

ディザスタリカバリ（Disaster Recovery/DR）とは

Disaster recovery involves a set of policies, tools, and procedures to enable the recovery or continuation of vital technology infrastructure and systems following a natural or human-induced disaster.
Wikipediaより

上の通り”自然災害または人為的災害後の重要な技術インフラ、システム復旧、あるいは被害を最小限に抑えるための予防措置”と説明されている。

ディザスタリカバリは、プライマリサイトが（少なくともしばらくの間）回復できない前提で、元の場所に復元するプロセス以外に、データとサービスをセカンダリの存続サイトに復元するプロセスを検討する。とも説明がある。

HAとDRに共通する点

どちらもビジネス継続性*を実現するための取り組み

*ビジネス継続性

中断 (特にそのコンピューティングインフラストラクチャに対する) が発生した場合でもビジネス活動を続けることができるようにするメカニズム、ポリシー、手順

HAとDRの異なる点

HAは主にシステムの設計により実現する。単一障害点を減らし、冗長性を確保した上で、フェイルオーバやリカバリーの手順を自動化することで、システム全体の障害を防ごうとする。
DRはポリシー、手順、ツールも合わせて実現する。地域の災害などでプライマリシステムに大きな障害が発生し、システムの復旧に時間がかかる（＝ダウンタイムが発生する）ことを前提としている。システムのダウンタイムを防ぐ（理想的には０にする）ことを目指すHAとここが大きく異なる。

このため、

HAでは、可用性（99.999%、など）という指標で検討する。可用性は、SLAとして合意されている場合も多い。
DRでは、RTO（目標復旧時間）とRPO（目標復旧時点）という指標で検討する

RTOとRPO

RTO（目標復旧時間）：障害や問題が発生してからリソースをオンラインに戻す際に利用できる時間の上限
RPO（目標復旧時点）：どの時点までデータベースを復旧すべきかであり、企業が進んで受け入れることのできるデータ損失の最大量に相当

ミッションクリティカルなシステムなどではもちろんRTO 0でRPOもなるべく直近で損失を許容しないことが理想だが、現実的にはコスト、技術者のスキルなど様々な要因からその実現は難しい。ダウンタイムによって発生が想定される損失が推定できれば、それをもとに許容できるRTO/RPOを設計していくことができる。

HAとDRの関係については、Teradataのブログにあった以下の図の整理が分かりやすいと思った。ビジネス継続性はHA, DRを包含した考え方であり、DRはHAを包含していると考えることができそう。

https://www.teradata.jp/Blogs/Demystifying-the-Business-Continuity-Space-Part-One

勉強になりました！

参考

https://en.wikipedia.org/wiki/High_availability

https://jpcodeqa.com/q/e0f62925cdd067a8a435f5adb48b13a1

https://www.teradata.jp/Blogs/Demystifying-the-Business-Continuity-Space-Part-One

https://docs.microsoft.com/ja-jp/learn/modules/describe-high-availability-disaster-recovery-strategies/2-describe-recovery-time-objective-recovery-point-objective

高可用性(HA)とディザスタリカバリ(DR)とは？何が違う？

高可用性（High Availability/HA）とは

ディザスタリカバリ（Disaster Recovery/DR）とは

HAとDRに共通する点

HAとDRの異なる点

参考

関連

コメントを残す

Profile

Categories

yutaro013_scenery

Trending Posts

【2023年度最新版】Azure Administrator Associate資格 (AZ-104)を3日で取得した話。勉強方法は？取ってよかった？

【詳解】クライアント証明書認証を実装しながら理解する – 前編：概要～証明書作成編

【VSCodeで開発】コミットしようとしたら「Git の ‘user.name’ と ‘user.email’ を構成していることを確認してください」エラーが発生する

【自然言語処理】PythonとTwitter APIでデータ分析

【2023年最新版】Microsoft Cybersecurity Architect Expert資格 (SC-100)を1週間で取得した話。勉強方法は？取ってよかった？

【2023年最新版】Azure Solution Architect Expert資格 (AZ-305)を1週間で取得した話。勉強方法は？取ってよかった？

超便利＆簡単！VS Codeの設定を複数PC間で同期する

【機械学習】Scikit-Learnで交差検証(Cross-Validation)を一瞬で実装する【Python】

AzureのSAS（共有アクセス署名）を分かりやすく解説する

Azure Developer Associate資格(AZ-204)を10日間で取得した話。勉強方法は？取ってよかった？

Microsoft Power Platform Fundamental資格 (PL-900)を取得した話。勉強方法は？取ってよかった？

【Python×自然言語処理】テキストデータを極性辞書で感情分析してみる

【2023年最新版】Azureの認定資格を1ヶ月で全部とる。資格一覧と対策方法・体験記まとめ

Azure Data Fundamentals資格 (DP-900)を2日で取得した話。勉強方法は？取ってよかった？

【データ分析】MacOSで複数のPython/Anacondaバージョンを使い分ける方法【pyenv】

【機械学習】決定木モデルの変数重要度をわかりやすく解説する

CPU使用率とCPU時間について分かりやすく解説する

機械学習における転移学習とファインチューニング

Azure AI Fundamentals (AI-900)を2日で取得した話。勉強方法は？取ってよかった？

3日間集中勉強でAWSソリューションアーキテクトアソシエイト資格試験(SAA-C02)に合格した話

アーカイブ