[CISA 이론 정리 - 4장] 08 가용성 및 연속성 확보 전략

반응형
반응형

1. 복구 등급 결정

① 응용 및 정보 처리 자원에 대한 복구 우선 순위를 부여해야 한다.

② 예를 들어 다음과 같은 복구 등급 분류 체계를 사용할 수 있다.


핵심(Critical)

• 수작업으로 처리할 수 없기 때문에 가장 먼저 복구해야 한다.

• 기능이 중단될 경우 손실 비용이 매우 높고 급속히 누적된다.


중요(Vital)

• 짧은 기간(Brief period) 동안만 수작업으로 처리할 수 있다.

• 핵심 등급에 비해 중단으로 인한 손실 비용의 누적 속도가 느리다.


민감(Sensitive)

• 상당 기간(Extended period) 동안 수작업으로 처리할 수 있다.

• 수작업 처리에 일부 어려움이 따르며 업무 수행을 위한 추가 인력이 필요하지만 중단 비용은 감당할 만하다.


비 핵심(Non-critical)

• 상당 기간(Extended period) 동안 어려움이나 중단 비용을 거의 수반하지 않으면서 수작업으로 처리할 수 있다.

• 회복 후 장해 기간을 만회하기 위한 노력이 거의 필요 없다.



2. 장애 관리 전략

Fail Safe(장애 안전)

• 장애가 탐지되면 시스템의 전체 기능을 중단한다.

• 시스템 무결성을 강조하며 장애 보안(fail secure)이라고도 한다.


Fail Soft(장애 완충)

• 장애가 탐지되면 핵심 기능만 남기고 주변 기능은 중단한다.

• 시스템 가용성을 보완하며 장애 흡수(fail resilient)라고도 한다.


Fail Over(장애 이관)

• 장애가 탐지되면 대기 중인 시스템에 기능 수행을 이관한다.

• 기능 수행을 이관하는 과정에서 약간의 중단이 발생할 수 있다.


Fail Tolerant(장애 감내 또는 고장 감내)

• 구성분을 중복하여 장애 시에도 시스템 기능이 유지된다.

• 장애의 단일 지점(SPOF: Single Point of Failure)을 제거한다.



3. 하드웨어/소프트웨어의 가용성

(1) 가용성의 하부 속성

① 하드웨어 및 소프트웨어의 가용성은 신뢰성과 유지보수성으로 구성된다.


신뢰성: 오류나 중단 없이 기능이 일관성 있게 지속되는 특성이다.

유지보수성: 오류나 중단을 신속하게 교정하거나 기능을 수정할 수 있는 능력이다.

④ 상용 규격품(COTS, Commercial Off The Shelf)을 사용하면 유지보수성이 높아진다.



(2) 가용성 측정 지표


MTBF(Mean Time Between Failures)

• 장애와 장애 사이의 평균 시간으로서 신뢰성 지표이다.

• MTBF = 총 가동 시간 ÷ 해당 기간 동안의 고장 건 수

• 값이 클수록 신뢰성이 높다.


MTTR(Mean Time To Repair)

• 고장을 수리하는 데 걸린 평균 시간으로서 유지보수성 지표이다.

• MTTR = 총 수리 시간 ÷ 해당 기간 동안의 고장 건 수

• 값이 작을수록 유지보수성이 높다.


MTTF(Mean Time To Failure)

• 수리가 완료된 이후 다음 고장이 발생할 때까지의 평균 시간이다.

• MTTF = MTBF - MTTR

• 값이 클수록 신뢰성이 높다.



4. 대체 처리 시설

(1) 상호 지원 협약(Mutual Aid Agreement, Reciprocal Agreement)

① 심각한 중단 시 서로 다른 조직이나 같은 조직에 속한 지점들 간에 정보 처리 시설과 컴퓨팅 시간을 공유하기로 합의하는 협약이다.

② 현실적으로 널리 사용되는 대안은 아니지만 지리적으로 분산된 여러 지점을 갖춘 조직이라면 지점들 간에 상호 지원을 위한 마련을 시행할 수 있다.

③ 비용이 가장 저렴하며 특수한 정보 처리 환경이 요구되는 조직의 경우 유일한 대안이다.

④ 이행의 강제력 부족, 용량 부족, 구성의 차이로 인한 호환성 제약 등의 문제가 있다.



(2) 상용 회원제 서비스(Commercial subscription services)

① 중단 시 대체 처리 시설로 사용할 수 있는 물리적 환경 및 관련 장비를 갖추어 놓고 일정 비용을 지불하는 업체에게 임대해 주는 서비스이다.

② 평상 시에는 기본적인 임대료만 지불하지만 실제로 중단이 발생하여 임대 시설을 사용하는 경우 해당 기간 동안 추가 비용을 지불해야 한다.

③ 일반적으로 임대 시설의 준비 상태에 따라 임대 옵션은 핫/웜/콜드 사이트로 나뉜다.


핫 사이트(Hot site)

• 정보 처리에 필요한 기본 시설, 하드웨어, 소프트웨어, 응용, 최신 버전의 DB 백업본을 갖추고 있다.

• (장점) 신속하게 대체 처리를 재개할 수 있다.

• (단점) 임대 비용이 비싸고, 최신성/보안을 엄격히 유지해야 한다.


웜 사이트(Warm site)

• 고가의 장비와 응용 그리고 실제 데이터를 제외한 정보 처리에 능력을 갖추고 있다.

• 핫 사이트와 콜드 사이트 사이의 준비 상태를 갖춘다.

• 관리 비용과 보안 요구가 핫 사이트와 콜드 사이트의 중간 수준이다.


콜드 사이트(Cold site)

• 대체 처리 시설을 구비할 수 있는 기본적인 운영 환경은 갖추었지만 하드웨어, 소프트웨어, 응용, DB는 보유하고 있지 않다.

• (장점) 최소한의 비용으로 대체 시설을 임대할 수 있다.

• (단점) 대체 처리를 재개하는 데 걸리는 시간이 길다.


④ 상용 회원제 서비스는 서비스 제공업체의 정책에 따라 이용에 제약이 있을 수 있다.



(3) 자체 핫 사이트 

① 높은 가용성이 요구되기 때문에 상호 지원 협약을 맺거나 외부업체로부터 대체 처리 시설을 임대하지 않고 자체적으로 핫 사이트를 구축/운영할 수도 있다.

② 조직의 독특한 필요와 상황에 맞게 핫 사이트를 운영할 수 있다는 장점이 있다.

③ 하지만 자체 핫 사이트 운영에 필요한 인력과 업무 능력을 독자적으로 갖추어야 한다.



(4) 미러링 사이트(Mirroring site) 

① 미러링 사이트란 시스템 간에 호환성을 갖추고 있으며 DB도 실시간으로 동기화되는 복수의 일차 처리 시설로서 중복 사이트(redundant site)이다.

② 대체 처리를 가장 신속하게 재개할 수 있고 대체 처리와 관련한 고유한 필요를 충족한다.

③ 하지만 구축/운영/유지보수 및 보안/호환성 유지에 소요되는 노력과 비용이 매우 높다.



(5) 기타 개념

서비스 뷰로(Service Bureau)

• 자체적으로 보유한 대용량의 컴퓨팅 자원을 활용하여 여러 고객사에 정보 처리 서비스를 제공하는 아웃소싱 벤더이다.

• 서비스 뷰로는 정보 처리 이외에도 번역, 프로젝트 관리, 문서 이미지 스캔, 설문 조사 등의 서비스를 제공하기도 한다.


복수의 처리 센터(Multiple Processing Centers)

• 정보 처리 시설을 분산시켜 복수로 운영하다가 중단이 발생할 경우 작용 가능한 시설들에서 정보 처리를 지속하게 한다.

• 각각의 정보 처리 시설을 자체적으로 구축할 수도 있고 서비스 뷰로나 상용 서비스를 혼합하여 운영할 수도 있다.


모바일 사이트 및 조립식 건물

• 대형 트럭이나 트레일러에 장비를 싣어 재해 현장이 투입하거나 모듈화된 조립식 건물로 대체 처리 시설을 구축할 수 있다.



(6) 일차 사이트와 대체 처리 사이트 간의 거리Off site의 위치

① 대체 사이트가 일차 사이트와 동일한 재해를 입을 수 있는 지역에 위치해서는 안 된다.

② 절대적인 거리는 없으나 30~50km (20~30 마일) 정도의 거리를 두는 것이 일반적이다.

③ 잠재적 재난의 범위가 대단히 넓다면 160km (100 마일) 이상의 거리를 둘 수도 있다.



반응형

댓글

Designed by JB FACTORY