CISA 나 CISSP 자격증을 보유하고 있거나 회사에서 관리자로 BCP&DRP 정책 수립을 해보신 경험이 있다면 쉽게 알수 있는 내용이다.

정책수립시에 서버의 디스크 I/O 에 따른 raid 레벨도 같이 결정하게 되며. 우선적으로 해야 할것은 자산의 가치판단과, MTD(Maximum Tolerable Downtime), RTO(Recovery Time Objective), RPO(Recovery Period Objective)를 고려하여야 한다.
초보자도 이해가 될수 있도록 용어 쓰지 않고 풀어서 설명하고자 한다.


1. 자산가치 측정과 리스크.

어떤 정책을 수립하던 최우선적으로 해야 할것은 자산의 가치 판단이다. 예를들어 1억원짜리 데이터를 보호하기 위해 1/10인 1천만원 정도를 들여 보안장비/백업장비를 설치하였다면 이는 아주 저렴하게 구성한것이 되지만. 반대로 10원짜리 동전을 지키기 위해 1천만원짜리 금고를 샀다면 돈낭비 이다. 그냥 10원짜리를 잃어버리는게 합리적 판단이 된다는 것이다. 

 스토리지 구성도 마찬가지 이다. 저장하는 데이터 가치가 100만원정도인데, 이를 위해 raid 10 구성으로 소모되는 디스크 비용 + 유지 비용이 100만원을 초과한다면 이는 잘못된 선택이 된다. 이 경우 MB 당 유지비용이 저렴한 raid 5 로 구성하는게 합리적인 선택이 될것이다.



2. 용도와 요구성능

같은 DB 라고 해도 OLTP 인지, OLAP 인지에 따라 디스크 구성이 다르고, 스토리지 서버도 실시간인지, 야간에 배치작업을 통한 저장인지에 따라 다르다. 또한 글 머리에서 디스크I/O를 판단하여 결정한다고 하였는데, 장애가 발생하고, 복구가 완료되는 시점까지 디스크I/O는 떨어지게 된다. 평균 or 최소 디스크 I/O 가 1GB/s 라면 장애시에도 최소한 이를 만족 시켜줘야 한다는게 BCP(사업연속성)의 기본 개념이라 보면 된다..

자료의 가치가 낮아 raid 5 구성이 금전적으로는 합리적이라고 해도 raid 5로 서비스 유지가 되지 않거나 예를들어 SLA 문서상에 1Gbps 대역이 보장되어 있다면. 어쩔수 없이 raid 50 이나 raid 10으로 구성할수도 있는 것이다. 반대로 100Mbps 이면 충분한 환경에서 4Gbps FC SAN 을 도입할경우 이는 잘못된 판단이 될것이다.




3. 서버 환경.

무인으로 24x7 운영되는 환경과 AM 9시부터 PM 6시까지만 가동되며, 항상 전문인력이 배치되어 있는 환경의 raid 레벨은 다를수 밖에 없다.

예를들어 스토리지 서버가 IDC 에 위치해 있고, 모니터링이 실시간으로 되지 않으며, 문제 발생시 IDC 에 접근하는데. 1주일 이상 소요되는 환경이라면, 24개의 디스크를 raid 6 이나 60 으로 구성을 하고 핫스페어 1개 또는 2개를 지정해서 인력이 도착할때까지 시스템이 fail 되지 않도록 구성해야 하지만.

같은 일을 하는 스토리지의 위치가 사내안에 있으며, 실시간 모니터링이 잘 되고, 문제시 관리자가 3분이내에 접근가능하다면 raid 5EE 로만 구성해도 된다. 심지어 핫스페어없이 raid 5 만으로 구성해도 문제 될것이 없다.




4. MTD(Maximum Tolerable Downtime.용인가능최대정지시간) 
    RTO(Recovery Time Objectives.목표복구시간)


증권/은행/카드사의 경우 1초라도 장애 발생시 손해액 과 이미지 타격이 크기 때문에 raid 10 및 클러스터 구성을 통한 서버 단위 교체나. 재해 영향을 벗어난 별도의 지역에 동일한 규모의 핫사이트를 구성 한다.

반대로 야간에 일괄배치로 저장되는 스토리지라면 에러가 발생후 12시간 이내에만 복구시키면 되기 때문에 위와 같은 구성은 필요치 않다. 백업본만 잘 있다면 raid 5 라도 해도 문제 될것이 없다. 다만 raid 5,6 은 리빌드 타임이 길기 때문에 12시간 이내에 접근시간 + 복구시간이 완료가능한지만 판단해야 한다. 

raid 는 성능을 위해서 쓰기도 하지만 근본적으로 fail over(장애극복)을 위한다고 보시면 된다.
(과거 싼값으로 대용량 디스크 쓴다는 말은 이미 현실과 맞지 않으니 넘어가겠다.)

리빌드 타임만 보면 raid 10 이 raid 5, 50, 60 보다 빠르다. raid 0 과 1 은 XOR연산이 필요하지 않은 단순 배열 방식으로 좌우를 번갈아 쓰기만 하면 되기 때문에 컨트롤러에 부담이 없다보니 처리속도도 빠르고 복구시간도 가장 짧다. 사실상 바이패스 수준이라서 저가형 컨트롤러에서도 무리없이 raid 10을 지원하는것이다.


5. 결론.
자산의 가치 판단과 각 환경을 파악하는것이 우선이라는 것을 잊지 말기 바라며, RAID는 백업의 대안이 될수 없으니 반드시 별도의 백업정책을 수립하기 바란다.

'Server' 카테고리의 다른 글

서버의 용도 및 환경에 따른 RAID 레벨 선택.  (0) 2009.12.13

+ Recent posts