Cisco MDS 9000 Network-based Storage Applications

MDS 9500 시리즈를 이용한 고가용성 스토리지 네트워크

MDS 9500 시리즈를 이용한 고가용성 스토리지 네트워크



솔루션 가이드


Cisco MDS 9500 시리즈 멀티레이어 디렉터를 이용한 고가용성 스토리지 네트워크



개요

오늘날 기업 환경에서 고가용성은 더 이상 선택의 문제가 아닙니다. 데이터 증가율이 현저하게 상승되면서 데이터 가용성은 어느 때보다도 중요한 사항이 되었습니다. 기업 및 애플리케이션 규모가 커짐에 따라 관련 데이터 센터 인프라의 확장 또한 중요한 문제로 대두되었습니다. 인터넷의 도입으로 빠르게 세계 경제로 전환하면서 평균적인 업무 환경이 8시간 5일 작업 모델에서 24시간 7일 작업 모델로 변화되고 있습니다. 이와 같이 '항상 업무 중'인 세계에서는 고가용성에 대한 요구 사항이 더욱 까다로워집니다. 기업을 원활하게 움직이도록 유지하려면 회사의 가장 중요한 자산인 데이터를 언제든지 사용할 수 있어야 합니다. 데이터의 손실이 치명적인 결과를 초래할 수 있는 것과 마찬가지로 이러한 데이터에 액세스할 수 없을 때에도 비용상 손해가 발생할 수 있습니다.

동작 시간(uptime)이 99%라면 상당히 양호한 것처럼 보이지만 이렇게 '가용성이 높은' 환경에서도 연간 83시간 이상의 다운타임이 발생할 수 있습니다. 이 정도면 규모에 상관없이 기업에 심각한 영향을 줄 수 있습니다. 가용성이 높은 솔루션을 설계할 때에는 다운타임 비용을 고려해야 합니다. 금융 중개 회사의 경우 동작 시간이 99%인 환경에서 매출 및 생산성 측면에서 연간 5억 4천만 달러 이상의 손실이 발생할 수 있습니다.

  시간당 비용 가용성 다운타임(분/년)
금융 중개 6백 50만 달러 99.999% 5
신용 카드업 2백 60만 달러 99.99% 50
홈쇼핑 10만 달러 99.9% 500
통신 판매 9만 달러 99% 5000
항공 예약 9만 달러 90% 50000
전화예매 7만 달러    

출처: Fibre Channel Industry Association11; Horison, Inc.

동작 시간이 99.999%로 증가하면 손실은 연간 54만 달러로 줄어듭니다.
동작 시간을 99.999%로 높이는 일은 그다지 간단한 일이 아닙니다. 그러나 고가용성 스토리지 인프라는 데이터의 가용성을 확보하기 위한 핵심적인 요소입니다. 스토리지 인프라에는 RAID(Redundant Array of Independent Disks) 기술, 클러스터된 시스템의 여러 데이터 사본, 원격 클러스터링, SAN(Storage Area Network), 안정적인 테이프 백업 등등이 포함됩니다. 이 중에서 SAN 아키텍처를 이용하면 전사적 차원에서 고가용성을 구성하여 기업의 성장과 함께 구성을 확대하고 데이터 스토리지에 대한 투자를 보호할 수 있습니다. 고가용성 SAN을 설계할 때에는 다음의 몇 가지 요인을 검토해야 합니다.

사람의 실수로 인한 피해 및 방지책
환경 문제(예: 전력 중단, 공조 시스템 장애, 연결관 공사 등)
인프라 장치의 소프트웨어 장애(스위치 등)
예정된 다운타임(소프트웨어 업그레이드, 하드웨어 유지 보수)
해커로부터의 위협
인프라 장치의 하드웨어 장애(스위치 등)

하드웨어 장애와 전력 중단 등과 같은 일부 장애는 견실한 설계만으로도 해결할 수 있지만 사람이 저지르는 실수로 인한 장애는 설계만으로는 해결이 어렵습니다.

기업 전반에 걸쳐 스토리지 동작 시간(uptime)은 매우 중요한 역할을 담당합니다. 각 직원은 애플리케이션 서버를 통하거나 워크스테이션에서 직접 스토리지에 액세스하여 중요한 업무상의 결정을 내립니다. 그러므로 스토리지 가용성에 문제가 발생하면 연쇄적으로 기업 전체가 영향을 받게 됩니다.
연쇄적으로 발생하는 이러한 피해를 방지하려면 업무 다운타임을 유발하는 모든 가능성을 제한하거나 제거하여 동작 시간을 최대한 확대해야 합니다.

그림 1






고가용성 솔루션 설계

가용성이 높은 스토리지 환경을 설계할 때에는 종단간 접근 방식을 사용해야 합니다. 스토리지 솔루션의 컴포넌트를 단순히 검토만 하는 것으로는 부족하며 다음과 같은 컴포넌트를 모두 고려해야 합니다.
스토리지 서브시스템
스토리지 서브시스템의 주요한 세 가지 측면은 가용성이 높은 솔루션 설계에 있어서 매우 중요합니다.


데이터 보호


리던던시형 캐시 - 실제로 모든 스토리지 서브시스템은 일종의 프론트 엔드 캐시를 사용합니다. 이 캐시는 쓰기 작업을 캐싱하여 서브시스템의 응답 시간을 향상시킵니다. 캐시 없이 디스크에 직접 쓰게 된다면 전체 대기시간 측면에서 손실이 발생할 것입니다. 애플리케이션 서버에서 쓰기 명령을 실행하는 경우 스토리지 서브시스템은 훨씬 짧은 대기시간으로 캐시에 데이터를 기록한 다음 애플리케이션 서버에 쓰기가 완료되었음을 알립니다. 그런 다음 해당 데이터는 나중에 실제 디스크에 기록되거나 디스테이지(de-stage)됩니다. 여러 서브시스템에서는 가용성을 추가로 확보하기 위해 프론트 엔드 캐시를 미러합니다. 특정 캐시에 오류가 발생할 경우에도 미러된 복사본이 있으므로 해당 데이터는 손실되지 않습니다.

RAID - RAID(Redundant Array of Inexpensive Disks)는 보호 및 액세스 속도 측면에서 데이터의 가용성을 높이기 위해 거의 모든 서브시스템에서 사용합니다. RAID는 둘 이상의 디스크에 데이터를 미러링하는 간단한 RAID 1로 구현하거나, 데이터 패리티를 계산하고 스트라이핑(stripping)하는 고급 기능이 사용되는 RAID 5로 구현할 수 있습니다. RAID 1 및 RAID 5 기술의 보호 및 성능 수준은 각각 다르지만 모두 디스크에 장애가 발생할 경우 추가 가용성을 제공합니다.

데이터 복제 - 스토리지 복제는 일반적으로 전체 서브시스템 장애로부터 보호하기 위해 구현합니다. 일반적으로 복제는 비동기 형식으로 먼 거리에서 사용하는데 이 부분은 본 문서에서 다루지 않습니다. 동기식 스토리지 복제는 로컬 데이터 센터 내에서 중요한 애플리케이션의 성능에 미치는 영향은 최소화하면서 데이터 가용성을 확보하는 데 사용할 수 있습니다. 이러한 복제는 스토리지 서브시스템 또는 외부 호스트 기반 애플리케이션에서 수행할 수 있습니다. 어느 경우에나 2개의 독립적인 스토리지 서브시스템은 각각 동일한 데이터 사본을 보유하게 됩니다.

그림 2



서브시스템 연결

스토리지에 대한 연결은 스토리지 자체의 무결성만큼 중요하다고 할 수 있습니다. 만약 애플리케이션에서 스토리지에 액세스할 수 없게 되면 다운타임이 발생할 것입니다. 그러므로 스토리지 서브시스템 내에서 스토리지를 프로비저닝하는 방법은 전반적인 스토리지 고가용성 솔루션에 있어서 매우 중요합니다.

리던던시형 인터페이스 - 완벽한 고가용성을 확보하기 위해서는 반드시 리던던시형으로 연결해야 합니다. 디스크 논리 장치는 스토리지 서브시스템의 여러 인터페이스를 통해 내보내야 합니다. 이렇게 하면 호스트 수준에서 멀티패싱(multipathing)이 가능할 뿐만 아니라 디스크 서브시스템 자체로부터 물리적으로 2개의 연결이 이루어지는 추가 리던던시가 제공됩니다.

그림 3



서브시스템 하드웨어 리던던시

전력 리던던시 - 전력은 스토리지 서브시스템의 중요한 요소입니다. 대부분의 스토리지 서브시스템에서는 이중 전원 공급 장치를 표준 장비로 사용합니다. 이외에도 프론트 엔드 캐시를 사용하는 대부분의 서브시스템은 여러 수준의 캐시용 배터리 백업을 갖추고 있습니다. 일부 서브시스템에서는 최대 며칠 동안만 캐시로 전원을 공급할 수 있는 소형 배터리를 사용합니다. 일부 서브시스템에서는 캐시의 데이터를 물리적 디스크로 충분히 '디스테이지'할 수 있을 만큼 오랫동안 전체 시스템을 실행할 수 있는 대형 배터리를 사용하기도 합니다.

임시 예비 디스크 - 대부분의 스토리지 서브시스템은 예비로 물리적 디스크를 제공합니다. 이러한 예비 디스크는 서브시스템마다 크기가 다를 수 있으며 디스크에 장애가 발생할 기미가 보이거나 갑작스러운 오류가 발생할 경우에만 사용할 수 있습니다. 서브시스템은 잠재적인 장애 발생 징후를 감지하기 위해 각각의 물리적 하드 디스크를 모니터링합니다. 서브시스템에서 장애 발생 징후를 포착하면 오류가 발생한 디스크의 데이터는 임시 예비 디스크로 복사됩니다. 또한 스토리지 서브시스템에서 많이 사용하는 RAID를 활용하면 RAID 그룹의 디스크에서 갑자기 오류가 발생할 경우라도 임시 예비 디스크를 사용하여 손실된 데이터를 복구할 수 있습니다. 어느 경우에도 서브시스템에서 복구가 가능하며 데이터 액세스는 중단되지 않습니다.


스토리지 네트워크

호스트와 스토리지를 연결하는 네트워크 또는 패브릭도 전체 고가용성 솔루션의 중요한 컴포넌트입니다. 최상의 설계 방식은 네트워크 설계 내에 한 대의 서비스 마비로 전체 서비스가 중단될 수 있는 SPOF(Single Point of Failure)가 일어나지 않도록 하는 것입니다. 또한 최상의 설계 방식은 과도한 리던던시로 인해 장애 복구 시에 성능 저하가 일어날 수 있으므로 리던던시가 적정 수준이 되도록 하는 것입니다.


스토리지 네트워크 하드웨어


스위치 하드웨어 - 스토리지 솔루션을 구성하는 다른 모든 하드웨어 컴포넌트와 마찬가지로 파이버 채널 스위치의 하드웨어는 반드시 리던던트형이어야 합니다. 스위치 계열 제품에서 하드웨어 리던던시는 대체로 이중 전원 공급 장치로 제한됩니다. 이렇게 하면 전력 중단 문제는 해결되지만 다른 스위치 컴포넌트 장애는 해결할 수 없습니다. 그러나 디렉터 계열 파이버 채널 스위치의 등장으로 스토리지 네트워크에 있어서 새로운 수준의 가용성을 확보할 수 있게 되었습니다. 이 스위치는 리던던시형 전원 공급을 지원할 뿐만 아니라 다른 모든 주요 컴포넌트 역시 리던던시형으로 이루어집니다. 스위치 제어 모듈은 장애 복구(failover) 기능을 제공합니다. 크로스바(crossbar) 역시 리던던시형 구성에 내장되어 있습니다. 소프트웨어 업그레이드는 중단 없이 이루어져야 합니다. 이런 측면에서 디렉터 계열 하드웨어는 시스템의 동작 시간(uptime)이 확실하게 99.999%에 이르도록 보장해 줍니다.


스토리지 네트워크 설계

패브릭 리던던시 - 파이버 채널 SAN에서 주의가 필요한 다른 하나는 패브릭입니다. 동일한 물리적 인프라에 연결되어 있는 각 장치는 동일한 파이버 채널 패브릭에 소속됩니다. 이것은 네트워크의 모든 장치를 중단시킬 수 있는 패브릭 수준의 이벤트에 대해 SAN을 연결시키는 기능을 합니다. 스위치를 추가하거나 Zoning 구성을 변경하는 등의 변경 사항은 연결되어 있는 전체 패브릭에 연쇄적으로 영향을 끼칠 수 있으므로 머리 속에 연결된 별도의 패브릭들에 대한 그림을 그려 놓으면 해당 이벤트의 범위를 구분짓는 데 도움이 됩니다. 시스코의 VSAN(Virtual SAN) 기능은 동일한 물리적 인프라를 사용하여 이벤트를 격리시키는 환경을 복제할 수 있습니다. VSAN은 이 문서의 뒷부분에서 좀더 자세히 설명합니다.

그림 4


ISL(Inter-Switch Link) - SAN이 확장되면 스위치 간의 연결이 중요해집니다. 설계 시 스위치 간의 연결을 단일의 물리적 링크에 의존하면 전반적인 리던던시가 감소합니다. 리던던시형 ISL은 링크 오류가 발생할 경우 장애 복구 기능을 제공합니다.


애플리케이션 호스트


HBA(Host Bus Adapter)는 애플리케이션 서버와 SAN 간의 인터페이스입니다. 네트워크 인터페이스 카드와 마찬가지로 서버의 버스 슬롯에 삽입합니다. 대부분의 서버가 단일 파이버 채널 링크에 부담을 줄만큼 입/출력(I/O)을 생성하지는 않지만 듀얼 HBA는 고가용성(HA) 환경에 여전히 필요합니다. HBA가 둘 이상이면 스토리지에 대해 멀티패스를 사용할 수 있습니다. 이렇게 하면 하나의 HBA에 오류가 발생할 경우 장애를 복구(failover)할 수 있을 뿐만 아니라 HAB 사이의 로드 밸런싱도 간편해집니다. 이러한 '멀티패싱'은 여러 방법으로 확보할 수 있습니다. HBA에 고가용성을 제공하기 위해 다음 몇 가지 옵션을 사용할 수 있습니다.

서브시스템 소프트웨어 - 대부분의 주요 스토리지 서브시스템 공급업체는 인증된 HBA의 로드 밸런싱 및 장애 복구를 제공하기 위해 멀티패싱 소프트웨어를 개발해 왔습니다. EMC의 PowerPath와 같은 이러한 소프트웨어는 대체로 해당 업체의 서브시스템 전용으로 설계되거나, 해당 업체의 자체 서브시스템에서 작동할 때 고급 작업 모드를 제공합니다.
볼륨 관리 소프트웨어 - 일부 호스트 기반 볼륨 관리 애플리케이션도 멀티패싱을 지원합니다. Veritas의 Dynamic Multipathing(DMP)과 같은 솔루션은 특정 서브시스템 업체에 국한되지 않습니다.
HBA 드라이버 - 일부 HBA 업체는 현재 호스트의 HBA 드라이버를 통해 멀티패싱 기능을 제공하고 있습니다. 이 솔루션은 특정 HBA 업체 및 될 수 있는 한 특정 HBA 모델로 멀티패싱을 제한하고 있기는 하지만, 역시 특정 스토리지 업체에 국한되지는 않습니다.
운영 체제 - 몇몇 운영 체제(OS)에서는 OS 내에서 자체적으로 멀티패싱 기능을 지원하고 있습니다. 이를 통해 스토리지 서브시스템에서 뿐만 아니라 HBA에서도 멀티패싱 기능을 분리할 수 있습니다.


스토리지 네트워크 가용성 강화


Cisco MDS 9500 시리즈 멀티레이어 디렉터는 파이버 채널 네트워크 내에서 가용성을 향상시킬 수 있는 여러 하드웨어 및 소프트웨어 기능을 제공합니다.


하드웨어 기능


다음에서는 Cisco MDS 9500 시리즈 멀티레이어 디렉터에서 하드웨어 측면의 고가용성 양상을 대략적으로 설명합니다.


수퍼바이저(Supervisor) 모듈


Cisco MDS 9500 시리즈 멀티레이어 디렉터는 리던던시를 위해 섀시당 2개의 수퍼바이저 모듈을 사용할 수 있도록 지원합니다. 각 수퍼바이저 모듈은 제어 엔진(Control Engine)과 크로스바 패브릭(Crossbar Fabric)으로 구성됩니다. 제어 엔진은 전체 시스템 관리를 책임지는 중앙 프로세서입니다. 또한 제어 엔진은 모든 파이버 채널 서비스를 비롯한 모든 네트워킹 제어 프로토콜에도 관여합니다. 리던던시형 시스템에서 2개의 제어 엔진이 활성/대기(active/passive) 모드로 작동하며 언제나 둘 중 하나는 활성 상태를 유지합니다. 대기 모드 상태의 제어 엔진은 실제로 상태 보존형(stateful) 대기 모드로서, 활성 제어 엔진이 유지하는 모든 중요한 관리 및 제어 프로토콜과 지속적으로 동기화됩니다. 대기 제어 엔진은 스위치를 능동적으로 관리하지 않는 동안 지속적으로 활성 제어 엔진으로부터 정보를 수신합니다. 이를 통해 스위치의 상태가 2개의 제어 엔진 사이에서 유지됩니다. 활성 제어 엔진에 오류가 발생하면 나머지 제어 엔진이 완벽하게 그 기능을 수행합니다.

크로스바 패브릭은 시스템의 스위칭 엔진입니다. 크로스바는 시스템 내의 모든 포트 사이에서 경로를 스위칭하는 고속 매트릭스를 제공합니다. 크로스바 패브릭은 각 수퍼바이저(Supervisor) 모듈에 내장되어 있으므로 수퍼바이저 모듈이 2개 있는 리던던시형 시스템에는 크로스바 패브릭도 2개 있습니다. 2개의 크로스바 패브릭은 서로 로드를 공유하며 활성-활성(load-shared active-active) 모드로 작동합니다. 그러나 각 크로스바 패브릭은 720Gbps에 이르는 전체 스위칭 용량을 갖추고 있으며 각 슬롯에 대해 80Gbps의 대역폭을 제공합니다. Cisco MDS 9500 시리즈의 각 스위칭 모듈은 크로스바에 대해 80Gbps 이상의 대역폭을 사용하지 않으므로 수퍼바이저 모듈이 하나뿐이라도 시스템은 완벽한 성능으로 실행됩니다. 그러므로 완벽하게 장착된 Cisco MDS 9500 시리즈에서는 하나의 수퍼바이저 모듈이 제거되거나 장애를 일으켜도 시스템이 중단되거나 성능이 저하되는 일은 발생하지 않습니다.

수퍼바이저 모듈은 핫스왑 모듈입니다. 그러므로 수퍼바이저 모듈이 2개 있는 시스템에서는 나머지 시스템을 중단시키는 일 없이 수퍼바이저 모듈을 제거하거나 교체할 수 있습니다.

그림 5



전원 공급 장치


Cisco MDS 9500 시리즈 멀티레이어 디렉터는 리던던시형 이중 전원 공급 장치를 지원합니다. 이 전원 공급 장치는 활성-활성(active-active) 구성으로 실행되지만 각각 독립적으로 작동합니다. 하나의 전원 공급 장치에 오류가 발생하면 나머지 하나로도 전체 시스템에 충분한 전력을 공급할 수 있습니다. 각 전원 공급 장치는 핫스왑 장치입니다. 개별 전원 공급 장치는 전체 시스템에 전력을 공급할 수 있도록 설계되었으므로 오류가 발생한 공급 장치를 교체할 수 있습니다.


시스템 팬


Cisco MDS 9500 시리즈 멀티레이어 디렉터는 단일 팬 트레이를 사용하여 전체 시스템을 냉각합니다. 이 컴포넌트는 리던던시형이 아닌 것처럼 보이지만 이 트레이는 N+1 리던던시 구성으로 설계되었습니다. 팬 트레이의 각 팬은 개별적으로 모니터링됩니다. 만약 팬에 장애가 발생하면 시스템은 팬 장애를 일반 사용자에게 알립니다. 그러나 몇 개의 팬에 장애가 발생해도 시스템은 영향을 받지 않고 유지됩니다. 일반적인 실행 환경에서는 최대 4개의 팬에 오류가 발생해도 시스템에 영향을 주지 않습니다. 전체 팬 트레이는 핫스왑이 가능하므로 시스템은 해당 팬 트레이를 설치하지 않고도 최대 30분 동안 실행할 수 있습니다. 그러므로 여러 팬에 오류가 발생해도 팬 트레이를 교체할 수 있는 시간은 충분합니다.


소프트웨어 기능


기존의 파이버 채널 스위치가 고가용성을 위해 단순히 하드웨어 리던던시에만 의존하는 반면, Cisco MDS 9500 시리즈는 일반적인 스토리지 네트워크에서 하드웨어 기반 리던던시를 향상시키는 견고한 소프트웨어 기능을 제공합니다.


중단 없는 소프트웨어 업그레이드


예정된 다운타임은 장비 관련 연간 다운타임의 막대한 부분을 차지합니다. 예정된 다운타임은 일반적으로 네트워킹 장치의 소프트웨어를 업그레이드할 때 발생합니다. 이러한 업그레이드는 소프트웨어 버그를 수정하거나 새로운 기능을 추가할 때 실시합니다. 그러나 이유에 상관없이 예정된 다운타임이라고 해도 업무에 영향을 줄 수 있습니다. 모든 디렉터 계열 파이버 채널 스위치의 중요한 장점은 SAN의 트래픽을 중단하지 않고 스위치에 새로운 소프트웨어를 로드하거나 활성화할 수 있다는 것입니다.

Cisco MDS 9500 시리즈 멀티레이어 디렉터는 스위치 내의 트래픽 흐름을 중단하지 않고 자유자재로 수퍼바이저(Supervisor) 모듈 및 스위칭 모듈 소프트웨어를 업그레이드할 수 있는 기능을 지원합니다. 이러한 업그레이드 중에 사용자는 2개의 수퍼바이저를 모두 업그레이드할 것인지 기본 수퍼바이저만 업그레이드할 것인지 선택할 수 있습니다. 이러한 기능을 사용하면 새 버전을 실행하는 동안 대기 수퍼바이저가 이전 버전의 코드를 유지할 수 있습니다. 새 버전의 코드에 문제가 생기면 이전 버전의 코드를 실행하는 대기 수퍼바이저를 통해 장애 복구가 수행됩니다. 그러므로 안정성이 확인된 이전 소프트웨어로 되돌아갈 수 있는 방법이 마련된 상태에서 소프트웨어를 업그레이드하는 최상의 유연성을 확보할 수 있습니다.


내부 프로세스 재시작


오류가 발생한 소프트웨어 프로세스를 다시 시작할 수 있는 기능은 Cisco MDS 9500 시리즈만의 매우 특별한 기능입니다. 수퍼바이저 모듈은 모든 소프트웨어 프로세스를 지속적으로 모니터링합니다. 특정 프로세스에 오류가 발생하면 수퍼바이저는 스위치의 트래픽 흐름을 중단하지 않고 해당 프로세스를 다시 시작할 수 있습니다. 이 기능을 통해 프로세스를 다시 시작할 수 있으면 수퍼바이저가 장애를 복구할 필요가 없으므로 안정성이 높아집니다. 프로세스를 다시 시작할 수 없거나 계속해서 오류가 발생하면 기본 수퍼바이저 모듈은 대기 수퍼바이저 모듈로 장애를 복구할 수 있습니다.


VSAN


오늘날 많은 SAN 설계자들은 여러 이유에서 스토리지 네트워크를 별도로 구축합니다. 이 경우 별도의 스토리지 네트워크는 스토리지를 호스트에 연결하는 데 사용된 물리적으로 완전히 분리된 스위치나 스위치 그룹을 의미합니다. 다음은 스토리지 네트워크를 별도로 구축하는 대표적인 몇 가지 이유입니다.

1. 고가용성 - 일반적인 방법은 여러 병렬 패브릭을 설치하고 물리적으로 분리된 병렬 패브릭에 '다중 접속(multi-homed)' 호스트와 디스크를 설치하는 것입니다. 이렇게 패브릭을 분리하는 주된 이유는 네임 서비스와 같은 여러 패브릭 서비스를 각 패브릭 간에 분리하기 위해서 입니다. 그러면 특정 패브릭 서비스에 오류가 발생해도 다른 병렬 패브릭에는 영향을 끼치지 않습니다. 이와 같은 병렬 패브릭을 통해 호스트에서 디스크로 연결되는 경로를 분리하여 사용할 수 있습니다.

2. 애플리케이션 패브릭 및 백업 패브릭 - 많은 고객이 스토리지 네트워크 환경에 최소한 2개의 물리적으로 분리된 패브릭을 설치합니다. 이러한 주된 이유는 한 패브릭은 애플리케이션 호스트 자체에 사용하고 다른 패브릭은 백업 환경에 사용하기 위해서입니다. 이 방법을 사용하면 백업 트래픽이 물리적으로 주 애플리케이션 트래픽과 분리됩니다.

3. 부서별 패브릭 - 많은 고객이 부서별 애플리케이션용으로 분리된 스토리지 네트워크 환경을 설치하는 것을 채택했습니다. 이 경우 분리된 작은 패브릭은 각 부서의 애플리케이션에 맞게 구현됩니다.

4. 동종 OS별 패브릭 - 일부 고객은 운영 체제에 따라 서로 다른 호스트용으로 패브릭을 분리하여 설치하는 방법을 따릅니다. 많은 고객은 운영 체제 본연의 특성과 각 운영 체제가 스토리지를 검색하고 사용하는 방법의 차이로 인해 별도의 패브릭으로 환경을 분리합니다. Sun Solaris 패브릭과 Windows NT/2000 패브릭을 예로 들 수 있습니다.

위의 이유들 각각은 분리된 패브릭을 설치하는 타당한 이유이기는 하지만 다소 비용이 들 수도 있습니다. 분리된 패브릭을 추가할수록 더 많은 하드웨어와 비용이 필요하게 되고 특히 사용하지 않는 하드웨어가 많아지게 됩니다.

시스코는 물리적으로 분리된 패브릭을 설치하는 추가 경비를 줄이면서 동일한 격리 환경을 구현할 수 있도록 Cisco MDS 9000 제품군에 VSAN(Virtual SAN)을 도입하였습니다. VSAN을 사용하면 동일한 물리적 인프라 위에 분리된 가상 패브릭을 만들 수 있습니다. 각각의 분리된 가상 패브릭은 ISL 링크의 하드웨어 기반 프레임 태그 지정 메커니즘을 사용하여 서로 분리됩니다. EISL 링크는 각 프레임에 추가된 태그 지정 정보를 포함하는 고급 ISL 링크이며, Cisco MDS 9000 제품군의 모든 스위치 제품을 상호 연결하는 링크상에서 지원됩니다. VSAN의 구성원은 물리적 포트를 기반으로 하며 하나의 물리적 포트는 둘 이상의 VSAN에 소속될 수 없습니다. 그러므로 물리적 포트에 연결되어 있는 노드는 해당 포트가 물려 있는 VSAN의 구성원이 됩니다.

VSAN은 매우 유연하게 사용할 수 있습니다. 예를 들어 Cisco MDS 9000 제품군의 제품들은 물리적 인프라당 1000개 이상의 VSAN을 지원합니다. 각 VSAN은 VSAN의 도달 범위를 제어하도록 EISL(Enhanced ISL) 링크에서 선택적으로 추가하거나 제거할 수 있습니다. 또한 특별한 트래픽 카운터가 제공되므로 VSAN마다 통계를 추적할 수 있습니다.

그러나 VSAN의 가장 뛰어난 특성은 고가용성 측면입니다. VSAN은 철저하게 하드웨어를 분리할 뿐만 아니라 각각의 새 VSAN에 대해 완벽하게 복제된 파이버 채널 서비스 세트를 제공합니다. 그러므로 새로운 VSAN이 만들어지면 네임 서버, 영역 서버, 도메인 컨트롤러, 앨리어스 서버, 로그인 서버를 비롯한 서비스 세트가 완벽하게 분리되어 만들어지며 이러한 서비스는 새로운 VSAN을 연결하도록 구성된 해당 스위치 전체에서 사용할 수 있게 됩니다. 이렇게 서비스를 복제하면 동일한 물리적 인프라 위에 존재하면서 고가용성(HA) 문제를 해결하는 데 필요한 분리된 환경을 구성할 수 있습니다. 예를 들어 VSAN1에 설치한 활성 영역 서비스 세트는 VSAN2 내의 패브릭에는 어떤 식으로도 영향을 주지 않습니다.

또한 VSAN은 일반적으로 인프라가 멀리 떨어져 있는 원격 데이터 센터 간의 분리된 패브릭을 상호 연결하는 방법을 제공합니다. 프레임 태그 지정은 하드웨어에서 수행되어 모든 EISL 프레임에 포함되므로 DWDM(Dense Wavelength Division Multiplexing: 고밀도 파장 분할 멀티플렉싱) 또는 CWDM(Coarse Wavelength Division Multiplexing: 저밀도 파장 분할 멀티플렉싱)과 같은 전송 방법으로 전송할 수 있습니다. 그러므로 여러 VSAN의 트래픽을 한 쌍의 파이버로 멀티플렉싱할 수 있고 더욱 먼 거리로 전송할 수 있으며 완벽하게 분리된 상태로 유지할 수 있습니다. VSAN은 고가용성(HA) 목표를 이루기 위해 일반적인 리던던시형의 물리적 인프라를 활용하여 유연하게 분리되는 패브릭을 구현함으로써 확장성의 수준을 새로운 차원으로 이끌었습니다.

그림 6



ISL PortChannel

파이버 채널 패브릭이 커질수록 포트 수 요건을 충족시키는 데 필요한 스위치 수가 점점 증가하게 됩니다. ISL을 사용하면 스위치 간의 연결이 용이해집니다. SAN의 다른 모든 연결과 마찬가지로 이 링크 역시 리던던시형이어야 합니다. 시스코의 PortChannel 기술을 통해 최대 16개의 독립적인 물리적 링크를 조합하여 두 스위치 사이에 하나의 논리적 ISL을 만들 수 있습니다. 이렇게 하면 두 스위치 간에 매우 탄력적인 논리적 링크가 생길 뿐만 아니라 최대 32Gbps의 대역폭을 사용할 수 있게 됩니다. 시스코 PortChannel 기술의 핵심적인 장점은 조합한 물리적 링크를 스위치의 모든 스위칭 모듈에 있는 모든 포트에 연결할 수 있다는 것입니다. 여러 스위칭 모듈에 걸쳐 물리적 링크를 연결하면 케이블 고장이나 GBIC(Gigabit Interface Converter) 고장과 같은 링크 장애뿐만 아니라 전체 스위칭 모듈 장애로부터 보호할 수 있습니다.

그림 7



Cisco MDS 9500 시리즈 멀티레이어 디렉터는 PortChannel에서 서로 다른 2개의 로드 밸런싱 알고리즘을 지원합니다. 첫 번째 알고리즘은 PortChannel에 진입하기 전에 프레임의 소스 및 수신지 FC_ID를 확인합니다. 해당 프레임 내의 소스 및 수신지 FC_ID로부터 하드웨어에 해시가 생성됩니다. 해시는 가상 링크에서 이 트래픽을 전송할 물리적 링크에 대한 인덱스로 사용됩니다. 해당 소스-수신지 FC_ID 쌍의 트래픽은 언제나 동일한 링크로 전송됩니다. 다른 소스-수신지 FC_ID 조합은 독립적으로 링크가 결정되며 동일한 링크로 전송될 수도 있고 전송되지 않을 수도 있습니다. 수신지에서 소스로의 트래픽은 수신지의 스위치가 링크 트래픽에 대해 독립적으로 결정을 내리므로 반드시 동일한 물리적 링크를 통해 전송되지는 않습니다. 이 알고리즘이 스위치의 기본값입니다.

Cisco MDS 9500 시리즈의 두 번째 알고리즘은 소스-수신지 FC_ID와 작업의 Exchange_ID(OX_ID, RX_ID)를 기반으로 하는 로드 밸런싱 알고리즘입니다. 모든 작업에는 새로운 Exchange_ID가 사용되며 새로운 물리적 링크가 결정됩니다. 이를 통해 동일한 소스 및 수신지 노드 사이에서라도 전체 PortChannel의 효율성이 극대화됩니다. 이 알고리즘을 사용하면 동일한 소스와 수신지에서 이루어지는 교환은 PortChannel의 링크 전체에서 분산될 수 있지만 어느 하나의 특정한 교환에 연관된 프레임은 모두 순서대로 유지됩니다.


역할 기반 보안


대체로 보안은 고가용성과 연관지어 검토할 사항은 아닙니다. 그러나 사람의 실수는 다운타임의 주요한 원인 중 한 가지이며, 사용자는 명령이 초래할 결과를 잘 인식하지 못한 상태에서 실수로 명령을 실행하는 경우가 종종 발생합니다. Cisco MDS 9000 제품군 멀티레이어 디렉터 및 패브릭 스위치는 역할 기반 보안 방법론을 지원하므로 인증된 사용자만 패브릭 내의 중요한 기능에 액세스할 수 있습니다. 각 사용자에는 group_ID라고 하는 역할이 할당되고 이 역할에는 패브릭 내에서의 지정된 액세스 수준이 지정됩니다. 액세스 수준은 특정 역할이 액세스할 수 있는 CLI(Command-Line Interface) 명령 구문 분석 트리의 명령 노드를 지정합니다. 그러므로 'no_debug'라는 역할을 만들면 이 역할에 할당된 사용자는 debug 명령을 제외한 모든 명령을 실행할 수 있습니다.

이러한 권한 시스템은 구문 분석 트리 내에서 2단계 깊이까지 세분화됩니다. 따라서 'no_debug_fspf'라는 역할도 정의할 수 있습니다. 이렇게 하면 사용자는 FSPF debug 명령을 제외한 다른 debug 명령을 비롯하여 모든 시스템 명령을 실행할 수 있습니다. CLI 명령을 사용하면 스위치 내에서 로컬로 역할을 정의하고 할당할 수 있습니다. 역할은 더욱 편리하게 관리할 수 있도록 RADIUS 서버에서 중앙 집중식으로 할당할 수도 있습니다. Network Administrator(전체 액세스) 및 Network Operator(읽기 전용 액세스)라는 기본 역할이 2개 제공됩니다. 사용자가 최대 64개까지 역할을 정의할 수 있습니다. 단 Network Administrator 역할을 가진 사용자만 새로운 역할을 만들 수 있습니다.

그림 8



요약

스토리지 네트워크에서 다운타임은 전체 비즈니스 인프라에 심각한 피해를 줄 수 있습니다. 이 피해는 연간 수백만 달러에 이르는 매출 손실을 초래할 수도 있습니다. 그러나 강력하고 매우 탄력적인 SAN(Storage Area Network)을 설계하면 다운타임을 크게 줄이거나 완전히 제거할 수 있습니다. Cisco MDS 9500 시리즈 멀티레이어 디렉터는 하드웨어 리던던시 및 안정성을 제공하여 하드웨어 동작 시간(uptime)을 99.999%로 향상시킵니다. 하드웨어 리던던시 이외에도 Cisco MDS 9500 시리즈가 제공하는 매우 탄력적인 소프트웨어는 스토리지 네트워크의 다운타임을 제거할 수 있도록 설계된 혁신적인 고가용성 기능을 갖추고 있습니다.

1 "Business Continuity When Disaster Strikes", Fibre Channel Industry Association, http://www.fibrechannel.com/technology/index.master.html


Cisco에 문의하세요