Service Provider 20호

Calculating New Routes Faster

"더 빨리 더 정확히"

라우팅 경로 최단 거리 파악 '시스코 IOS 소프트웨어'

필자는 시스코의 통신서비스 제공 업체 고객들과 정기적으로 함께 일하는 엔지니어이다. 그 동안의 경험으로 물리적인 회선과 장비가 항상 구동되는 것을 보장하는 것 이상으로 IP 네트워크의 높은 가용성 요구에 부응해야 한다는 것을 깨닫게 되었다.

하루는 고객 중 한 명이 차별화된 서비스 설계를 도입해 서비스 수준 협약(SLA)을 향상시키는데 성공하자 큰 만족감을 표시하면서, 라우팅 프로토콜의 성능을 향상시킬 수만 있다면 더 없이 좋을 것이라고 말했다.

그의 말은 무엇인가를 생각하게 만들었다. 이후 얼마 지난 뒤, 신속한 IS-IS 컨버전스(Fast IS-IS Convergence)라고 부르는 기능이 시스코 IOS 소프트웨어에 구현되었다. 이 소프트웨어의 향상 기능은 IS-IS(Intermediate System-to-Intermediate System) 내부 게이트웨이 프로토콜을 구동하는 네트워크의 통합 프로세스 시간을 단축시켜준다. 신속한 IS-IS 컨버전스를 구현한 일부 통신서비스 제공 업체들은 RIPE Network Coordination Center(유럽과 북부 아프리카 지역의 IP 주소 할당을 담당하는 Regional Internet Registry)에서 경험한 바를 제시하고 있다.

시스코 제품군에는 OSPF(Open Shortest Path First)와 같은 몇몇 다른 라우팅 프로토콜 역시 소프트웨어 향상판에 추가되었다. 하지만 여기에서는 IS-IS 알고리즘에서 이용할 수 있는 부분에 초점을 맞추기로 한다.

신속한 컨버전스 중요
물론, 컨버전스에서는 모든 네트워크 라우터가 네트워크에서 최적의 경로를 선택해 패킷을 전송하는 것이 중요하다. 인터페이스나 라우터 또는 서킷의 손실이나 추가와 같은 네트워크 이벤트는 네트워크를 통해 경로가 이용 가능한지 또는 이용 불가능한지, 라우터가 업데이트 메시지를 교환할 수 있는지를 결정짓는다. 이러한 메시지들은 네트워크 토폴로지의 변화를 고려한 최적의 경로를 다시 계산하도록 라우팅 알고리즘을 자극한다.

그 결과, 모든 라우터들이 새로운 정보를 토대로 '최적의' 경로에 동의하게 된다. 이후 개정된 hop-by-hop 경로 정보를 가진 라우팅 테이블을 업데이트한다. 이러한 테이블이 업데이트되면, 패킷이 새로운 경로를 따라 전송되기 시작한다.

네트워크 라우터가 최적의 경로를 빠르게 계산하면 할수록, 네트워크 성능이 향상된다. 반대로, 느리게 통합되는 라우팅 알고리즘은 라우팅 루프(loops)나 네트워크의 가용성에 악영향을 끼친다. 이는 고객의 SLA에 직결되는 성능 저하를 야기하며 특별한 프리미엄 서비스 도입에도 좋지 않다.

시스코 IOS 소프트웨어 12.0(27)S에서부터 탑재된 IS-IS 라우팅 프로토콜은 안정성에 영향을 주지 않고 1초 이내로 네트워크 변화를 수용할 수 있다. 일반적으로 IS-IS와 같은 내부 게이트웨이 프로토콜을 운영하는 다른 네트워크의 경우, 변화를 수용하는데 최고 30초가 소요된다(주: 이러한 IS-IS 솔루션은 시스코 IOS 소프트웨어 릴리즈 12.0(27)S와 시스코 12000 시리즈 라우터에 대한 통신서비스 제공 업체 요구 사항을 토대로 개발됐지만 시스코 7000 시리즈 플랫폼과 IOS 12.2S 및 12.3T 릴리즈와 관련된 기업용 디자인에서도 이용 가능하다).

30초에서 1초 이하로 컨버전스 시간을 줄이는 것은 매우 중요하며, VoIP와 같은 실시간 서비스를 성공적으로 지원하는 데에도 필수적이다. 무엇보다도 사람의 귀는 200ms 이상의 지연을 알아채며, 컨버전스 시간은 전체 지연 예산에도 큰 영향을 끼친다. 더욱 중요한 것은 몇 초 이상 계속되는 장애가 발생한다면 콜이 단절될 수 있다.


최적화 운영 방법
시스코 Fast IS-IS 컨버전스의 이점은 소스와 목적지 노드가 IS-IS 라우터에 있을 경우나 IS-IS 노드와 업스트림 BGP(Border Gateway Protocol) 노드 사이에 있을 경우 자율 시스템 내에서 달성될 수 있다. 또한 컨버전스의 이점은 BGP 노드의 다음 홉(hop) BGP 주변으로 확장될 수 있다. 시스코는 IS-IS 컨버전스 프로세스를 다음과 같이 몇 가지 방법으로 가속화하고 있다:

신속한 장애 탐지. 시스코 PoS(Packet-over-SONET)은 장애를 신속하게 탐지하고 IS-IS 프로토콜 신호를 보내기 때문에 10ms 이하로 장애를 탐지할 수 있다.

네트워크로의 신속한 장애 통보. 장애가 신속하게 발견된 다음에는 네트워크 전체에 대해 IS-IS 패킷에 내용이 담겨져 전파된다. 이를 통해 Flooding 코드는 홉당 10ms 이하로 프로세스를 제한할 수 있도록 최적화된다.

라우팅 테이블의 우선 순위별 업데이트. 통신서비스 제공 업체 백본은 수많은 IS-IS 프리픽스(prefix)를 전송하고 있다. 하지만 프리픽스의 일부만이 네트워크 운영에 중요하다. 라우팅 테이블에서 프리픽스의 수가 5000개라고 하더라도 가장 중요한 프리픽스는 500개도 채 안된다.

컨버전스를 촉진시키기 위해 시스코 IOS 소프트웨어는 패킷 목적지의 중요도에 따라 우선 순위를 배열하는 라우팅 테이블 프로세스를 사용한다. VoIP 목적지가 가장 먼저 업데이트된 다음, VPN과 인터넷 목적지 순으로 업데이트 된다. 현재 컨버전스는 훨씬 적은 수의 라우팅 테이블 엔트리를 업데이트하고 있다. 수치의 감소는 20배~30배까지 될 수 있기 때문에 라우팅 테이블 업데이트를 가속화하며 다운 시간을 감소시킨다.

재배포된 경로의 캐싱. 시스코의 IS-IS에 구현된 캐시는 다른 라우팅 프로토콜이나 IS-IS 레벨에서 다시 배포된 경로를 IS-IS에 의해 유지되는 로컬 재배포 캐시로 경로를 설정한다. 캐싱은 자동으로 이뤄지며 특별하게 구성할 필요가 없다.

새로운 네트워크 토폴로지의 계산 가속화. 장애가 통지되자마자 모든 라우터는 전체 토폴로지에서 딕스트라(Dijkstra) 알고리즘을 구동해 '최단거리의 경로 트리'를 계산해야 한다. 최신 시스코 경로 프로세서(시스코 12000 시리즈용 RPR-2 등)는 약 n*40ms로 최단거리 경로 트리를 계산하도록 시간을 설정한다. 여기에서 'n'은 토폴로지에 있는 노드 숫자이다. 1000개의 노드를 가진 네트워크의 경우, 각 네트워크 변경을 위해서는 CPU 계산을 약 40ms로 유지되도록 해야 한다. 시스코 IOS 소프트웨어에 있는 IS-IS Incremental Shortest Path First (Incremental SPF)를 사용할 경우, 라우터는 이전의 컨버전스 계산을 최대한 많이 보전시키면서 토폴로지 변경에 의해 영향을 받은 트리 부분만을 다시 계산한다. 토폴로지 변경이 컴퓨팅 노드에서 얼마나 많이 떨어져 있는가에 따라, SPF 알고리즘은 80~90%까지 계산을 줄여주며 일부는 계산을 피하기 위해 스마트 로직이 사용될 수 있다. 이는 최단 경로 계산 자체가 매우 짧은 시간의 컨버전스를 달성하는데 있어 그다지 중요하지 않다는 것이며, 전반적인 네트워크 성능과 안정성을 제공하도록 CPU를 활용하게 만들어줄 수 있음을 의미한다.

안정성 유지. 이러한 컨버전스의 향상 기능과 함께, 시스코 IOS 소프트웨어는 즉각적인 대응을 필요로 하며 안정성을 보전해야 하는 네트워크 이벤트를 자동으로 수용할 수 있는 지능형 기능을 제공한다. 이러한 메커니즘의 근간을 이루는 것은 전형적인 백오프(backoff) 타이머로, 이벤트에 대해 시스코 IOS 소프트웨어가 얼마나 빨리 반응하는지를 통제한다. 처음 반응은 거의 즉각적이지만 이러한 반복을 소프트웨어가 기록하게 되고, 자주 발생하게 되면 안정성을 유지하도록 IS-IS 반응을 자동으로 느리게 한다.

이러한 안정성 메커니즘의 활용에는 여러 요인이 있다. IP 이벤트를 줄이는 것(링크 오류에 대한 반응을 제어하고 부정적인 영향을 미치는 요인을 통제)과 SPF 계산을 위한 IS-IS 반응 타이머, 로컬 링크 상태 패킷(LSP) 생성을 위한 IS-IS 반응 타이머가 대표적이다.

비즈니스에 영향 커
안정성을 유지하면서 네트워크의 통합 시간을 줄이는 것은 IP 네트워크가 진정한 통합 네트워크로 거듭나도록 해주는 중요한 촉진 요소라고 할 수 있다. 진정한 통합 네트워크는 통신서비스 제공 업체들이 특정 성능 메트릭스를 보장할 수 있는 능력에 따라 성공이 좌우되는 VoIP와 같은 프리미엄 서비스 구현을 비롯해, 차별화할 수 있는 SLA, 네트워크 운영과 관리 비용의 절감 등을 포함한 비즈니스 목표에 대응할 수 있도록 해주는 네트워크 가용성(가동시간), 지연, 패킷 손실과 지터를 위해 일관되며 높은 성능의 서비스 메트릭스가 전제돼야 한다.

이러한 목표에 부응하는데 있어서 더 큰 요인은 가능한 오랫동안 네트워크의 가용성을 유지하고 패킷 전송이 지속되도록 보장하는 것이다. 시스코 IOS 소프트웨어의 Fast IS-IS 컨버전스는 안정성을 유지하면서 1초 이내로 IS-IS 네트워크의 통합 시간을 줄여줘 네트워크 성능을 최적화해준다.

라우터가 이러한 수준으로 통합할 수 있다면 전반적인 네트워크 서비스 수준을 향상시킬 수 있다. 특히 음성과 같은 실시간 네트워크 서비스 지원에 큰 도움이 될 수 있다.

필자 클라런스 필스필스(CLARENCE FILSFILS)는 시스코의 시스템 엔지니어로, 향상된 라우팅, QoS, 용량 기획과 인증 제어 기술 분야의 전문가이다. IP와 MPLS 네트워크를 위한 보호 기술의 표준화에 적극 나서고 있다. 이메일 주소는 cfilsfil@cisco.com이다.



추가자료



Cisco에 문의하세요



Packet 지난 호 보기