簡單運維的OTN網(wǎng)絡詳解
OTN網(wǎng)絡引入城域后,運營商原有的SDH網(wǎng)絡運維人員面對的是全新的網(wǎng)絡結(jié)構(gòu)和復雜的業(yè)務模型。以傳統(tǒng)的經(jīng)驗,顯然難以支撐起OTN網(wǎng)絡的運維。
本文引用地址:http://butianyuan.cn/article/154829.htm隨著網(wǎng)絡技術(shù)和智能終端的發(fā)展,城域網(wǎng)中IP業(yè)務逐漸成為最大的業(yè)務類型,大顆粒業(yè)務需求也逐步增加。這種變化對城域傳送網(wǎng)提出了大容量、粗管道、IP化和高可靠的要求。OTN網(wǎng)絡由于對高帶寬承載的經(jīng)濟性,同時又能支持細顆粒業(yè)務靈活調(diào)度,成為打造超寬帶城域網(wǎng)的必然選擇。
OTN大量進入城域網(wǎng)絡后,原SDH運維人員面臨OTN網(wǎng)絡運維的挑戰(zhàn)。一方面是OTN網(wǎng)絡運維的工作量相對于SDH網(wǎng)絡有所增加。另一方面,OTN網(wǎng)絡的復雜度遠高于SDH網(wǎng)絡,從設備管理、業(yè)務發(fā)放、告警排障和資源管理各個方面都與SDH網(wǎng)絡有很大差異。運維人員以傳統(tǒng)的SDH運維經(jīng)驗,難以支撐OTN網(wǎng)絡運維。
OTN網(wǎng)絡運維復雜在哪里?
OTN網(wǎng)絡運維的復雜性,具體體現(xiàn)在以下四個方面:
設備內(nèi)部關(guān)系難以透視:傳統(tǒng)的SDH設備,基本上可以看作是一個黑盒,設備內(nèi)連纖簡單。而OTN設備內(nèi)部存在大量子架,并且子架內(nèi)部和外部都有光纖連接,不同連纖的信號流向都不一樣。發(fā)生故障的時候,無法判斷是內(nèi)部光纖還是外部光纖的問題。
業(yè)務層次多且參數(shù)配置復雜:SDH技術(shù)本質(zhì)上是對數(shù)據(jù)幀進行分插復用,只有一個層次業(yè)務模型。而OTN技術(shù)有6個層次業(yè)務模型,需要配置6個層面的業(yè)務。這就使得同樣配置一條業(yè)務,在SDH網(wǎng)絡上只需要2分鐘,而在OTN網(wǎng)絡上,需要花費20分鐘以上,OTN業(yè)務配置時間是SDH的10倍。
無效告警數(shù)量多且定位困難:OTN網(wǎng)絡的告警特別多,但很多都是無效告警,真正代表根因的有效告警隱藏在海量告警里面,識別和定位困難。OTN網(wǎng)絡包括6個層次,各層次都有獨立開銷,會產(chǎn)生相應告警,最終會導致無效告警數(shù)量很多,運營商難以定位出根源告警。比如,當一個物理光纖發(fā)生中斷時,光纖上面承載的所有業(yè)務都會受到影響而上報告警,這就使一個設備會產(chǎn)生上千條告警。如果要排除非根因告警,找到真正的故障原因,往往需要數(shù)小時甚至一天的時間。
資源利用率低且狀態(tài)不可知:在OTN網(wǎng)絡中,一般情況下,運營商對新業(yè)務發(fā)放和開通周期的期望是1周左右,但實際上新業(yè)務的開通周期往往超過2周。這是因為當新的業(yè)務發(fā)放時,運維人員首先需要了解網(wǎng)絡資源的使用情況,再進行規(guī)劃和部署。如果遇到資源不足,還需要臨時擴波或者擴容。
不僅如此,運維OTN網(wǎng)絡和SDH網(wǎng)絡的往往是同一個部門的運維人員。OTN網(wǎng)絡的復雜性,增加了原有SDH運維人員的學習成本,降低了運維效率。因此,如何使原SDH運維人員能平滑地過渡和勝任OTN網(wǎng)絡的運維是個業(yè)界難題。
讓OTN運維“SDH Like”
為解決這個問題,華為在OTN網(wǎng)絡運維上提出了“SDH Like”的運維理念,通過華為網(wǎng)管,讓OTN網(wǎng)絡的運維模式盡可能繼承SDH網(wǎng)絡的簡單運維方式,讓運維人員能平滑地運維好OTN網(wǎng)絡。
信號流圖揭秘OTN設備內(nèi)部玄機
針對OTN設備內(nèi)部結(jié)構(gòu)復雜的問題,網(wǎng)管通過信號流圖的方式呈現(xiàn)OTN內(nèi)部的數(shù)據(jù)流向,將OTN網(wǎng)元內(nèi)部各種單板/子架間的光纖連接、告警信息和波長信息清晰地呈現(xiàn)在運營商面前,使OTN網(wǎng)元像一個白盒,讓運營商可以充分掌握OTN設備內(nèi)部的業(yè)務配置,包括各個波長的走向。
有了信號流圖,OTN網(wǎng)元內(nèi)外部關(guān)系一覽無余,運維人員只需要在網(wǎng)管上點擊查看即可維護OTN網(wǎng)元,不需要頻繁到物理設備前去獲取相關(guān)信息。
K是荷蘭綜合運營商,其在城域部署了超過5000套的波分設備。對于K的運維人員來說,最頭疼的問題是光纖錯連或者單板插錯。一旦發(fā)生這種錯誤,排查效率低、業(yè)務中斷時間長,平均每月因為光纖錯連或者單板插錯導致業(yè)務中斷時間超過5個小時。使用了網(wǎng)管的信號流圖功能后,光纖錯連或者單板插錯事故基本消失。即使發(fā)生故障,只需要在網(wǎng)管界面上點擊查看即可快速定位,不再需要頻繁到物理設備面前去進行低效的排查工作。
和SDH統(tǒng)一風格的端到端業(yè)務調(diào)度
在用戶業(yè)務創(chuàng)建感知方面,網(wǎng)管能夠包裝簡化OTN業(yè)務模型,把OTN原來6個層次(OTS、OMS、Och、OTUk、ODUk、Client)的業(yè)務統(tǒng)一簡化成2個層次(Och、Client)。用戶只需要手工創(chuàng)建Och路徑和Client路徑,即可完成OTN的業(yè)務發(fā)放。
與SDH端到端的業(yè)務調(diào)度風格一致,OTN的業(yè)務層次經(jīng)過簡化以后,運維人員只需要在圖形化界面上點擊源和宿,中間路由和參數(shù)都通過自動計算完成。這樣,熟悉SDH端到端的運維人員能夠很快進行OTN的端到端運維。
L是北美最大的帶寬出租運營商,2011年L平均每月新開通波長業(yè)務150波,預計2012年平均每月新開通波長業(yè)務300波以上,平均每天要開通波長業(yè)務超過15條。由于太過復雜,L的運維人員按照OTN業(yè)務模型進行逐層配置,每天最多只能開通5條業(yè)務,開通速度跟不上業(yè)務發(fā)展速度,阻礙了L達成盈利目標。網(wǎng)管對OTN業(yè)務模型簡化以后,L的業(yè)務發(fā)放效率提高了6倍,每天業(yè)務開通數(shù)量超過30條,有力保障了其業(yè)務的迅速發(fā)展。
基于根因故障快速定位
通過對OTN 6個層次之間的關(guān)系進行分析,華為發(fā)現(xiàn)6個層次之間的告警存在關(guān)聯(lián)關(guān)系,從而能夠創(chuàng)建出OTN不同層次告警之間的相關(guān)性分析規(guī)則。按此原理,網(wǎng)管能夠提供對OTN網(wǎng)絡的根因故障分析,屏蔽非根因告警,過濾出根因告警。此外,網(wǎng)管還可以提供業(yè)務級告警分析功能,運營商可以據(jù)此快速判斷哪些告警影響了業(yè)務,從而優(yōu)先對影響業(yè)務的告警進行排障處理。
北歐主流運營商T一直采用OSS系統(tǒng)進行故障定位。當網(wǎng)絡發(fā)生故障的時候,告警上報給OSS系統(tǒng),運維人員通過OSS系統(tǒng)進行故障定位和排障。2010年,T將OTN引入城域網(wǎng)絡,網(wǎng)絡業(yè)務包括光層和ODUk等多個級別的電層業(yè)務。在網(wǎng)絡測試過程中,T發(fā)現(xiàn)當光層發(fā)生斷纖的時候,全網(wǎng)共有1000多條告警上報給OSS系統(tǒng),運維部門人員無法通過OSS系統(tǒng)定位是哪里出了問題,無法維護網(wǎng)絡。T采用網(wǎng)管后,由網(wǎng)管提供告警相關(guān)性分析抑制功能,先在網(wǎng)管對OTN網(wǎng)絡上報的告警進行分析過濾,從1000多條銳減到十幾條根因告警,然后再上報給OSS系統(tǒng)。這樣,T能夠像以前一樣,通過OSS系統(tǒng)快速定位出光纖中斷并且排障。
評論