《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信與網(wǎng)絡(luò) > 業(yè)界動態(tài) > 割接時路由配置錯誤,,導(dǎo)致全網(wǎng)癱瘓

割接時路由配置錯誤,,導(dǎo)致全網(wǎng)癱瘓

2021-10-29
來源:物聯(lián)網(wǎng)智庫

  當(dāng)?shù)貢r間2021年10月25日11點20分開始,,韓國運營商KT的整個有線和無線互聯(lián)網(wǎng)服務(wù)在全國范圍內(nèi)發(fā)生中斷,,導(dǎo)致其所有客戶在大約一個小時內(nèi)無法連接互聯(lián)網(wǎng)和使用電話服務(wù)。

  同時,,因KT整網(wǎng)服務(wù)中斷,,還并發(fā)導(dǎo)致了韓國另外兩家運營商SKT和LG U+的網(wǎng)絡(luò)擁塞。

  可以說,,在這一個小時內(nèi),,韓國通信界遭遇了“至暗時刻”。

  10月26日,,KT官網(wǎng)以CEO的名義發(fā)布了公開致歉信,,并對事故原因進(jìn)行了確認(rèn)。

  信中表示,,對于引起這起重大網(wǎng)絡(luò)事故的原因,,最初估計是因外部DDoS攻擊導(dǎo)致,但最終確認(rèn)原因為:在更換路由器以升級網(wǎng)絡(luò)的時候,,因網(wǎng)絡(luò)路由設(shè)置錯誤導(dǎo)致,。

  路由設(shè)置錯誤,可能會導(dǎo)致數(shù)據(jù)流量流向不正確而引起局部節(jié)點負(fù)荷過載,,從而引發(fā)全網(wǎng)癱瘓,。

  看起來,與前幾天日本軟銀遭遇的網(wǎng)絡(luò)重大故障相似,,本次事故也是因割接導(dǎo)致,。

  盡管KT已公布故障原因,但并未進(jìn)行詳細(xì)解釋,,仍然給業(yè)界留下了不少謎團(tuán)…

  1.為何沒有自愈保護(hù),?

  電信網(wǎng)絡(luò)一直以高穩(wěn)定性、高可靠性著稱,,早在PSTN電話網(wǎng)絡(luò)時代,,網(wǎng)絡(luò)線路就設(shè)置了1+1保護(hù)或自愈保護(hù),主用線路在發(fā)生中斷后,通??稍?0ms內(nèi)自動切換到備用線路,,或從相反方向迂回連通。

  2018年11月,,因KT位于首爾Ahyeon區(qū)中心的電信大樓發(fā)生火災(zāi),,導(dǎo)致該地區(qū)網(wǎng)絡(luò)癱瘓,通信服務(wù)中斷了數(shù)天,。事后,,有韓國業(yè)內(nèi)人士質(zhì)疑,這可能是因為KT的網(wǎng)絡(luò)拓?fù)湓O(shè)計不夠先進(jìn),,設(shè)備和線路的冗余配置和自愈保護(hù)不夠完善導(dǎo)致,。他認(rèn)為,盡管KT的骨干匯聚網(wǎng)絡(luò)擁有充分的冗余配置和自愈保護(hù)機(jī)制,,但在昂貴而龐大的接入網(wǎng)部分,,冗余配置不夠充足,環(huán)狀自愈保護(hù)設(shè)計不夠完善,,從而導(dǎo)致了此次火災(zāi)后網(wǎng)絡(luò)長時間中斷,。

  但本次事故比2018年的火災(zāi)事故要嚴(yán)重得多,火災(zāi)事故影響范圍為一個區(qū)域,,而本次事故影響范圍為全國,。既然影響范圍這么廣,可以估計,,本次事故的故障點并非在網(wǎng)絡(luò)接入層,,而是在網(wǎng)絡(luò)骨干核心部分,這就好比“主動脈”阻塞,,導(dǎo)致全網(wǎng)的“血液”輸送不暢,。

  那問題是,難道KT的核心網(wǎng)絡(luò)也缺乏完善的自愈保護(hù)機(jī)制,?這顯然是不太可能的,。那是不是還有其他原因?

  2.是否因為BGP路由配置錯誤導(dǎo)致,?

  BGP路由錯誤會阻止數(shù)據(jù)包到達(dá)其預(yù)期的IP 地址和服務(wù)器而導(dǎo)致服務(wù)中斷,。聯(lián)想到最近 Facebook、Instagram和WhatsApp服務(wù)中斷均由BGP路由問題導(dǎo)致,,一些業(yè)內(nèi)人士推測可能是由于BGP配置錯誤導(dǎo)致,。

  3.為什么割接操作在白天進(jìn)行?

  為避免影響網(wǎng)絡(luò)業(yè)務(wù),,割接操作一般都在凌晨進(jìn)行,,這是電信業(yè)的常識,。但本次事故因“更換路由器以升級網(wǎng)絡(luò)”引起,且事故發(fā)生時間為白天,。難道有什么不得已的原因非要在白天11點進(jìn)行割接操作,?還是因為凌晨割接操作后,白天才發(fā)生了故障,?

  4.是設(shè)備問題還是人工操作失誤,?

  路由配置可能是自動化的,也可能是人工操作,,那到底是設(shè)備的問題,,還是人工操作失誤?

  不管是設(shè)備問題,,還是人為操作失誤,,還是缺乏備份系統(tǒng),一些韓國業(yè)內(nèi)人士表示,,這都反映了KT在網(wǎng)絡(luò)和流程管理上存在疏忽,。




1.png

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點,。轉(zhuǎn)載的所有的文章,、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者,。如涉及作品內(nèi)容,、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118,;郵箱:[email protected],。