2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
任何一個曾經(jīng)詛咒過計算機網(wǎng)絡(luò)的人都會因為它慢慢爬行而感到高興,他們會欣賞萊斯大學(xué)科學(xué)家提供的補救措施。
賴斯計算機科學(xué)家Eugene Ng及其團隊表示,當(dāng)故障不可避免地發(fā)生時,他們的解決方案將使數(shù)據(jù)保持在快速通道上。
Ng推出了ShareBackup,這種策略允許數(shù)據(jù)中心的共享備份交換機在軟件或硬件交換機 故障后的幾分之一秒內(nèi)接收網(wǎng)絡(luò)流量。
他將于本周在匈牙利布達(dá)佩斯召開的SIGCOMM 2018年會議上發(fā)表關(guān)于這項工作的同行評審文章。該論文在線并可供下載。
Ng表示,這個想法將解決數(shù)據(jù)專業(yè)人士,科學(xué)家以及依賴網(wǎng)絡(luò)日復(fù)一日地提供結(jié)果的所有人之間的共同煩惱。
“數(shù)據(jù)網(wǎng)絡(luò)由服務(wù)器和網(wǎng)絡(luò)交換機組成,”計算機科學(xué)與電氣和計算機工程教授Ng說。“交換機將數(shù)據(jù)包移動到他們需要去的地方。但事情就會失敗,特別是在擁有數(shù)千塊硬件的大型數(shù)據(jù)中心。”
對故障開關(guān)的通常響應(yīng)是將數(shù)據(jù)流分流到另一條線路。“一般來說,網(wǎng)絡(luò)有多條連接服務(wù)器的路徑,就像高速公路上有一個關(guān)閉一樣,我們會繞過它。這是一種傳統(tǒng)的,自然的方法很有意義:你繞過失敗的路線到達(dá)你需要去的地方。“
但有時候其他道路擁擠,一切都變慢了。“數(shù)據(jù)中心不是互聯(lián)網(wǎng);它們不是人們?yōu)g覽網(wǎng)站,”Ng說。“它們是支持?jǐn)?shù)據(jù)密集型應(yīng)用程序,如數(shù)據(jù)挖掘或機器學(xué)習(xí)。而且很多這些應(yīng)用程序都有嚴(yán)格的性能截止日期,因此盲目地重新路由流量可能是數(shù)據(jù)中心的錯誤做法。”
Ng實驗室的策略不是在整個網(wǎng)絡(luò)中安裝冗余交換機的昂貴選擇,而是將快速交換機和軟件置于戰(zhàn)略位置,以便在一微秒內(nèi)從故障交換機中獲取流量。解決該問題后,該團隊的軟件可以使備份交換機可用于處理其他故障。
交換機足夠快 - 故障恢復(fù)時間為0.73毫秒,包括來自硬件和控制系統(tǒng)的延遲 - 大多數(shù)用戶永遠(yuǎn)不會知道系統(tǒng)的一部分發(fā)生故障。
“現(xiàn)實情況是,在任何給定時間內(nèi)發(fā)生故障的設(shè)備的比例非常小,而且大多數(shù)故障都可以通過重啟設(shè)備來解決,”Ng說。“有時候軟件搞砸了,一個簡單的電源循環(huán)就會把它帶回來。這些故障可能也不會持久。
“這些是我們試圖利用的特征,”他說。“正因為如此,我們可以通過很少的設(shè)備來備份大量設(shè)備。”
Ng表示,ShareBackup可以節(jié)省數(shù)據(jù)中心的時間和金錢,不僅可以保持全部帶寬,還可以幫助分析問題,包括通常導(dǎo)致網(wǎng)絡(luò)故障的錯誤配置。
“我們的部分工作是幫助數(shù)據(jù)中心找出網(wǎng)絡(luò)出了什么問題,”他說。“激活備份后,您可以將故障設(shè)備從生產(chǎn)網(wǎng)絡(luò)中取出并進行測試,以確定導(dǎo)致問題的組件。
“現(xiàn)在,如果我們拿出兩個設(shè)備,無法弄清哪個設(shè)備壞了,兩個都需要更換,”他說。“很可能只有一個設(shè)備出現(xiàn)問題。我們的軟件可以半自動方式診斷這些設(shè)備,如果其中一個部件是好的,它可以恢復(fù)。”
2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。