30歲學(xué)嵌入式_基于Nagle算法的嵌入式TCP協(xié)議,
隨著嵌入式系統(tǒng)的發(fā)展,在嵌入式系統(tǒng)中實現(xiàn)網(wǎng)絡(luò)連接已成為研究熱點,廣泛使用的廉價8/ 16 位嵌入式處理器的性能不足與網(wǎng)絡(luò)協(xié)議的復(fù)雜構(gòu)成了尖銳的矛盾。 嵌入式Internet 技術(shù)的核心是在嵌入式系統(tǒng)中實現(xiàn)TCP/ IP 協(xié)議簇, TCP 協(xié)議的機制比較復(fù)雜,對8/ 16 位嵌入式處理器的存儲能力和運算能力要求較高,必須進行簡化。
本文提出了一種適用于8/ 16 位低速處理器的簡化TCP 協(xié)議。對其性能進行分析發(fā)現(xiàn),在嵌入式網(wǎng)絡(luò)大量使用小數(shù)據(jù)包,造成網(wǎng)絡(luò)帶寬利用率低下并且容易造成網(wǎng)絡(luò)阻塞。 因此在簡化的TCP 協(xié)議中引入Nagle 算法,大幅度減少了嵌入式網(wǎng)絡(luò)中發(fā)送的小數(shù)據(jù)包個數(shù),提高了吞吐率,并減少了所需的帶寬。
簡化TCP 協(xié)議的提出
TCP 協(xié)議的數(shù)據(jù)傳輸分為3 個階段: 建立連接、傳輸數(shù)據(jù)和斷開連接,可以用狀態(tài)機 來實現(xiàn)。8/ 16 位嵌入式微控制器要完整實現(xiàn)這樣復(fù)雜的狀態(tài)機是十分困難的。在嵌入式系統(tǒng)中簡化TCP 的實現(xiàn)已有相關(guān)的研究,本文進一步引入了Nagle 算法并且進行了網(wǎng)絡(luò)模擬,給出了實驗結(jié)果。
連接建立和斷開機制
TCP 建立連接有兩種方式:主動打開和被動打開。如果實現(xiàn)服務(wù)器端應(yīng)用,可以將TCP 狀態(tài)機的主動打開連接部分簡化掉。同理客戶端應(yīng)用,可以將狀態(tài)機的被動打開連接部分簡化掉。斷開連接也有兩種方式:主動斷開和被動斷開。其中被動斷開連接的處理較為簡單。但為了保證安全性,希望主動斷開連接。主動斷開連接簡化實現(xiàn)的方法是:發(fā)送一個Fin 數(shù)據(jù)報,在接收到對Fin 數(shù)據(jù)報的確認后,再發(fā)送一個Reset 數(shù)據(jù)報,就可完成主動斷開連接。
以服務(wù)器端的TCP 連接為例,簡化后的TCP狀態(tài)機如圖1。
單TCP 連接
在8/ 16 位微控制器上實現(xiàn)簡化TCP 協(xié)議,無需實現(xiàn)多個TCP 連接,只需實現(xiàn)單個TCP 連接即可。
簡單確認機制
嵌入式系統(tǒng)發(fā)送數(shù)據(jù)包不大,可以將TCP 協(xié)議的滑動窗口機制去掉,成為簡單確認機制,只對單個數(shù)據(jù)報而不是批量數(shù)據(jù)發(fā)送確認。實現(xiàn)方法是設(shè)置TCP 頭部windows 字段的大小為1 ,即可保證TCP協(xié)議雙方都使用簡單確認。
僅計算發(fā)送TCP 報文的校驗和
由于TCP 協(xié)議校驗和的計算對系統(tǒng)存儲和計算資源的占用都比較多,可以省去對接收數(shù)據(jù)報校驗和的計算,保留發(fā)送數(shù)據(jù)報TCP 校驗和的計算。
簡化TCP 方案小結(jié)
在上述4 個方面的基礎(chǔ)上,在嵌入式處理器中實現(xiàn)了簡化的TCP 協(xié)議,程序流程如圖2。其中“不同狀態(tài)的相應(yīng)處理”指根據(jù)接收到的TCP 報文準備待發(fā)送數(shù)據(jù)報并將其發(fā)送到以太網(wǎng)上。
簡化TCP 協(xié)議的性能分析
這種簡化的TCP 協(xié)議的性能可以通過在NS-2
網(wǎng)絡(luò)模擬器中進行模擬實現(xiàn)。
通常在嵌入式的環(huán)境中,應(yīng)用層產(chǎn)生的數(shù)據(jù)包是很小的,經(jīng)常是每個包只有幾個、十幾、幾十個字節(jié)的數(shù)據(jù),這樣就產(chǎn)生了一個問題: TCP 協(xié)議的報頭開銷太大。假設(shè)數(shù)據(jù)僅有一個字節(jié),而TCP 的包頭有40 個字節(jié),這樣的數(shù)據(jù)報對底層網(wǎng)絡(luò)的利用率僅僅只有1/ 41 ,考慮到分組之間的間隙和網(wǎng)絡(luò)硬件組成幀還需要一些比特,實際的網(wǎng)絡(luò)利用率更低。 嵌入式系統(tǒng)的這種常見的小的數(shù)據(jù)包造成了網(wǎng)絡(luò)帶寬的極大浪費。除了網(wǎng)絡(luò)利用率不高之外,還有另外一個問題是產(chǎn)生TCP 數(shù)據(jù)包數(shù)量極多,網(wǎng)關(guān)和路由器會由于這些極大數(shù)量的小數(shù)據(jù)包而發(fā)生阻塞。
組塊技術(shù)與其不足
通過以上分析,很自然的想到采用組塊技術(shù)(clumping) 把一定數(shù)量的數(shù)據(jù)包組成一個幀,這樣既能減小報頭開銷,又能減小TCP 數(shù)據(jù)包的數(shù)量,而且代碼量增加很少。但是,這樣組包會產(chǎn)生一個問題,TCP 在數(shù)據(jù)幀未達到一定大小之前不會傳輸數(shù)據(jù),這樣產(chǎn)生的延時會影響到數(shù)據(jù)的實時傳輸。因此,有必要對怎樣避免這種延時進行研究。
Nagle 算法的由來
在因特網(wǎng)發(fā)展初期,由于bbs 和新聞組的流行,網(wǎng)絡(luò)上充斥著大量的telnet 產(chǎn)生的小的數(shù)據(jù)包,數(shù)量極大的這些數(shù)據(jù)包使得路由器和網(wǎng)關(guān)發(fā)生了嚴重的阻塞現(xiàn)象,這和嵌入式系統(tǒng)中的情形類似。JoneNagle 提出了一種算法來對付這種棘手的小數(shù)據(jù)包問題,后來被稱為Nagle 算法。
Nagle 算法與簡單的組包( clumping) 技術(shù)不同,它和慢啟動一樣使用自計時( self clocking) 、用確認的到達來觸發(fā)其余數(shù)據(jù)的傳輸。因此它沒有引入額外的延時,而且能有效地減少網(wǎng)絡(luò)上小數(shù)據(jù)包的流量。
Nagle 算法的描述
在一個連接上已經(jīng)傳輸?shù)臄?shù)據(jù)還沒有被確認的情況下,發(fā)送方的應(yīng)用程序又生成了后續(xù)數(shù)據(jù),并照常將數(shù)據(jù)送到輸出緩沖區(qū)中,但這時并不發(fā)送后續(xù)報文段,而是等到有足夠的數(shù)據(jù)填滿一個達到最大長度的報文段之后再把緩沖區(qū)中的數(shù)據(jù)發(fā)送出去。
如果某個應(yīng)用程序每次僅產(chǎn)生一個八位組的數(shù)據(jù), TCP 會立即發(fā)送最初的那個八位組,但是在確認到達之前, TCP 會把后續(xù)數(shù)據(jù)存入緩沖區(qū)中。因此當應(yīng)用程序生成數(shù)據(jù)的速率比網(wǎng)絡(luò)的速率快很多時(如傳送文件) ,后續(xù)的報文段將包含大量的數(shù)據(jù),而當應(yīng)用程序比網(wǎng)絡(luò)速度更慢時(如用戶敲鍵盤) ,就會發(fā)送較短的報文段而不必經(jīng)過長的延時。
Nagle 算法在嵌入式環(huán)境的適用性
在嵌入式系統(tǒng)的環(huán)境中,嵌入式TCP 協(xié)議會面臨著各種情況,比如一兩個開關(guān)量的傳輸,或者是傳感器數(shù)據(jù)實時的傳輸,而Nagle 算法能夠自動適應(yīng)網(wǎng)絡(luò)速率和應(yīng)用層數(shù)據(jù)流量的各種情況,因為它是以確認來觸發(fā)的自計時的協(xié)議。
網(wǎng)絡(luò)模擬
NS-2 是一個應(yīng)用于網(wǎng)絡(luò)研究的離散事件模擬器,它充分支持有線與無線網(wǎng)絡(luò)上對于TCP、路由和多播協(xié)議的模擬。它自問世以來受到學(xué)術(shù)界的充分信賴,成為設(shè)計和檢驗新的協(xié)議和算法的權(quán)威網(wǎng)絡(luò)模擬測試平臺。
網(wǎng)絡(luò)模擬環(huán)境的構(gòu)建
圖3 是本文構(gòu)建的網(wǎng)絡(luò)模擬環(huán)境:節(jié)點0 使用本文提出的嵌入式TCP 協(xié)議發(fā)送數(shù)據(jù),節(jié)點1 使用用戶投文協(xié)議(UDP) 組播協(xié)議來發(fā)送大量的數(shù)據(jù),用于測試嵌入式TCP 協(xié)議在網(wǎng)絡(luò)阻塞情況下的性能,節(jié)點2 和節(jié)點3 之間是瓶頸路徑,模擬交換機之間的線路情況。[!--empirenews.page--]
嵌入式TCP 協(xié)議的性能指標有吞吐量(throughp ut) ,即單位時間內(nèi)TCP 源節(jié)點發(fā)送的字節(jié)數(shù);延時,即源節(jié)點的應(yīng)用層發(fā)出數(shù)據(jù)到目的節(jié)點應(yīng)用層接收到數(shù)據(jù)的時間量。
基于Nagle 的簡化TCP 協(xié)議的吞吐率
作為一個簡單確認的TCP 協(xié)議,因為窗口始終是1 ,所以吞吐率( t hroughp ut ) 是恒定的,由于采用Nagle 算法,不再有大量小數(shù)據(jù)包產(chǎn)生,提高了吞吐率,提高的倍數(shù)約等于Internet 數(shù)據(jù)包最大值除以應(yīng)用層產(chǎn)生數(shù)據(jù)包大小。比如應(yīng)用層產(chǎn)生的數(shù)據(jù)包是10 byte ,那么吞吐率就提高了1000/ 10 = 100 倍。
如圖4 所示,接收到的數(shù)據(jù)是隨著時間線性增長的,也就是說吞吐率是恒定的。最高的曲線是采用Nagle 算法的簡化TCP 協(xié)議的吞吐率;最低的曲線是未采用Nagle 算法的簡化TCP 協(xié)議在同樣環(huán)境下的吞吐率;中間曲線為未經(jīng)過簡化的標準TCP 協(xié)議,因此可以從圖中看出,采用Nagle 算法明顯優(yōu)于其他兩種情況,并且大大改善了簡化TCP 的吞吐率。
基于Nagle 的簡化TCP 協(xié)議的響應(yīng)時間
再看看延時的問題,Nagle 算法會立即傳送最初的數(shù)據(jù),然后再以大吞吐量發(fā)送余下的數(shù)據(jù)。這就導(dǎo)致,第一,吞吐率大大增加,使得傳送數(shù)據(jù)更快;第二,產(chǎn)生的數(shù)據(jù)包數(shù)量減少,使得發(fā)生擁塞重傳的機會也減少。圖5 和6 中分別是標準TCP 協(xié)議的延時抖動(jit ter) 和采用Nagle 算法的TCP 協(xié)議的延時抖動。
圖6 曲線在開始的尖峰說明了在數(shù)據(jù)連接的開始Nagle 算法會立即發(fā)送接收到的小數(shù)據(jù)包,而接下來是將接收的大量的數(shù)據(jù)打成大包發(fā)送。圖6曲線的平滑情況說明了延時抖動很小,適合嵌入式系統(tǒng)中實時數(shù)據(jù)的傳輸。在同樣的模擬參數(shù)下,標準TCP 協(xié)議發(fā)送了大量的數(shù)據(jù)包(120 個) ,而采用Nagle 算法的簡化的TCP 協(xié)議發(fā)送了不到20 個數(shù)據(jù)包。顯而易見,采用Nagle 算法的簡化TCP 協(xié)議在吞吐率高的同時還節(jié)省了網(wǎng)絡(luò)的帶寬。
對該協(xié)議實用性的分析
網(wǎng)絡(luò)協(xié)議的實用性體現(xiàn)為,在惡劣的網(wǎng)絡(luò)環(huán)境(如數(shù)據(jù)丟失) 下,可以保持連接而且能夠恢復(fù)數(shù)據(jù)的傳輸。
前面已經(jīng)分析到,由于大大降低了網(wǎng)絡(luò)上小數(shù)據(jù)包的數(shù)量,降低了網(wǎng)絡(luò)帶寬的需求,使得基于Nagle 算法的TCP 協(xié)議比普通TCP 協(xié)議出現(xiàn)阻塞的可能性大大降低。
如果一旦網(wǎng)絡(luò)出現(xiàn)阻塞,會出現(xiàn)數(shù)據(jù)包的丟失。TCP 的數(shù)據(jù)發(fā)送方會接收到3 個重復(fù)的確認(ACK) 信號,基于Nagle 算法的簡化TCP ,同樣執(zhí)行標準的重發(fā)數(shù)據(jù)的工作,重新發(fā)送丟失的數(shù)據(jù)包。由于發(fā)送窗口始終是1 ,則不存在“快速恢復(fù)”問題。
對該協(xié)議模擬的結(jié)果如圖7 所示:圖中橫坐標是模擬時間,縱坐標是數(shù)據(jù)包的序列號。上面兩條曲線是Tahoe TCP 的數(shù)據(jù)和確認,而下面兩條曲線是基于Nagle 的TCP 的數(shù)據(jù)和確認。 圖中Tahoe TCP在慢啟動后的某個時刻,接收方收到了3 個相同的ACK確認包,表示網(wǎng)絡(luò)出現(xiàn)了阻塞,而且傳送相同的數(shù)據(jù)Tahoe TCP 的帶寬占用比基于Nagle 的簡化TCP 大多了。而基于Nagle 的簡化TCP 卻并未阻塞。
由以上分析可見, 基于Nagle 算法的簡化的TCP 在數(shù)據(jù)傳輸方面是可靠的?梢詮V泛的在嵌入式TCP 中使用,并且與其他TCP 算法能夠完全兼容,而且能夠大幅度提高網(wǎng)絡(luò)性能,減少網(wǎng)絡(luò)阻塞,特別是在應(yīng)用層數(shù)據(jù)量比較小但數(shù)據(jù)包數(shù)量卻很多的情況下能夠大大改善數(shù)據(jù)的吞吐率和網(wǎng)絡(luò)占用率,是一種非常實用的算法。WindowsTM也在其Telnet 程序中使用了Nagle 算法。
基于Nagle 算法的TCP 協(xié)議由于算法簡單,性能優(yōu)秀,能夠勝任廣大的嵌入式Internet 的應(yīng)用領(lǐng)域包括:工業(yè)控制、智能家居、智能監(jiān)控、自動抄表,等等。該協(xié)議能夠應(yīng)用于實時性要求比較高的場合,但是如果實時性要求特別高而網(wǎng)絡(luò)帶寬富裕時則建議不采用Nagle 算法。
結(jié) 語
本文提出的基于Nagle 算法的簡化TCP 協(xié)議,大大減輕了微處理器的運算負擔和系統(tǒng)的存儲空間,使得TCP 協(xié)議得以在普通8/ 16 位處理器上實采用了Nagle 算法,在不增加多少代碼的情況下,提高了協(xié)議的吞吐率、降低了協(xié)議的帶寬占用,在嵌入式應(yīng)用中其吞吐率甚至高于未簡化的標準TCP 協(xié)議。它的延時抖動基本是恒定的,非常適合嵌入式系統(tǒng)中的實時數(shù)據(jù)的傳輸。它發(fā)送少量的大數(shù)據(jù)包而不是大量的小數(shù)據(jù)包,從而節(jié)省了網(wǎng)絡(luò)帶寬。基于本文算法的自動抄表方案已經(jīng)在浙大校園網(wǎng)、杭州網(wǎng)通、寧波網(wǎng)通、上海有線通等寬帶網(wǎng)絡(luò)下進行了現(xiàn)場測試,測試結(jié)果符合設(shè)計要求。
該方案已經(jīng)被國內(nèi)多家電表生產(chǎn)企業(yè)所采納,并應(yīng)用于新型網(wǎng)絡(luò)電能表的生產(chǎn)上,這種網(wǎng)絡(luò)電能表可以方便地實現(xiàn)網(wǎng)絡(luò)化自動集抄系統(tǒng),這些系統(tǒng)已經(jīng)應(yīng)用在上海、杭州、寧波等地的電力部門中。同時,基于本文方案的新型電能表以及其技術(shù)文件已經(jīng)向全國電工儀器儀表標準化技術(shù)委員會進行了推薦和報批 |