|
30歲學(xué)嵌入式_基于Nagle算法的嵌入式TCP協(xié)議,
隨著嵌入式系統(tǒng)的發(fā)展,在嵌入式系統(tǒng)中實(shí)現(xiàn)網(wǎng)絡(luò)連接已成為研究熱點(diǎn),廣泛使用的廉價(jià)8/ 16 位嵌入式處理器的性能不足與網(wǎng)絡(luò)協(xié)議的復(fù)雜構(gòu)成了尖銳的矛盾。 嵌入式Internet 技術(shù)的核心是在嵌入式系統(tǒng)中實(shí)現(xiàn)TCP/ IP 協(xié)議簇, TCP 協(xié)議的機(jī)制比較復(fù)雜,對8/ 16 位嵌入式處理器的存儲能力和運(yùn)算能力要求較高,必須進(jìn)行簡化。
本文提出了一種適用于8/ 16 位低速處理器的簡化TCP 協(xié)議。對其性能進(jìn)行分析發(fā)現(xiàn),在嵌入式網(wǎng)絡(luò)大量使用小數(shù)據(jù)包,造成網(wǎng)絡(luò)帶寬利用率低下并且容易造成網(wǎng)絡(luò)阻塞。 因此在簡化的TCP 協(xié)議中引入Nagle 算法,大幅度減少了嵌入式網(wǎng)絡(luò)中發(fā)送的小數(shù)據(jù)包個(gè)數(shù),提高了吞吐率,并減少了所需的帶寬。
簡化TCP 協(xié)議的提出
TCP 協(xié)議的數(shù)據(jù)傳輸分為3 個(gè)階段: 建立連接、傳輸數(shù)據(jù)和斷開連接,可以用狀態(tài)機(jī) 來實(shí)現(xiàn)。8/ 16 位嵌入式微控制器要完整實(shí)現(xiàn)這樣復(fù)雜的狀態(tài)機(jī)是十分困難的。在嵌入式系統(tǒng)中簡化TCP 的實(shí)現(xiàn)已有相關(guān)的研究,本文進(jìn)一步引入了Nagle 算法并且進(jìn)行了網(wǎng)絡(luò)模擬,給出了實(shí)驗(yàn)結(jié)果。
連接建立和斷開機(jī)制
TCP 建立連接有兩種方式:主動打開和被動打開。如果實(shí)現(xiàn)服務(wù)器端應(yīng)用,可以將TCP 狀態(tài)機(jī)的主動打開連接部分簡化掉。同理客戶端應(yīng)用,可以將狀態(tài)機(jī)的被動打開連接部分簡化掉。斷開連接也有兩種方式:主動斷開和被動斷開。其中被動斷開連接的處理較為簡單。但為了保證安全性,希望主動斷開連接。主動斷開連接簡化實(shí)現(xiàn)的方法是:發(fā)送一個(gè)Fin 數(shù)據(jù)報(bào),在接收到對Fin 數(shù)據(jù)報(bào)的確認(rèn)后,再發(fā)送一個(gè)Reset 數(shù)據(jù)報(bào),就可完成主動斷開連接。
以服務(wù)器端的TCP 連接為例,簡化后的TCP狀態(tài)機(jī)如圖1。
單TCP 連接
在8/ 16 位微控制器上實(shí)現(xiàn)簡化TCP 協(xié)議,無需實(shí)現(xiàn)多個(gè)TCP 連接,只需實(shí)現(xiàn)單個(gè)TCP 連接即可。
簡單確認(rèn)機(jī)制
嵌入式系統(tǒng)發(fā)送數(shù)據(jù)包不大,可以將TCP 協(xié)議的滑動窗口機(jī)制去掉,成為簡單確認(rèn)機(jī)制,只對單個(gè)數(shù)據(jù)報(bào)而不是批量數(shù)據(jù)發(fā)送確認(rèn)。實(shí)現(xiàn)方法是設(shè)置TCP 頭部windows 字段的大小為1 ,即可保證TCP協(xié)議雙方都使用簡單確認(rèn)。
僅計(jì)算發(fā)送TCP 報(bào)文的校驗(yàn)和
由于TCP 協(xié)議校驗(yàn)和的計(jì)算對系統(tǒng)存儲和計(jì)算資源的占用都比較多,可以省去對接收數(shù)據(jù)報(bào)校驗(yàn)和的計(jì)算,保留發(fā)送數(shù)據(jù)報(bào)TCP 校驗(yàn)和的計(jì)算。
簡化TCP 方案小結(jié)
在上述4 個(gè)方面的基礎(chǔ)上,在嵌入式處理器中實(shí)現(xiàn)了簡化的TCP 協(xié)議,程序流程如圖2。其中“不同狀態(tài)的相應(yīng)處理”指根據(jù)接收到的TCP 報(bào)文準(zhǔn)備待發(fā)送數(shù)據(jù)報(bào)并將其發(fā)送到以太網(wǎng)上。
簡化TCP 協(xié)議的性能分析
這種簡化的TCP 協(xié)議的性能可以通過在NS-2
網(wǎng)絡(luò)模擬器中進(jìn)行模擬實(shí)現(xiàn)。
通常在嵌入式的環(huán)境中,應(yīng)用層產(chǎn)生的數(shù)據(jù)包是很小的,經(jīng)常是每個(gè)包只有幾個(gè)、十幾、幾十個(gè)字節(jié)的數(shù)據(jù),這樣就產(chǎn)生了一個(gè)問題: TCP 協(xié)議的報(bào)頭開銷太大。假設(shè)數(shù)據(jù)僅有一個(gè)字節(jié),而TCP 的包頭有40 個(gè)字節(jié),這樣的數(shù)據(jù)報(bào)對底層網(wǎng)絡(luò)的利用率僅僅只有1/ 41 ,考慮到分組之間的間隙和網(wǎng)絡(luò)硬件組成幀還需要一些比特,實(shí)際的網(wǎng)絡(luò)利用率更低。 嵌入式系統(tǒng)的這種常見的小的數(shù)據(jù)包造成了網(wǎng)絡(luò)帶寬的極大浪費(fèi)。除了網(wǎng)絡(luò)利用率不高之外,還有另外一個(gè)問題是產(chǎn)生TCP 數(shù)據(jù)包數(shù)量極多,網(wǎng)關(guān)和路由器會由于這些極大數(shù)量的小數(shù)據(jù)包而發(fā)生阻塞。
組塊技術(shù)與其不足
通過以上分析,很自然的想到采用組塊技術(shù)(clumping) 把一定數(shù)量的數(shù)據(jù)包組成一個(gè)幀,這樣既能減小報(bào)頭開銷,又能減小TCP 數(shù)據(jù)包的數(shù)量,而且代碼量增加很少。但是,這樣組包會產(chǎn)生一個(gè)問題,TCP 在數(shù)據(jù)幀未達(dá)到一定大小之前不會傳輸數(shù)據(jù),這樣產(chǎn)生的延時(shí)會影響到數(shù)據(jù)的實(shí)時(shí)傳輸。因此,有必要對怎樣避免這種延時(shí)進(jìn)行研究。
Nagle 算法的由來
在因特網(wǎng)發(fā)展初期,由于bbs 和新聞組的流行,網(wǎng)絡(luò)上充斥著大量的telnet 產(chǎn)生的小的數(shù)據(jù)包,數(shù)量極大的這些數(shù)據(jù)包使得路由器和網(wǎng)關(guān)發(fā)生了嚴(yán)重的阻塞現(xiàn)象,這和嵌入式系統(tǒng)中的情形類似。JoneNagle 提出了一種算法來對付這種棘手的小數(shù)據(jù)包問題,后來被稱為Nagle 算法。
Nagle 算法與簡單的組包( clumping) 技術(shù)不同,它和慢啟動一樣使用自計(jì)時(shí)( self clocking) 、用確認(rèn)的到達(dá)來觸發(fā)其余數(shù)據(jù)的傳輸。因此它沒有引入額外的延時(shí),而且能有效地減少網(wǎng)絡(luò)上小數(shù)據(jù)包的流量。
Nagle 算法的描述
在一個(gè)連接上已經(jīng)傳輸?shù)臄?shù)據(jù)還沒有被確認(rèn)的情況下,發(fā)送方的應(yīng)用程序又生成了后續(xù)數(shù)據(jù),并照常將數(shù)據(jù)送到輸出緩沖區(qū)中,但這時(shí)并不發(fā)送后續(xù)報(bào)文段,而是等到有足夠的數(shù)據(jù)填滿一個(gè)達(dá)到最大長度的報(bào)文段之后再把緩沖區(qū)中的數(shù)據(jù)發(fā)送出去。
如果某個(gè)應(yīng)用程序每次僅產(chǎn)生一個(gè)八位組的數(shù)據(jù), TCP 會立即發(fā)送最初的那個(gè)八位組,但是在確認(rèn)到達(dá)之前, TCP 會把后續(xù)數(shù)據(jù)存入緩沖區(qū)中。因此當(dāng)應(yīng)用程序生成數(shù)據(jù)的速率比網(wǎng)絡(luò)的速率快很多時(shí)(如傳送文件) ,后續(xù)的報(bào)文段將包含大量的數(shù)據(jù),而當(dāng)應(yīng)用程序比網(wǎng)絡(luò)速度更慢時(shí)(如用戶敲鍵盤) ,就會發(fā)送較短的報(bào)文段而不必經(jīng)過長的延時(shí)。
Nagle 算法在嵌入式環(huán)境的適用性
在嵌入式系統(tǒng)的環(huán)境中,嵌入式TCP 協(xié)議會面臨著各種情況,比如一兩個(gè)開關(guān)量的傳輸,或者是傳感器數(shù)據(jù)實(shí)時(shí)的傳輸,而Nagle 算法能夠自動適應(yīng)網(wǎng)絡(luò)速率和應(yīng)用層數(shù)據(jù)流量的各種情況,因?yàn)樗且源_認(rèn)來觸發(fā)的自計(jì)時(shí)的協(xié)議。
網(wǎng)絡(luò)模擬
NS-2 是一個(gè)應(yīng)用于網(wǎng)絡(luò)研究的離散事件模擬器,它充分支持有線與無線網(wǎng)絡(luò)上對于TCP、路由和多播協(xié)議的模擬。它自問世以來受到學(xué)術(shù)界的充分信賴,成為設(shè)計(jì)和檢驗(yàn)新的協(xié)議和算法的權(quán)威網(wǎng)絡(luò)模擬測試平臺。
網(wǎng)絡(luò)模擬環(huán)境的構(gòu)建
圖3 是本文構(gòu)建的網(wǎng)絡(luò)模擬環(huán)境:節(jié)點(diǎn)0 使用本文提出的嵌入式TCP 協(xié)議發(fā)送數(shù)據(jù),節(jié)點(diǎn)1 使用用戶投文協(xié)議(UDP) 組播協(xié)議來發(fā)送大量的數(shù)據(jù),用于測試嵌入式TCP 協(xié)議在網(wǎng)絡(luò)阻塞情況下的性能,節(jié)點(diǎn)2 和節(jié)點(diǎn)3 之間是瓶頸路徑,模擬交換機(jī)之間的線路情況。[!--empirenews.page--]
嵌入式TCP 協(xié)議的性能指標(biāo)有吞吐量(throughp ut) ,即單位時(shí)間內(nèi)TCP 源節(jié)點(diǎn)發(fā)送的字節(jié)數(shù);延時(shí),即源節(jié)點(diǎn)的應(yīng)用層發(fā)出數(shù)據(jù)到目的節(jié)點(diǎn)應(yīng)用層接收到數(shù)據(jù)的時(shí)間量。
基于Nagle 的簡化TCP 協(xié)議的吞吐率
作為一個(gè)簡單確認(rèn)的TCP 協(xié)議,因?yàn)榇翱谑冀K是1 ,所以吞吐率( t hroughp ut ) 是恒定的,由于采用Nagle 算法,不再有大量小數(shù)據(jù)包產(chǎn)生,提高了吞吐率,提高的倍數(shù)約等于Internet 數(shù)據(jù)包最大值除以應(yīng)用層產(chǎn)生數(shù)據(jù)包大小。比如應(yīng)用層產(chǎn)生的數(shù)據(jù)包是10 byte ,那么吞吐率就提高了1000/ 10 = 100 倍。
如圖4 所示,接收到的數(shù)據(jù)是隨著時(shí)間線性增長的,也就是說吞吐率是恒定的。最高的曲線是采用Nagle 算法的簡化TCP 協(xié)議的吞吐率;最低的曲線是未采用Nagle 算法的簡化TCP 協(xié)議在同樣環(huán)境下的吞吐率;中間曲線為未經(jīng)過簡化的標(biāo)準(zhǔn)TCP 協(xié)議,因此可以從圖中看出,采用Nagle 算法明顯優(yōu)于其他兩種情況,并且大大改善了簡化TCP 的吞吐率。
基于Nagle 的簡化TCP 協(xié)議的響應(yīng)時(shí)間
再看看延時(shí)的問題,Nagle 算法會立即傳送最初的數(shù)據(jù),然后再以大吞吐量發(fā)送余下的數(shù)據(jù)。這就導(dǎo)致,第一,吞吐率大大增加,使得傳送數(shù)據(jù)更快;第二,產(chǎn)生的數(shù)據(jù)包數(shù)量減少,使得發(fā)生擁塞重傳的機(jī)會也減少。圖5 和6 中分別是標(biāo)準(zhǔn)TCP 協(xié)議的延時(shí)抖動(jit ter) 和采用Nagle 算法的TCP 協(xié)議的延時(shí)抖動。
圖6 曲線在開始的尖峰說明了在數(shù)據(jù)連接的開始Nagle 算法會立即發(fā)送接收到的小數(shù)據(jù)包,而接下來是將接收的大量的數(shù)據(jù)打成大包發(fā)送。圖6曲線的平滑情況說明了延時(shí)抖動很小,適合嵌入式系統(tǒng)中實(shí)時(shí)數(shù)據(jù)的傳輸。在同樣的模擬參數(shù)下,標(biāo)準(zhǔn)TCP 協(xié)議發(fā)送了大量的數(shù)據(jù)包(120 個(gè)) ,而采用Nagle 算法的簡化的TCP 協(xié)議發(fā)送了不到20 個(gè)數(shù)據(jù)包。顯而易見,采用Nagle 算法的簡化TCP 協(xié)議在吞吐率高的同時(shí)還節(jié)省了網(wǎng)絡(luò)的帶寬。
對該協(xié)議實(shí)用性的分析
網(wǎng)絡(luò)協(xié)議的實(shí)用性體現(xiàn)為,在惡劣的網(wǎng)絡(luò)環(huán)境(如數(shù)據(jù)丟失) 下,可以保持連接而且能夠恢復(fù)數(shù)據(jù)的傳輸。
前面已經(jīng)分析到,由于大大降低了網(wǎng)絡(luò)上小數(shù)據(jù)包的數(shù)量,降低了網(wǎng)絡(luò)帶寬的需求,使得基于Nagle 算法的TCP 協(xié)議比普通TCP 協(xié)議出現(xiàn)阻塞的可能性大大降低。
如果一旦網(wǎng)絡(luò)出現(xiàn)阻塞,會出現(xiàn)數(shù)據(jù)包的丟失。TCP 的數(shù)據(jù)發(fā)送方會接收到3 個(gè)重復(fù)的確認(rèn)(ACK) 信號,基于Nagle 算法的簡化TCP ,同樣執(zhí)行標(biāo)準(zhǔn)的重發(fā)數(shù)據(jù)的工作,重新發(fā)送丟失的數(shù)據(jù)包。由于發(fā)送窗口始終是1 ,則不存在“快速恢復(fù)”問題。
對該協(xié)議模擬的結(jié)果如圖7 所示:圖中橫坐標(biāo)是模擬時(shí)間,縱坐標(biāo)是數(shù)據(jù)包的序列號。上面兩條曲線是Tahoe TCP 的數(shù)據(jù)和確認(rèn),而下面兩條曲線是基于Nagle 的TCP 的數(shù)據(jù)和確認(rèn)。 圖中Tahoe TCP在慢啟動后的某個(gè)時(shí)刻,接收方收到了3 個(gè)相同的ACK確認(rèn)包,表示網(wǎng)絡(luò)出現(xiàn)了阻塞,而且傳送相同的數(shù)據(jù)Tahoe TCP 的帶寬占用比基于Nagle 的簡化TCP 大多了。而基于Nagle 的簡化TCP 卻并未阻塞。
由以上分析可見, 基于Nagle 算法的簡化的TCP 在數(shù)據(jù)傳輸方面是可靠的?梢詮V泛的在嵌入式TCP 中使用,并且與其他TCP 算法能夠完全兼容,而且能夠大幅度提高網(wǎng)絡(luò)性能,減少網(wǎng)絡(luò)阻塞,特別是在應(yīng)用層數(shù)據(jù)量比較小但數(shù)據(jù)包數(shù)量卻很多的情況下能夠大大改善數(shù)據(jù)的吞吐率和網(wǎng)絡(luò)占用率,是一種非常實(shí)用的算法。WindowsTM也在其Telnet 程序中使用了Nagle 算法。
基于Nagle 算法的TCP 協(xié)議由于算法簡單,性能優(yōu)秀,能夠勝任廣大的嵌入式Internet 的應(yīng)用領(lǐng)域包括:工業(yè)控制、智能家居、智能監(jiān)控、自動抄表,等等。該協(xié)議能夠應(yīng)用于實(shí)時(shí)性要求比較高的場合,但是如果實(shí)時(shí)性要求特別高而網(wǎng)絡(luò)帶寬富裕時(shí)則建議不采用Nagle 算法。
結(jié) 語
本文提出的基于Nagle 算法的簡化TCP 協(xié)議,大大減輕了微處理器的運(yùn)算負(fù)擔(dān)和系統(tǒng)的存儲空間,使得TCP 協(xié)議得以在普通8/ 16 位處理器上實(shí)采用了Nagle 算法,在不增加多少代碼的情況下,提高了協(xié)議的吞吐率、降低了協(xié)議的帶寬占用,在嵌入式應(yīng)用中其吞吐率甚至高于未簡化的標(biāo)準(zhǔn)TCP 協(xié)議。它的延時(shí)抖動基本是恒定的,非常適合嵌入式系統(tǒng)中的實(shí)時(shí)數(shù)據(jù)的傳輸。它發(fā)送少量的大數(shù)據(jù)包而不是大量的小數(shù)據(jù)包,從而節(jié)省了網(wǎng)絡(luò)帶寬;诒疚乃惴ǖ淖詣映矸桨敢呀(jīng)在浙大校園網(wǎng)、杭州網(wǎng)通、寧波網(wǎng)通、上海有線通等寬帶網(wǎng)絡(luò)下進(jìn)行了現(xiàn)場測試,測試結(jié)果符合設(shè)計(jì)要求。
該方案已經(jīng)被國內(nèi)多家電表生產(chǎn)企業(yè)所采納,并應(yīng)用于新型網(wǎng)絡(luò)電能表的生產(chǎn)上,這種網(wǎng)絡(luò)電能表可以方便地實(shí)現(xiàn)網(wǎng)絡(luò)化自動集抄系統(tǒng),這些系統(tǒng)已經(jīng)應(yīng)用在上海、杭州、寧波等地的電力部門中。同時(shí),基于本文方案的新型電能表以及其技術(shù)文件已經(jīng)向全國電工儀器儀表標(biāo)準(zhǔn)化技術(shù)委員會進(jìn)行了推薦和報(bào)批 |
|