Netty 之 Zero-copy 的實現（上）

sf_wangchong 發布于2019-08-15 12:23 / 3167人閱讀

摘要：維基百科中對的解釋是零拷貝技術是指計算機執行操作時，不需要先將數據從某處內存復制到另一個特定區域。維基百科里提到的零拷貝是在硬件和操作系統層面的，而本文主要介紹的是在應用層面的優化。

維基百科中對 Zero-copy 的解釋是

零拷貝技術是指計算機執行操作時，CPU不需要先將數據從某處內存復制到另一個特定區域。這種技術通常用于通過網絡傳輸文件時節省CPU周期和內存帶寬。

維基百科里提到的零拷貝是在硬件和操作系統層面的，而本文主要介紹的是Netty在應用層面的優化。不過需要注意的是，零拷貝并非字面意義上的沒有內存拷貝，而是避免多余的拷貝操作，即使是系統層的零拷貝也有從設備到內存，內存到設備的數據拷貝過程。

Netty 的零拷貝體現在以下幾個方面

ByteBuf 的 slice 操作并不會拷貝一份新的 ByteBuf 內存空間，而是直接借用原來的 ByteBuf ，只是獨立地保存讀寫索引。

Netty 提供了 CompositeByteBuf 類，可以將多個 ByteBuf 組合成一個邏輯上的 ByteBuf 。

Netty 的 FileRegion 中包裝了 NIO 的 FileChannel.transferTo()方法，該方法在底層系統支持的情況下會調用 sendfile 方法，從而在傳輸文件時避免了用戶態的內存拷貝。

Netty 的 PooledDirectByteBuf 等類中封裝了 NIO 的 DirectByteBuffer ，而 DirectByteBuffer 是直接在 jvm 堆外分配的內存，省去了堆外內存向堆內存拷貝的開銷。

下面來簡單介紹下這幾種方式。

slice

以下以 AbstractUnpooledSlicedByteBuf 為例講解 slice 的零拷貝原理，至于內存池化的實現 PooledSlicedByteBuf ，因為內存池要通過引用計數來控制內存的釋放，所以代碼里會出現很多與本文主題無關的邏輯，這里就不拿來舉栗子了。

// 切片ByteBuf的構造函數，其中字段adjustment為切片ByteBuf相對于被切片ByteBuf的偏移
// 量，兩個ByteBuf共用一塊內存空間,字段buffer為實際存儲數據的ByteBuf
AbstractUnpooledSlicedByteBuf(ByteBuf buffer, int index, int length) {
    super(length);
    checkSliceOutOfBounds(index, length, buffer);//檢查slice是否越界
    
    if (buffer instanceof AbstractUnpooledSlicedByteBuf) {
        // 如果被切片ByteBuf也是AbstractUnpooledSlicedByteBuf對象
        this.buffer = ((AbstractUnpooledSlicedByteBuf) buffer).buffer;
        adjustment = ((AbstractUnpooledSlicedByteBuf) buffer).adjustment + index;
    } else if (buffer instanceof DuplicatedByteBuf) {
        // 如果被切片ByteBuf為DuplicatedByteBuf對象，則
        // 用unwrap得到實際存儲數據的ByteBuf賦值buffer
        this.buffer = buffer.unwrap();
        adjustment = index;
    } else {
        // 如果被切片ByteBuf為一般ByteBuf對象，則直接賦值buffer
        this.buffer = buffer;
        adjustment = index;
    }

    initLength(length);
    writerIndex(length);
}

以上為 AbstractUnpooledSlicedByteBuf 類的構造函數，比較簡單，就不詳細介紹了。

下面來看看 AbstractUnpooledSlicedByteBuf 對 ByteBuf 接口的實現代碼，以 getBytes 方法為例：

@Override
public ByteBuf getBytes(int index, ByteBuffer dst) {
    checkIndex0(index, dst.remaining());//檢查是否越界
    unwrap().getBytes(idx(index), dst);
    return this;
}

@Override
public ByteBuf unwrap() {
    return buffer;
}

private int idx(int index) {
    return index + adjustment;
}

這是 AbstractUnpooledSlicedByteBuf 重載的 getBytes 方法，可以看到 AbstractUnpooledSlicedByteBuf 是直接在封裝的 ByteBuf 上取的字節，但是重新計算了索引，加上了相對偏移量。

CompositeByteBuf

在有些場景里，我們的數據會分散在多個 ByteBuf 上，但是我們又希望將這些 ByteBuf 聚合在一個 ByteBuf 里處理。這里最直觀的想法是將所有 ByteBuf 的數據拷貝到一個 ByteBuf 上，但是這樣會有大量的內存拷貝操作，產生很大的CPU開銷。

而 CompositeByteBuf 可以很好地解決這個問題，正如名字一樣，這是一個復合 ByteBuf ，內部由很多的 ByteBuf 組成，但 CompositeByteBuf 給它們做了一層封裝，可以直接以 ByteBuf 的接口操作它們。

/**
 * Precondition is that {@code buffer != null}.
 */
private int addComponent0(boolean increaseWriterIndex, int cIndex, ByteBuf buffer) {
    assert buffer != null;
    boolean wasAdded = false;
    try {
        // 檢查新增的component的索引是否合法
        checkComponentIndex(cIndex);

        // buffer的長度
        int readableBytes = buffer.readableBytes();

        // No need to consolidate - just add a component to the list.
        @SuppressWarnings("deprecation")
        // 統一為大端ByteBuf
        Component c = new Component(buffer.order(ByteOrder.BIG_ENDIAN).slice());
        if (cIndex == components.size()) {
            // 如果索引等于components的大小，則加在components尾部
            wasAdded = components.add(c);
            if (cIndex == 0) {
                // 如果components中只有一個元素
                c.endOffset = readableBytes;
            } else {
                // 如果components中有多個元素
                Component prev = components.get(cIndex - 1);
                c.offset = prev.endOffset;
                c.endOffset = c.offset + readableBytes;
            }
        } else {
            // 如果新的ByteBuf是插在components中間
            components.add(cIndex, c);
            wasAdded = true;
            if (readableBytes != 0) {
                // 如果components的大小不為0,則依次更新cIndex之后的
                // 所有components的offset和endOffset
                updateComponentOffsets(cIndex);
            }
        }
        if (increaseWriterIndex) {
            // 如果要更新writerIndex
            writerIndex(writerIndex() + buffer.readableBytes());
        }
        return cIndex;
    } finally {
        if (!wasAdded) {
            // 如果沒添加成功，則釋放ByteBuf
            buffer.release();
        }
    }
}

這是添加一個新的 ByteBuf 的邏輯，核心是 offset 和 endOffset ，分別指代一個 ByteBuf 在 CompositeByteBuf 中開始和結束的索引，它們唯一標記了這個 ByteBuf 在 CompositeByteBuf 中的位置。

弄清楚了這個，我們會發現上面的代碼無外乎做了兩件事：

把 ByteBuf 封裝成 Component 加到 components 合適的位置上

使 components 里的每個 Component 的 offset 和 endOffset 值都正確

下面來看看 CompositeByteBuf 對 ByteBuf 接口的實現代碼，同樣以 getBytes 方法為例：

@Override
public CompositeByteBuf getBytes(int index, ByteBuf dst, int dstIndex, int length) {
    // 查索引是否越界
    checkDstIndex(index, length, dstIndex, dst.capacity());
    if (length == 0) {
        return this;
    }

    // 用二分搜索查找index對應的Component在components中的索引
    int i = toComponentIndex(index);
    // 循環讀直至length為0
    while (length > 0) {
        Component c = components.get(i);
        ByteBuf s = c.buf;
        int adjustment = c.offset;
        // 取length和ByteBuf剩余字節數中的較小值
        int localLength = Math.min(length, s.capacity() - (index - adjustment));
        // 開始索引為index - c.offset，而不是0
        s.getBytes(index - adjustment, dst, dstIndex, localLength);
        index += localLength;
        dstIndex += localLength;
        length -= localLength;
        i ++;
    }
    return this;
}

/**
 * Return the index for the given offset
 */
public int toComponentIndex(int offset) {
    checkIndex(offset);

    for (int low = 0, high = components.size(); low <= high;) {
        int mid = low + high >>> 1;
        Component c = components.get(mid);
        if (offset >= c.endOffset) {
            low = mid + 1;
        } else if (offset < c.offset) {
            high = mid - 1;
        } else {
            return mid;
        }
    }

    throw new Error("should not reach here");
}

可以看到 CompositeByteBuf 在處理 index 時是先將其轉換成對應 Component 在 components 中的索引，以及在 Component 中的偏移，然后從這個 Component 的這個偏移開始，往后循環取字節，直到讀完。

NOTE：這里有個小trick，因為 components 是有序排列的，所以 toComponentIndex 做索引轉換時沒有直接遍歷，而是用的二分查找。

今天寫得有點累了，這里留個坑，下一篇再填上。

GPU云服務器云服務器 webrtc在qt上的實現服務器上開發代碼實現 Netty 云主機之游戲服務器的發展

文章版權歸作者所有，未經允許請勿轉載,若此文章存在違規行為，您可以聯系管理員刪除。

轉載請注明本文地址：http://specialneedsforspecialkids.com/yun/67904.html

Netty 之 Zero-copy 的實現（下）

摘要：系統調用返回，產生了第四次上下文切換?，F在這個方法不僅減少了上下文切換，而且消除了參與的數據拷貝。上一篇說到了 CompositeByteBuf ，這一篇接著上篇的講下去。 FileRegion 讓我們先看一個Netty官方的example // netty-netty-4.1.16.Finalexamplesrcmainjavaio ettyexamplefileFileServe...

endiat 2019-08-15 12:27 評論0 收藏0
對于 Netty ByteBuf 的零拷貝(Zero Copy) 的理解

摘要：根據對的定義即所謂的就是在操作數據時不需要將數據從一個內存區域拷貝到另一個內存區域因為少了一次內存的拷貝因此的效率就得到的提升在層面上的通常指避免在用戶態與內核態之間來回拷貝數據例如提供的系統調用它可以將一段用戶空間內存映射到內根據 Wiki 對 Zero-copy 的定義: Zero-copy describes computer operations in which the C...

ConardLi 2019-08-16 10:27 評論0 收藏0
Netty源碼解析

摘要：一旦某個事件觸發，相應的則會被調用，并進行處理。事實上，內部的連接處理協議編解碼超時等機制，都是通過完成的。開啟源碼之門理解了的事件驅動機制，我們現在可以來研究的各個模塊了。 Netty是什么大概用Netty的，無論新手還是老手，都知道它是一個網絡通訊框架。所謂框架，基本上都是一個作用：基于底層API，提供更便捷的編程模型。那么通訊框架到底做了什么事情呢？回答這個問題并不太容易，我們...

_Suqin 2019-08-19 11:41 評論0 收藏0
Netty 源碼分析之二貫穿Netty 的大動脈 ── ChannelPipeline (一)

摘要：目錄源碼之下無秘密做最好的源碼分析教程源碼分析之番外篇的前生今世的前生今世之一簡介的前生今世之二小結的前生今世之三詳解的前生今世之四詳解源碼分析之零磨刀不誤砍柴工源碼分析環境搭建源碼分析之一揭開神秘的紅蓋頭源碼分析之一揭開神秘的紅蓋頭客戶端目錄源碼之下無秘密 ── 做最好的 Netty 源碼分析教程 Netty 源碼分析之番外篇 Java NIO 的前生今世 Java NI...

tunny 2019-08-14 14:59 評論0 收藏0

發表評論

登陸后可評論

0條評論

sf_wangchong

男|高級講師

我要關注我要私信

TA的文章

#11.11#cloudcone，mc機房便宜美國VPS促銷，$11.11/年，1核/1G內存/40

閱讀 2785·2021-11-04 16:15
從小白程序員一路晉升為大廠高級技術專家我看過哪些書籍？（建議收藏）

閱讀 3458·2021-09-29 09:35
怎么修改手機主機名-如何修改華為手機主機名？

閱讀 4032·2021-09-22 15:45
如何使用BFC清除CSS浮動以及解決margin合并的問題

閱讀 1417·2019-08-30 15:55
純CSS實現表單驗證

閱讀 1689·2019-08-30 15:44
跨終端電商平臺的實現之移動端詳情頁多窗口切換（選項卡）效果實現

閱讀 2711·2019-08-29 12:56
JS數據結構與算法_集合&字典

閱讀 2698·2019-08-26 13:30
LeetCode 之 JavaScript 解答第69題 —— X 的平方根（Squrt(x)）

閱讀 2169·2019-08-23 17:00

国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務器低至59元/年，更有多臺、長期優惠，快來選購！

Netty 之 Zero-copy 的實現（上）

相關文章

Netty 之 Zero-copy 的實現（下）

**對于 Netty ByteBuf 的零拷貝(Zero Copy) 的理解**

Netty源碼解析

Netty 源碼分析之二貫穿Netty 的大動脈 ── ChannelPipeline (一)

發表評論

0條評論

sf_wangchong

男|高級講師

TA的文章

#11.11#cloudcone，mc機房便宜美國VPS促銷，$11.11/年，1核/1G內存/40

從小白程序員一路晉升為大廠高級技術專家我看過哪些書籍？（建議收藏）

怎么修改手機主機名-如何修改華為手機主機名？

如何使用BFC清除CSS浮動以及解決margin合并的問題

純CSS實現表單驗證

跨終端電商平臺的實現之移動端詳情頁多窗口切換（選項卡）效果實現

JS數據結構與算法_集合&字典

LeetCode 之 JavaScript 解答第69題 —— X 的平方根（Squrt(x)）

最新活動

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務器低至59元/年，更有多臺、長期優惠，快來選購！

Netty 之 Zero-copy 的實現（上）

相關文章

發表評論

0條評論

男|高級講師

TA的文章

最新活動

上云采購季！| 2核2G4M爆款云服務器低至59元/年，更有多臺、長期優惠，快來選購！