Java NIO原理分析

這裡主要圍繞著Java NIO展開，從Java NIO的基本使用，到介紹Linux下NIO API，再到Java Selector其底層的實作原理。

Java NIO基本上使用
Linux下的NIO系統呼叫介紹
Selector原理
Channel與Buffer之間的堆外記憶體

#Java NIO基本上使用

從JDK NIO文件裡面可以發現， Java將其分割成了三大塊：Channel，Buffer#以及多路復用Selector。 Channel的存在，封裝了對什麼實體的連接通道（如網絡/文件）；Buffer封裝了對資料的緩衝存儲，最後對於Selector則是提供了一種可以以單線程非阻塞的方式，來處理多個連接。

基本應用範例

NIO的基本步驟是，建立Selector和ServerSocketChannel，然後註冊channel的ACCEPT事件，呼叫select方法，等待連線的到來，以及接收連線後將其註冊到Selector中。下面的為Echo Server的範例：

public class SelectorDemo {

    public static void main(String[] args) throws IOException {


        Selector selector = Selector.open();
        ServerSocketChannel socketChannel = ServerSocketChannel.open();
        socketChannel.bind(new InetSocketAddress(8080));
        socketChannel.configureBlocking(false);
        socketChannel.register(selector, SelectionKey.OP_ACCEPT);

        while (true) {
            int ready = selector.select();
            if (ready == 0) {
                continue;
            } else if (ready  keys = selector.selectedKeys();
            Iterator<selectionkey> iterator = keys.iterator();
            while (iterator.hasNext()) {

                SelectionKey key = iterator.next();
                if (key.isAcceptable()) {

                    ServerSocketChannel channel = (ServerSocketChannel) key.channel();
                    SocketChannel accept = channel.accept();
                    if (accept == null) {
                        continue;
                    }
                    accept.configureBlocking(false);
                    accept.register(selector, SelectionKey.OP_READ);
                } else if (key.isReadable()) {
                    // 读事件
                    deal((SocketChannel) key.channel(), key);
                } else if (key.isWritable()) {
                    // 写事件
                    resp((SocketChannel) key.channel(), key);
                }
                // 注：处理完成后要从中移除掉
                iterator.remove();
            }
        }
        selector.close();
        socketChannel.close();
    }

    private static void deal(SocketChannel channel, SelectionKey key) throws IOException {

        ByteBuffer buffer = ByteBuffer.allocate(1024);
        ByteBuffer responseBuffer = ByteBuffer.allocate(1024);

        int read = channel.read(buffer);

        if (read > 0) {
            buffer.flip();
            responseBuffer.put(buffer);
        } else if (read == -1) {
            System.out.println("socket close");
            channel.close();
            return;
        }

        key.interestOps(SelectionKey.OP_READ | SelectionKey.OP_WRITE);
        key.attach(responseBuffer);
    }

    private static void resp(SocketChannel channel, SelectionKey key) throws IOException {

        ByteBuffer buffer = (ByteBuffer) key.attachment();
        buffer.flip();

        channel.write(buffer);
        if (!buffer.hasRemaining()) {
            key.attach(null);
            key.interestOps(SelectionKey.OP_READ);
        }
    }
}</selectionkey>

Linux下的NIO系統呼叫介紹

在Linux環境下，提供了幾種方式可以實作NIO，如epoll，poll，select等。對於select/poll，每次調用，都是從外部傳入FD和監聽事件，這就導致每次調用的時候，都需要將這些資料從用戶態複製到內核態，就導致了每次調用代價比較大，而且每次從select/poll回傳回來，都是全量的數據，需要自行去遍歷檢查哪些是READY的。對於epoll，則為增量式的，系統內部維護了所需的FD和監聽事件，要註冊的時候，調用epoll_ctl即可，而每次調用，不再需要傳入了，返回的時候，只返回READY的監聽事件和FD。下面作個簡單的偽代碼：
具體的可以看以前的文章：

// 1. 创建server socket
// 2. 绑定地址
// 3. 监听端口
// 4. 创建epoll
int epollFd = epoll_create(1024);
// 5. 注册监听事件
struct epoll_event event;
event.events = EPOLLIN | EPOLLRDHUP | EPOLLET;
event.data.fd = serverFd;
epoll_ctl(epollFd, EPOLL_CTL_ADD, serverFd, &event);

while(true) {
    readyNums = epoll_wait( epollFd, events, 1024, -1 );
    
    if ( readyNums <h2 id="Selector原理">Selector原理</h2><h3 id="SelectionKey">SelectionKey</h3><p>從Java頂層使用者角度來看， channel透過註冊，返回SelectionKey，而Selector.select方法，也是透過返回SelectionKey來使用。那這裡為什麼會需要這個類別呢？這個類別有什麼作用？無論是任何語言，其實都脫離不了系統底層的支持，透過上述Linux下的基本應用，可以知道，透過系統調用，向其傳遞和返回的都是FD以及事件這些參數，那麼站在設計角度來看，就需要有一個映射關係，使得可以關聯起來，這裡有Channel封裝的是通過，如果將READY事件這些參數放在裡面，不太合適，這個時候，SelectionKey出現了，在SelectionKey內部，保存Channel的引用以及一些事件訊息，然後Selector透過FD找到SelectionKey來進行關聯。在底層<code>EP</code>裡面，就有一個屬性：<code>Map<integer> fdToKey</integer></code>。 </p><h3 id="EPollSelectorImpl">EPollSelectorImpl</h3><p>在Linux 2.6+版本，Java NIO採用的epoll（即<code>EPollSelectorImpl</code>類別），對於2.4.x的，則使用poll（即<code> PollSelectorImpl</code>類別）,這裡以epoll為例。 </p><h4 id="select方法">select方法</h4><p>頂層Selector，透過呼叫select方法，最終會呼叫到EPollSelectorImpl.doSelect方法，透過該方法，可以看到，其首先會處理一些不再註冊的事件，呼叫<code>pollWrapper.poll(timeout);</code>，然後再進行一次清理，最後，可以看到需要處理映射關係</p><pre class="brush:php;toolbar:false">protected int doSelect(long timeout)
    throws IOException
{
    if (closed)
        throw new ClosedSelectorException();
    // 处理一些不再注册的事件
    processDeregisterQueue();
    try {
        begin();
        pollWrapper.poll(timeout);
    } finally {
        end();
    }
    // 再进行一次清理
    processDeregisterQueue();
    int numKeysUpdated = updateSelectedKeys();
    if (pollWrapper.interrupted()) {
        // Clear the wakeup pipe
        pollWrapper.putEventOps(pollWrapper.interruptedIndex(), 0);
        synchronized (interruptLock) {
            pollWrapper.clearInterrupted();
            IOUtil.drain(fd0);
            interruptTriggered = false;
        }
    }
    return numKeysUpdated;
}


private int updateSelectedKeys() {
    int entries = pollWrapper.updated;
    int numKeysUpdated = 0;
    for (int i=0; i<entries><h3 id="EPollArrayWrapper">EPollArrayWrapper</h3>
<p>#EpollArrayWrapper封裝了底層的呼叫，裡麵包含幾個native方法，如：</p>
<pre class="brush:php;toolbar:false">private native int epollCreate();
private native void epollCtl(int epfd, int opcode, int fd, int events);
private native int epollWait(long pollAddress, int numfds, long timeout,
                             int epfd) throws IOException;

在openjdk的native目錄（native/sun/nio/ch）裡面可以找到對應的實作EPollArrayWrapper.c。
（這裡順帶提一下，要實作native方法，可以在類別裡的方法加上native關鍵字，然後編譯成class文件，再轉換輸出.h，c/c++底層實作該頭檔的方法，編譯成so函式庫，放到對應目錄即可）
在初始化檔方法裡面，可以看到，是透過動態解析載入進來的，最後呼叫的epoll_create等方法。

JNIEXPORT void JNICALL
Java_sun_nio_ch_EPollArrayWrapper_init(JNIEnv *env, jclass this)
{
    epoll_create_func = (epoll_create_t) dlsym(RTLD_DEFAULT, "epoll_create");
    epoll_ctl_func    = (epoll_ctl_t)    dlsym(RTLD_DEFAULT, "epoll_ctl");
    epoll_wait_func   = (epoll_wait_t)   dlsym(RTLD_DEFAULT, "epoll_wait");

    if ((epoll_create_func == NULL) || (epoll_ctl_func == NULL) ||
        (epoll_wait_func == NULL)) {
        JNU_ThrowInternalError(env, "unable to get address of epoll functions, pre-2.6 kernel?");
    }
}

Channel和Buffer之間的堆外內存

經常會聽見別人說，堆外內存容易洩漏，以及Netty框架裡面採用了堆外內存，減少拷貝提高性能。那麼這裡面的堆外記憶體指的是什麼?之前懷著一個好奇心，透過read方法，最後追蹤到SocketChannelImpl裡面read方法，裡面呼叫了IOUtil的read方法。裡面會先判斷傳入的Buffer是不是DirectBuffer，如果不是（則是HeapByteBuffer），則會建立一個暫時的DirectBuffer，然後再複製到堆內。 IOUtil.read方法：

static int read(FileDescriptor var0, ByteBuffer var1, long var2, NativeDispatcher var4, Object var5) throws IOException {
    if(var1.isReadOnly()) {
        throw new IllegalArgumentException("Read-only buffer");
    } else if(var1 instanceof DirectBuffer) {
        // 为堆外内存，则直接读取
        return readIntoNativeBuffer(var0, var1, var2, var4, var5);
    } else {
        // 为堆内内存，先获取临时堆外内存
        ByteBuffer var6 = Util.getTemporaryDirectBuffer(var1.remaining());

        int var8;
        try {
            // 读取到堆外内存
            int var7 = readIntoNativeBuffer(var0, var6, var2, var4, var5);
            var6.flip();
            if(var7 > 0) {
                // 复制到堆内
                var1.put(var6);
            }

            var8 = var7;
        } finally {
            // 释放临时堆外内存
            Util.offerFirstTemporaryDirectBuffer(var6);
        }

        return var8;
    }
}

这里有一个问题就是，为什么会需要DirectBuffer以及堆外内存？通过对DirectByteBuffer的创建来分析，可以知道，通过unsafe.allocateMemory(size);来分配内存的，而对于该方法来说，可以说是直接调用malloc返回，这一块内存是不受GC管理的，也就是所说的：堆外内存容易泄漏。但是对于使用DirectByteBuffer来说，会创建一个Deallocator，注册到Cleaner里面，当对象被回收的时候，则会被直接，从而释放掉内存，减少内存泄漏。要用堆外内存，从上面的创建来看，堆外内存创建后，以long型地址保存的，而堆内内存会受到GC影响，对象会被移动，如果采用堆内内存，进行系统调用的时候，那么GC就需要停止，否则就会有问题，基于这一点，采用了堆外内存（这一块参考了R大的理解：）。

注：堆外内存的创建（unsafe.cpp）：

// 仅仅作了对齐以及将长度放在数组前方就返回了
UNSAFE_ENTRY(jlong, Unsafe_AllocateMemory(JNIEnv *env, jobject unsafe, jlong size))
  UnsafeWrapper("Unsafe_AllocateMemory");
  size_t sz = (size_t)size;
  if (sz != (julong)size || size

以上是Java NIO原理分析與基本使用的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn