BIO到NIO、多路复用器, 从理论到实践, 结合实际案例对比各自效率与特点(下)

本篇文章是BIO到NIO、多路复用器, 从理论到实践, 结合实际案例对比各自效率与特点(上)的下一篇, 如果没有看的小伙伴, 可以先看下, 不然可能会不连贯.

多路复用器简介

多路复用器是对于传统NIO的优化, 解决了传统NIO无法直接获取所有所有连接的状态, 需要挨个遍历所有连接查看是否准备就绪的问题, 这种方式会涉及到很多次系统调用, 用户态和内核态的切换,效率不高.

那多路复用器是怎样优化的呢?
首先要明白 多路的路是谁-------->其实就是每个IO连接

每个路有没有数据谁知道呢-------->内核知道, 那既然内核自己知道某一时刻有哪些连接是有连接的, 是不是我们直接调用对应功能方法即可, 所以这里就有个多路复用器, 你调用这个多路复用器, 它就会给你返回所有的路的IO状态.

这个就可以通过一次系统调用,获取所有连接的IO状态的结果集
然后程序自己对有状态的(准备好的)连接进行读写,这样才是高性能

这里注意,多说一句, 只要程序自己读写数据, 你的IO模型就是同步的
在这里插入图片描述

多路复用器的两个阶段

多路复用器有两个阶段, 或者说是内核的两类实现, 这两类实现的最终目的都是一样的, 就是帮你返回所有IO连接的IO状态(是否可读), 但是实现细节有些许差别, 可以理解为epoll是select poll的升级版.

这里还是再提示下, 以下的两种实现讲的操作系统中的实现, 并不是Java中的方法.

  • select poll
    需要把所有IO连接存到一个集合中, 把这个集合传递拷贝给内核, 也就是调用select或者poll, 内核会把集合中准备就绪的连接给个特殊标识, 然后返回.
    这样程序就可以直接知道哪些连接是有状态的, 从而直接进行读取数据
    弊端:
    假如有1w个连接, 每次都需要把这个1w个连接拷贝给内核, 这个拷贝就是损耗点, 每次需要重复拷贝数据给内核.

  • epoll
    正是因为select, poll 有自身的弊端, 这才催生了epoll.
    优化
    以空间换时间, 开辟了内核空间, 缓存了应用程序的连接信息. 这样就不需要重复的拷贝数据.无损耗才是高性能.

    实现步骤
    1. 在一个linux机器上, 有很多的应用程序, 所以一个应用程序想要使用epoll的话, 首先需要在内核中 开辟空间------对应epoll_create系统调用
    2. 然后当连接创建后, 把这个连接加入到该空间------对应epoll_ctl(add)系统调用
    3. 然后才是进行询问, 看看有哪些IO连接准备就绪------对应epoll_wait系统调用

Java中的多路复用器封装

在java.nio的包下,封装了对于多路复用的实习和使用,也就是Selector类

Java中的Seletor底层用的是哪种实现? select poll 还是epoll?
Java其实会在运行的时候会动态的决定使用哪种实现, 因为它会调用固定的方法去启动多路复用器,即Selector.open, 你的程序可能跑在不同的内核之上, jdk会优先选择好的epoll, 但是如果没有epoll这个多路复用器的话,只有select或者poll, 也是可以正常运行的

主要使用方法介绍:
这里有三个主要的方法, 不管底层使用的是哪种实现, 都会调用这三个方法, 但是根据不同实现, 具体做的事情又不一样,区别如下:

  1. Selector.open
    启动多路复用器, 优先选择epoll, 没有的话选择select或者poll.
    如果是epoll的话, 需要在内核中开辟空间, 即调用epoll_create.
  2. register
    select、poll: 会在jvm里建一个数组, 把每个连接对应的文件描述符(fd4)都放进去.
    epoll: 则相当于调用内核方法epoll_ctl(add), 将该连接加入到内核空间, 直接由内核管理.
  3. select
    select、poll: 则会将jvm中的数组传给内核, 即调用select(fd4)或者poll(fd4)
    epoll: 相当于直接调用内核方法epol_wait, 直接询问内核

测试代码

服务端

import java.io.IOException;
import java.net.InetSocketAddress;
import java.nio.ByteBuffer;
import java.nio.channels.*;
import java.util.Iterator;
import java.util.Set;

/**
 * @ClassName:     
 * @Description:(描述这个类的作用)   
 * @author: 
 * @date:        
 *   
 */  
public class SelectorTest {

    private static ServerSocketChannel server=null;
    private static Selector selector;
    static int port=9090;
    static int count=5000;
    static long startTime;

    public static void initServer(){
        try {
            server = ServerSocketChannel.open();
            server.configureBlocking(false);
            server.bind(new InetSocketAddress(port));

            //这里会在编译期间自动选择 多路复用器的 实现
            //可能为select poll 也可能为epoll
            selector = Selector.open();
            server.register(selector, SelectionKey.OP_ACCEPT);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }


    public static void main(String[] args) {
        initServer();
        System.out.println("服务器启动了......");
        startTime = System.currentTimeMillis();
        try {
            flag:
            while (true){
                //select相当于询问内核有无数据可读取 或者 有无连接可建立
                //里面传入的参数是超时时间,传入0代表阻塞,一直等待有人建立连接或发送数据
                //如果传入的>0, 比如200, 则会最多等待200毫秒,有没有都会返回一个结果
                while(selector.select(0)>0){
                    //从多路复用器中取出所有有效的key
                    Set<SelectionKey> selectionKeys = selector.selectedKeys();
                    Iterator<SelectionKey> iterator = selectionKeys.iterator();
                    while(iterator.hasNext()){
                        SelectionKey key = iterator.next();
                        //获取之后要进行移除,否则会重复获取
                        iterator.remove();
                        //有新连接可建立
                        if(key.isAcceptable()){
                            acceptHander(key);
                        //可以进行读取
                        }else if(key.isReadable()){
                            readHander(key);
                        }
                    }
                    if(count <= 0){
                        System.out.println("处理5000个连接用时:"+(System.currentTimeMillis()-startTime)/1000+"s");
                        server.close();
                        selector.close();
                        break flag;
                    }
                }


            }
        }catch (Exception e){
            e.printStackTrace();
        }

    }

    private static void readHander(SelectionKey key) {
        //取出当前key所关联的客户端
        SocketChannel client = (SocketChannel) key.channel();
        //取出该客户端 对应的  buffer
        //这个buffer是我们建立连接时传进去和 channel一对一绑定的
        ByteBuffer buffer = (ByteBuffer) key.attachment();

        buffer.clear();
        int read=0;
        try {
            for(;;){
                //从channel中读取数据写入到buffer中
                read = client.read(buffer);
                if(read==0){
                    break;
                //这里可能有bug,客户端可能关掉,处理close_wait状态, 会一直监听到这个事件
                // 这里直接简单暴力的关掉
                }else if(read<0){
                    client.close();
                    break;
                }else{
                    //对于buffer,刚刚是写,现在进行读操作,调用flip
                    buffer.flip();

                    byte[] bytes = new byte[buffer.limit()];
                    buffer.get(bytes);

                    String str = new String(bytes);
                    System.out.println(client.socket().getRemoteSocketAddress()+" -->" +str);
                }

            }

        }catch (Exception e){
            e.printStackTrace();

        }


    }

    private static void acceptHander(SelectionKey key) {
        try {
            ServerSocketChannel channel = (ServerSocketChannel) key.channel();
            SocketChannel client = channel.accept();
            client.configureBlocking(false);
            ByteBuffer buffer = ByteBuffer.allocate(8192);
            //将这个新连接交给多路复用器去管理,后面多路复用器中才能监控这个连接, 在我们去获取的时候,给我们返回有状态的连接
            //同时这里将channel和buffer 一对一 进行绑定,可以很方便的往里写入, 或者 读出来
            client.register(selector, SelectionKey.OP_READ,buffer);
            System.out.println("add client port:"+client.socket().getPort());

            count--;


        } catch (IOException e) {
            e.printStackTrace();
        }

    }

}

测试使用的客户端代码还是和上篇文章中保持一致, 这里不再放了.

压测结果

以上所有说的都是理论, 而理论一定是需要实际结果来验证的, 我们这里就还是同样处理5000个连接, 并接收同样消息, 看看多路复用器的实际效果如何.
在这里插入图片描述

可以看到, 效果是非常非常明显的, 比BIO,NIO都要快太多了, 而且还代码还是单线程模型, 将其扩展成多线程, 效率将会更高.

总结

从BIO -> NIO -> 多路复用器, 我们分析了各自的缺点及演变过程, 并是实际结果对比了各自的效率, 相信你会更加印象深刻.

针对本文的测试结果总结如下:

在这里插入图片描述

今天的分享就到这里了,有问题可以在评论区留言,均会及时回复呀.
我是bling,未来不会太差,只要我们不要太懒就行, 咱们下期见.
在这里插入图片描述