零拷贝基本介绍
 零拷贝是网络编程的关键,很多性能优化都离不开。
所谓零拷贝不是不拷贝,而是没有CPU拷贝。
在 Java 程序中,常用的零拷贝有mmap(内存映射)和sendFile。那么,他们在 OS 里,到底是怎么样的一个的设计?我们分析 mmap 和 sendFile 这两个零拷贝
Java 传统 IO 和 网络编程的一段代码

传统 IO 模型

DMA: direct memory access 直接内存拷贝(不使用 CPU)
传统IO经过了4次拷贝,4次切换。
mmap优化
mmap 通过内存映射,将文件映射到内核缓冲区,同时,用户空间可以共享内核空间的数据。这样,在进行网络传输时,就可以减少内核空间到用户空间的拷贝次数。如下图

mmap优化后3次拷贝,4次切换。
sendFile优化
Linux 2.1 版本 提供了sendFile函数,其基本原理如下:数据根本不经过用户态,直接从内核缓冲区进入到Socket Buffer,同时,由于和用户态完全无关,就减少了一次上下文切换

此时的拷贝次数为3.切换次数为3。但是还是存在cpy拷贝。
Linux 在 2.4 版本中,做了一些修改,避免了从内核缓冲区拷贝到 Socket buffer 的操作,直接拷贝到协议栈,从而再一次减少了数据拷贝。具体如下图和小结:

3次切换,2次拷贝。
这里其实有一次cpu拷贝kernel buffer -> socket buffer。但是,拷贝的信息很少,比如 lenght , offset , 消耗低,可以忽略。
我们说零拷贝,是从操作系统的角度来说的。因为内核缓冲区之间,没有数据是重复的(只有 kernel buffer 有一份数据)。零拷贝不仅仅带来更少的数据复制,还能带来其他的性能优势,例如更少的上下文切换,更少的 CPU 缓存伪共享以及无 CPU 校验和计算。
mmap和sendFile的区别
- mmap 适合小数据量读写,sendFile 适合大文件传输。
- mmap 需要 4 次上下文切换,3 次数据拷贝;sendFile 需要 3 次上下文切换,最少 2 次数据拷贝。
- sendFile 可以利用 DMA 方式,减少 CPU 拷贝,mmap 则不能(必须从内核拷贝到 Socket 缓冲区)。
NIO零拷贝案例
NIO通过transferTo() 方法和transferFrom()方法实现零拷贝
传统IO
| 12
 3
 4
 5
 6
 7
 8
 9
 10
 11
 12
 13
 14
 15
 16
 17
 18
 19
 20
 21
 22
 23
 24
 25
 26
 27
 
 | public class OldIOServer {
 
 public static void main(String[] args) throws Exception {
 ServerSocket serverSocket = new ServerSocket(7001);
 
 while (true) {
 Socket socket = serverSocket.accept();
 DataInputStream dataInputStream = new DataInputStream(socket.getInputStream());
 
 try {
 byte[] byteArray = new byte[4096];
 
 while (true) {
 int readCount = dataInputStream.read(byteArray, 0, byteArray.length);
 
 if (-1 == readCount) {
 break;
 }
 }
 } catch (Exception ex) {
 ex.printStackTrace();
 }
 }
 }
 }
 
 
 | 
| 12
 3
 4
 5
 6
 7
 8
 9
 10
 11
 12
 13
 14
 15
 16
 17
 18
 19
 20
 21
 22
 23
 24
 25
 26
 27
 28
 
 | public class OldIOClient {
 public static void main(String[] args) throws Exception {
 Socket socket = new Socket("localhost", 7001);
 
 String fileName = "protoc-3.6.1-win32.zip";
 InputStream inputStream = new FileInputStream(fileName);
 
 DataOutputStream dataOutputStream = new DataOutputStream(socket.getOutputStream());
 
 byte[] buffer = new byte[4096];
 long readCount;
 long total = 0;
 
 long startTime = System.currentTimeMillis();
 
 while ((readCount = inputStream.read(buffer)) >= 0) {
 total += readCount;
 dataOutputStream.write(buffer);
 }
 
 System.out.println("发送总字节数: " + total + ", 耗时: " + (System.currentTimeMillis() - startTime));
 
 dataOutputStream.close();
 socket.close();
 inputStream.close();
 }
 }
 
 | 

NIO零拷贝
| 12
 3
 4
 5
 6
 7
 8
 9
 10
 11
 12
 13
 14
 15
 16
 17
 18
 19
 20
 21
 22
 23
 24
 25
 26
 27
 28
 29
 30
 31
 32
 33
 34
 
 | public class NewIOServer {
 public static void main(String[] args) throws Exception {
 
 InetSocketAddress address = new InetSocketAddress(7001);
 
 ServerSocketChannel serverSocketChannel = ServerSocketChannel.open();
 
 ServerSocket serverSocket = serverSocketChannel.socket();
 
 serverSocket.bind(address);
 
 
 ByteBuffer byteBuffer = ByteBuffer.allocate(4096);
 
 while (true) {
 SocketChannel socketChannel = serverSocketChannel.accept();
 
 int readcount = 0;
 while (-1 != readcount) {
 try {
 
 readcount = socketChannel.read(byteBuffer);
 
 }catch (Exception ex) {
 
 break;
 }
 
 byteBuffer.rewind();
 }
 }
 }
 }
 
 | 
| 12
 3
 4
 5
 6
 7
 8
 9
 10
 11
 12
 13
 14
 15
 16
 17
 18
 19
 20
 21
 22
 23
 24
 25
 26
 
 | public class NewIOClient {public static void main(String[] args) throws Exception {
 
 SocketChannel socketChannel = SocketChannel.open();
 socketChannel.connect(new InetSocketAddress("localhost", 7001));
 String filename = "protoc-3.6.1-win32.zip";
 
 
 FileChannel fileChannel = new FileInputStream(filename).getChannel();
 
 
 long startTime = System.currentTimeMillis();
 
 
 
 
 
 long transferCount = fileChannel.transferTo(0, fileChannel.size(), socketChannel);
 
 System.out.println("发送的总的字节数 =" + transferCount + " 耗时:" + (System.currentTimeMillis() - startTime));
 
 
 fileChannel.close();
 
 }
 }
 
 | 

这里的文件比较小所以区别不大。但是还是比传统IO要快的。
Java AIO基本介绍
JDK 7 引入了 Asynchronous I/O,即 AIO。在进行 I/O 编程中,常用到两种模式:Reactor 和 Proactor。Java 的 NIO 就是 Reactor,当有事件触发时,服务器端得到通知,进行相应的处理
AIO 即 NIO2.0,叫做异步不阻塞的 IO。AIO 引入异步通道的概念,采用了 Proactor 模式,简化了程序编写, 有效的请求才启动线程,它的特点是先由操作系统完成后才通知服务端程序启动线程去处理,一般适用于连接 数较多且连接时间较长的应用。
目前AIO还没有广泛应用,Netty也是基于NIO,而不是AIO,因此我们就不详解AIO了,有兴趣的可以参考 <<Java 新一代网络编程模型 AIO 原理及 Linux 系统 AIO 介绍 >>
http://www.52im.net/thread-306-1-1.html
BIO、NIO、AIO 对比表
|  | BIO | NIO | AIO | 
| IO模型 | 同步阻塞 | 同步非阻塞(多路复用) | 异步非阻塞 | 
| 编程难度 | 简单 | 复杂 | 复杂 | 
| 可靠性 | 差 | 好 | 好 | 
| 吞吐量 | 低 | 高 | 高 | 
举例说明
- 同步阻塞:到理发店理发,就一直等理发师,直到轮到自己理发。
- 同步非阻塞:到理发店理发,发现前面有其它人理发,给理发师说下,先干其他事情,一 会过来看是否轮到自己.
- 异步非阻塞:给理发师打电话,让理发师上门服务,自己千其它事情,理发师自己来家给你理发