【操作系统】MMAP实现原理

相信熟悉进程间通信的人们都清楚，最快的ICP方式目前是MMAP。至于为什么MMAP是最快的ICP方式呢，我查阅了很多资料，主要原因是MMAP的通信方式不需要系统调用，自然也不涉及数据在内核空间和用户空间之间的拷贝了。但是对于MMAP的详细流程，以及为什么不需要系统调用，很多文章讲的却不是很清楚。在综合了多处资料之后，我尝试对MMAP的原理进行解释：

如图所示，左侧为进程的地址空间布局，其中有一部分就是MMAP区域。

接下来我们从函数调用开始梳理一下操作系统中发生的流程：

1、进程调用了【用户空间的MMAP函数】，该函数封装了MMAP的系统调用

2、进程申请相关内存区域

3、进程找到入参中的文件对应的物理地址：

- 通过fd查询进程打开文件表，得到系统打开文件表中对应fd的指针

- 查询系统打开文件表，找到inode指针

4、函数调用【MMAP的系统调用】：int mmap(struct file *filp, struct vm_area_struct *vma)，传入刚才申请的内存区域和找到的fcb信息，将二者的关系写入进程的页表之中

那么在实际使用的过程中，对于MMAP内存区域的读写操作，其实是复用了部分虚拟内存的逻辑：

1、进程在MMAP区域进行读写都是纯内存操作，所以无须进行系统调用（不需要进内核态）；

2、当进程未载入MMAP相应的内存页时，则会引发缺页异常，从而将对应内存页面载入当前进程的页表中；

3、当该部分区域的内存页存在于物理内存时，两个进程的写操作都会直接体现在物理内存

那么MMAP与虚拟内存的区别是：

1、多进程可以复用同一块页框：当A进程引发缺页异常将数据从硬盘调入页框后，B进程因为页表中状态为未载入，仍会引发缺页异常，但是不用再次从硬盘调入，直接复用即可

2、需要定期将“脏页”回写到硬盘中：虚拟内存中的页如果不被调出，不需要写入磁盘；