找了好些文章,都没能讲明白mmap的原理。本文是转载自知乎上的一篇文件,整个文章的篇幅较少,可以帮助大家快速的了解mmap的原来,大家自行阅读即可,原文的链接我贴在最后了。
简短的总结一下:mmap是直接将进程的虚拟地址和内核空间的page cache进行映射从而省去了从内核空间向用户空间的copy。
零拷贝技术mmapmmap
一、传统的读写文件
一般来说,修改一个文件的内容需要如下3个步骤:
- 把文件内容读入到内存中。
- 修改内存中的内容。
- 把内存的数据写入到文件中。
过程如图 1 所示:
如果使用代码来实现上面的过程,代码如下:
read(fd, buf, 1024); // 读取文件的内容到buf
... // 修改buf的内容
write(fd, buf, 1024); // 把buf的内容写入到文件
页缓存(page cache)页缓存页缓存
二、使用 mmap 读写文件
页缓存页缓存
mmap
mmap
页缓存mmap页缓存mmap页缓存页缓存
mmap页缓存mmap
msyncmunmap
三、mmap的使用方式
mmapmmap
void *mmap(void *addr, size_t length, int prot, int flags, int fd, off_t offset);
mmap
addrlengthprotPROT_EXECPROT_READPROT_WRITEPROT_NONEflagsMAP_FIXEDMAP_SHAREDMAP_PRIVATEMAP_LOCKEDfdoffset
mmapmmap
int fd = open(filepath, O_RDWR, 0644); // 打开文件
void *addr = mmap(NULL, 8192, PROT_WRITE, MAP_SHARED, fd, 4096); // 对文件进行映射
openmmap
addrlengthprotPROT_WRITEflagsMAP_SHAREDfdoffset
mmap
四、总结
mmapmmap
mmapmmapmsync
主要体现在读上,写的时候其实没减少copy次数。
函数定义
mmap是一种内存映射文件的方法,即将一个文件或者其它对象映射到进程的地址空间,实现文件磁盘地址和进程虚拟地址空间中一段虚拟地址的一一对映关系。
函数原型
void* mmap(void* start,size_t length,int prot,int flags,int fd,off_t offset);
start:映射区的开始地址,设置0时表示由系统决定映射区的起始地址。
length:映射区的长度。//长度单位是以字节为单位,不足一内存页按一内存页处理
prot:期望的内存保护标志,不能与文件的打开模式冲突
PROT_EXEC //页内容可以被执行
PROT_READ //页内容可以被读取
PROT_WRITE //页可以被写入
PROT_NONE //页不可访问
flags:指定映射对象的类型,映射选项和映射页是否可以共享。
MAP_FIXED //使用指定的映射起始地址,如果由start和len参数指定的内存区重叠于现存的映射空间,重叠部分将会被丢弃。如果指定的起始地址不可用,操作将会失败。并且起始地址必须落在页的边界上。
MAP_SHARED //与其它所有映射这个对象的进程共享映射空间。对共享区的写入,相当于输出到文件。直到msync()或者[munmap](https://baike.baidu.com/item/munmap)()被调用,文件实际上不会被更新。
MAP_PRIVATE //建立一个写入时拷贝的私有映射。内存区域的写入不会影响到原文件。这个标志和以上标志是互斥的,只能使用其中一个。
MAP_NORESERVE //不要为这个映射保留交换空间。当交换空间被保留,对映射区修改的可能会得到保证。当交换空间不被保留,同时[内存不足],对映射区的修改会引起段违例信号。
MAP_LOCKED //锁定映射区的页面,从而防止页面被交换出内存。
MAP_GROWSDOWN //用于堆栈,告诉[内核]VM系统,映射区可以向下扩展。
MAP_ANONYMOUS //匿名映射,映射区不与任何文件关联。
MAP_ANON //MAP_ANONYMOUS的别称,不再被使用。
MAP_FILE //兼容标志,被忽略。
MAP_32BIT //将映射区放在进程[地址空间]的低2GB,MAP_FIXED指定时会被忽略。当前这个标志只在x86-64平台上得到支持。
MAP_POPULATE //为文件映射通过预读的方式准备好页表。随后对映射区的访问不会被页违例阻塞。
MAP_NONBLOCK //仅和MAP_POPULATE一起使用时才有意义。不执行预读,只为已存在于内存中的页面建立[页表]入口。
fd:有效的文件描述符。一般是由[open]()函数返回,其值也可以设置为-1,此时需要指定flags参数中的MAP_ANON,表明进行的是匿名映射。
offset:被映射对象内容的起点。
传统的read和write的文件操作:
- open一个文件,使用read系统调用读取文件的一部分或者全部;
- 内核将文件中的数据从磁盘区域拷贝到内核空间缓冲区;
- 然后再从内核空间缓冲区读取到进程用户空间缓冲区;
-
read()和write()系统调用在操作磁盘文件时不会直接发起磁盘访问,而是仅仅在用户空间缓冲区与内核缓冲区高速缓存(kernel buffer cache)之间复制数据。
mmap原理
- open一个文件,然后调用mmap系统调用,将文件的内容的全部或一部分直接映射到进程虚拟空间中文件存储映射部分;
- 完成映射关系后,mmap返回值是一个指针,进程可以通过采用指针方式读写操作这一段内存;
- 但mmap并不分配物理地址空间,只是占有了进程的虚拟地址空间,当多个进程需要同时访问这个文件的时候,每个进程都将文件所存储的内核缓冲区映射到自己的进程空间虚拟地址中。
- 当第一个进程访问内核缓冲区的时候,由于没有实际拷贝数据,这时候MMU(内存管理单元)在地址映射表中找不到与该虚拟内存空间相对应的物理地址,此时会触发缺页中断;
-
缺页中断后,内核会将文件的这一页数据读入到内核缓冲区中,并更新进程的页表,使得页表指向内核缓冲区这一页,之后有其他的进程再次访问这一页的时候,该页已经在内存中了
补充知识
进程的虚拟地址空间由多个虚拟内存区域构成,包括常见的栈,堆,bss数据段,初始数据段,text数据段和内存映射等,每一个都是独立的虚拟内存区域。