Linux核心態和使用者態共用記憶體
1、mmap系統調用(功能)
void* mmap ( void * addr , size_t len , int prot , int flags ,int fd , off_t offset )
記憶體映射函數mmap, 負責把檔案內容映射到進程的虛擬記憶體空間, 通過對這段記憶體的讀取和修改,來實現對檔案的讀取和修改,而不需要再調用read,write等操作。
2、mmap系統調用(參數)
1)addr: 指定映射的起始地址, 通常設為NULL, 由系統指定。
2)length: 映射到記憶體的檔案長度。
3) prot: 映射區的保護方式, 可以是:
PROT_EXEC: 映射區可被執行
PROT_READ: 映射區可被讀取
PROT_WRITE: 映射區可被寫入
4)flags: 映射區的特性, 可以是:
MAP_SHARED:寫入映射區的資料會複製迴文件, 且允許其他映射該檔案的進程共用。
MAP_PRIVATE:對映射區的寫入操作會產生一個映射區的複製(copy-on-write), 對此地區所做的修改不會寫回原檔案。
5)fd: 由open返回的檔案描述符, 代表要映射的檔案。
6)offset: 以檔案開始處的位移量, 必須是分頁大小的整數倍, 通常為0, 表示從檔案頭開始映射。
3、解除映射
int munmap(void *start,size_t length)
功能:取消參數start所指向的映射記憶體,參數length表示欲取消的記憶體大小。
傳回值:解除成功返回0,否則返回-1,錯誤原因存於errno中。
執行個體分析
mmap系統調用
4、虛擬記憶體地區
虛擬記憶體地區是進程的虛擬位址空間中的一個同質區間,即具有同樣特性的連續位址範圍。一個進程的記憶體映象由下面幾部分組成:程式碼、資料、BSS
和棧地區,以及記憶體映射的地區。
一個進程的記憶體地區可以通過查看:/proc/pid/maps
08048000-0804f000 r-xp 00000000 08:01 573748 /sbin/rpc.statd #text
0804f000-08050000 rw-p 00007000 08:01 573748 /sbin/rpc.statd #data
08050000-08055000 rwxp 00000000 00:00 0 #bss
040000000-40015000 r-xp 00000000 08:01 933965 /lib/ld2.3.2.so #text
40015000-40016000 rw-p 00014000 08:01 933965 /lib/ld-2.3.2.so #data
每一行的域為:start_end perm offset major:minor inode
1) Start: 該地區起始虛擬位址
2) End: 該地區結束虛擬位址
3) Perm: 讀、寫和執行許可權;表示對這個地區,允許進程做什麼。這個域的最後一個字元要麼是p表示私人的,要麼是s表示共用的。
4) Offset: 被映射部分在檔案中的起始地址
5) Major、minor:主次裝置號
6) Inode:索引結點
5、vm_area_struct
Linux核心使用結構vm_area_struct(<linux/mm_types.h>)來描述虛擬記憶體地區,其中幾個主要成員如下:
1)unsigned long vm_start 虛擬記憶體地區起始地址
2)unsigned long vm_end 虛擬記憶體地區結束位址
3)unsigned long vm_flags 該地區的標記。如:VM_IO和VM_RESERVED。VM_IO將該VMA標記為記憶體映射的IO地區,VM_IO會阻止系統將該地區包含在進程的存放轉
存(core dump )中,VM_RESERVED標誌記憶體地區不能被換出。
6、mmap裝置操作
映射一個裝置是指把使用者空間的一段地址關聯到裝置記憶體上。當程式讀寫這段使用者空間的地址時,它實際上是在訪問裝置。
mmap裝置方法需要完成什麼功能。
mmap方法是file_oprations結構的成員,在mmap系統調用發出時被調用。在此之前,核心已經完成了很多工作。mmap裝置方法所需要做的就是建立
虛擬位址到物理地址的頁表。
int (*mmap) (struct file *, struct vm_area_struct *)
mmap如何完成頁表的建立。
方法有二:
1)使用remap_pfn_range一次建立所有頁表;
2)使用nopage VMA方法每次建立一個頁表。
構造頁表的工作可由remap_pfn_range函數完成,原型如下:
int remap_pfn_range(struct vm_area_struct *vma, unsigned long addr,unsigned long pfn, unsigned long size, pgprot_t prot)
vma: 虛擬記憶體地區指標
virt_addr: 虛擬位址的起始值
pfn: 要映射的物理地址所在的物理頁幀號,可將物理地址>>PAGE_SHIFT得到。
size: 要映射的地區的大小。
prot: VMA的保護屬性。
int memdev_mmap(struct file*filp, struct vm_area_struct *vma)
{
Vma->vm_flags |= VM_IO;
Vma->vm_flags |= VM_RESERVED;
if (remap_pfn_range(vma, vma->vm_start,
virt_to_phys(dev- >data)>> PAGE_SHIFT,
size,
vma->vm_page_prot))
return -EAGAIN;
return 0;
}
dev- >data就是傳給使用者態的共用資料。
7、mmap裝置方法執行個體
1)memdev.源碼
#ifndef _MEMDEV_H_
#define _MEMDEV_H_
#ifndef MEMDEV_MAJOR
#define MEMDEV_MAJOR 0 /*預設的mem的主裝置號*/
#endif
#ifndef MEMDEV_NR_DEVS
#define MEMDEV_NR_DEVS 2 /*裝置數*/
#endif
#ifndef MEMDEV_SIZE
#define MEMDEV_SIZE 4096
#endif
/*mem裝置描述結構體*/
struct mem_dev
{
char *data;
unsigned long size;
};
#endif /* _MEMDEV_H_ */
2)memdev.c源碼
#include <linux/module.h>
#include <linux/types.h>
#include <linux/fs.h>
#include <linux/errno.h>
#include <linux/mm.h>
#include <linux/sched.h>
#include <linux/init.h>
#include <linux/cdev.h>
#include <asm/io.h>
#include <asm/system.h>
#include <asm/uaccess.h>
#include <linux/kernel.h>
#include "memdev.h"
static int mem_major = MEMDEV_MAJOR;
module_param(mem_major, int, S_IRUGO);
struct mem_dev *mem_devp; /*裝置結構體指標*/
struct cdev cdev;
/*檔案開啟函數*/
int mem_open(struct inode *inode, struct file *filp)
{
struct mem_dev *dev;
/*擷取次裝置號*/
int num = MINOR(inode->i_rdev);
if (num >= MEMDEV_NR_DEVS)
return -ENODEV;
dev = &mem_devp[num];
/*將裝置描述結構指標賦值給檔案私人資料指標*/
filp->private_data = dev;
return 0;
}
/*檔案釋放函數*/
int mem_release(struct inode *inode, struct file *filp)
{
return 0;
}
static int memdev_mmap(struct file*filp, struct vm_area_struct *vma)
{
struct mem_dev *dev = filp->private_data; /*獲得裝置結構體指標*/
vma->vm_flags |= VM_IO;
vma->vm_flags |= VM_RESERVED;
if (remap_pfn_range(vma,vma->vm_start,virt_to_phys(dev->data)>>PAGE_SHIFT, vma->vm_end - vma->vm_start, vma->vm_page_prot))
return -EAGAIN;
return 0;
}
/*檔案操作結構體*/
static const struct file_operations mem_fops =
{
.owner = THIS_MODULE,
.open = mem_open,
.release = mem_release,
.mmap = memdev_mmap,
};
/*裝置驅動模組載入函數*/
static int memdev_init(void)
{
int result;
int i;
dev_t devno = MKDEV(mem_major, 0);
/* 靜態申請裝置號*/
if (mem_major)
result = register_chrdev_region(devno, 2, "memdev");
else /* 動態分配裝置號 */
{
result = alloc_chrdev_region(&devno, 0, 2, "memdev");
mem_major = MAJOR(devno);
}
if (result < 0)
return result;
/*初始化cdev結構*/
cdev_init(&cdev, &mem_fops);
cdev.owner = THIS_MODULE;
cdev.ops = &mem_fops;
/* 註冊字元裝置 */
cdev_add(&cdev, MKDEV(mem_major, 0), MEMDEV_NR_DEVS);
/* 為裝置描述結構分配記憶體*/
mem_devp = kmalloc(MEMDEV_NR_DEVS * sizeof(struct mem_dev), GFP_KERNEL);
if (!mem_devp) /*申請失敗*/
{
result = - ENOMEM;
goto fail_malloc;
}
memset(mem_devp, 0, sizeof(struct mem_dev));
/*為裝置分配記憶體*/
for (i=0; i < MEMDEV_NR_DEVS; i++)
{
mem_devp[i].size = MEMDEV_SIZE;
mem_devp[i].data = kmalloc(MEMDEV_SIZE, GFP_KERNEL);
memset(mem_devp[i].data, 0, MEMDEV_SIZE);
}
return 0;
fail_malloc:
unregister_chrdev_region(devno, 1);
return result;
}
/*模組卸載函數*/
static void memdev_exit(void)
{
cdev_del(&cdev); /*登出裝置*/
kfree(mem_devp); /*釋放裝置結構體記憶體*/
unregister_chrdev_region(MKDEV(mem_major, 0), 2); /*釋放裝置號*/
}
MODULE_AUTHOR("yinjiabin);
MODULE_LICENSE("GPL");
module_init(memdev_init);
module_exit(memdev_exit);
3)測試程式源碼
#include <stdio.h>
#include<sys/types.h>
#include<sys/stat.h>
#include<fcntl.h>
#include<unistd.h>
#include<sys/mman.h>
int main()
{
int fd;
char *start;
//char buf[100];
char *buf;
/*開啟檔案*/
fd = open("/dev/memdev0",O_RDWR);
buf = (char *)malloc(100);
memset(buf, 0, 100);
start=mmap(NULL,100,PROT_READ|PROT_WRITE,MAP_SHARED,fd,0);
/* 讀出資料 */
strcpy(buf,start);
sleep (1);
printf("buf 1 = %s\n",buf);
/* 寫入資料 */
strcpy(start,"Buf Is Not Null!");
memset(buf, 0, 100);
strcpy(buf,start);
sleep (1);
printf("buf 2 = %s\n",buf);
munmap(start,100); /*解除映射*/
free(buf);
close(fd);
return 0;
}
int munmap( void * addr, size_t len )
該調用在進程地址空間中解除一個映射關係,addr是調用mmap()時返回的地址,len是映射區的大小。當映射關係解除後,對原來映射地址的訪問將導致段錯誤發生。
int msync ( void * addr , size_t len, int flags)
一般說來,進程在映射空間的對共用內容的改變並不直接寫回到磁碟檔案中,往往在調用munmap()後才執行該操作。可以通過調用msync()實現磁碟上檔案內容與共用記憶體區的內容一致。
有個地方查了很多資料,沒有詳細的解釋,在mmap成功以後,關閉檔案描述符close(fd). 共用記憶體區還是存在的,但是資料還是受保護的嗎。