Linux核心態和使用者態共用記憶體__Linux

來源:互聯網
上載者:User

Linux核心態和使用者態共用記憶體

1、mmap系統調用(功能)
      void* mmap ( void * addr , size_t len , int prot , int flags ,int fd , off_t offset )
      記憶體映射函數mmap, 負責把檔案內容映射到進程的虛擬記憶體空間, 通過對這段記憶體的讀取和修改,來實現對檔案的讀取和修改,而不需要再調用read,write等操作。

 

2、mmap系統調用(參數)
      1)addr: 指定映射的起始地址, 通常設為NULL, 由系統指定。
      2)length: 映射到記憶體的檔案長度。
      3) prot:   映射區的保護方式, 可以是:
             PROT_EXEC: 映射區可被執行
             PROT_READ: 映射區可被讀取
             PROT_WRITE: 映射區可被寫入

      4)flags: 映射區的特性, 可以是:
            MAP_SHARED:寫入映射區的資料會複製迴文件, 且允許其他映射該檔案的進程共用。
            MAP_PRIVATE:對映射區的寫入操作會產生一個映射區的複製(copy-on-write), 對此地區所做的修改不會寫回原檔案。

      5)fd: 由open返回的檔案描述符, 代表要映射的檔案。
      6)offset: 以檔案開始處的位移量, 必須是分頁大小的整數倍, 通常為0, 表示從檔案頭開始映射。

3、解除映射
      int munmap(void *start,size_t length)
     功能:取消參數start所指向的映射記憶體,參數length表示欲取消的記憶體大小。
    傳回值:解除成功返回0,否則返回-1,錯誤原因存於errno中。

執行個體分析
mmap系統調用

4、虛擬記憶體地區
      虛擬記憶體地區是進程的虛擬位址空間中的一個同質區間,即具有同樣特性的連續位址範圍。一個進程的記憶體映象由下面幾部分組成:程式碼、資料、BSS
和棧地區,以及記憶體映射的地區。

 一個進程的記憶體地區可以通過查看:/proc/pid/maps
08048000-0804f000 r-xp 00000000 08:01 573748 /sbin/rpc.statd #text
0804f000-08050000 rw-p 00007000 08:01 573748 /sbin/rpc.statd #data
08050000-08055000 rwxp 00000000 00:00 0 #bss
040000000-40015000 r-xp 00000000 08:01 933965 /lib/ld2.3.2.so #text
40015000-40016000 rw-p 00014000 08:01 933965 /lib/ld-2.3.2.so #data

       每一行的域為:start_end perm offset major:minor inode
       1) Start: 該地區起始虛擬位址
       2) End: 該地區結束虛擬位址
       3) Perm: 讀、寫和執行許可權;表示對這個地區,允許進程做什麼。這個域的最後一個字元要麼是p表示私人的,要麼是s表示共用的。
       4) Offset: 被映射部分在檔案中的起始地址
       5) Major、minor:主次裝置號
       6) Inode:索引結點

5、vm_area_struct
      Linux核心使用結構vm_area_struct(<linux/mm_types.h>)來描述虛擬記憶體地區,其中幾個主要成員如下:
     1)unsigned long vm_start   虛擬記憶體地區起始地址
     2)unsigned long vm_end    虛擬記憶體地區結束位址

     3)unsigned long vm_flags  該地區的標記。如:VM_IO和VM_RESERVED。VM_IO將該VMA標記為記憶體映射的IO地區,VM_IO會阻止系統將該地區包含在進程的存放轉
存(core dump )中,VM_RESERVED標誌記憶體地區不能被換出。

6、mmap裝置操作
      映射一個裝置是指把使用者空間的一段地址關聯到裝置記憶體上。當程式讀寫這段使用者空間的地址時,它實際上是在訪問裝置。

      mmap裝置方法需要完成什麼功能。
      mmap方法是file_oprations結構的成員,在mmap系統調用發出時被調用。在此之前,核心已經完成了很多工作。mmap裝置方法所需要做的就是建立
虛擬位址到物理地址的頁表。
      int (*mmap) (struct file *, struct vm_area_struct *)

      mmap如何完成頁表的建立。
     方法有二:
     1)使用remap_pfn_range一次建立所有頁表;
     2)使用nopage VMA方法每次建立一個頁表。

     構造頁表的工作可由remap_pfn_range函數完成,原型如下:
     int remap_pfn_range(struct vm_area_struct *vma, unsigned long addr,unsigned long pfn, unsigned long size, pgprot_t prot)

     vma:           虛擬記憶體地區指標
     virt_addr:   虛擬位址的起始值

     pfn:             要映射的物理地址所在的物理頁幀號,可將物理地址>>PAGE_SHIFT得到。
     size:           要映射的地區的大小。
     prot:            VMA的保護屬性。


int memdev_mmap(struct file*filp, struct vm_area_struct *vma)
{
Vma->vm_flags |= VM_IO;
Vma->vm_flags |= VM_RESERVED;
if (remap_pfn_range(vma, vma->vm_start,
virt_to_phys(dev- >data)>> PAGE_SHIFT,
size,
vma->vm_page_prot))
return -EAGAIN;
return 0;
}

dev- >data就是傳給使用者態的共用資料。

7、mmap裝置方法執行個體
       1)memdev.源碼

#ifndef _MEMDEV_H_
#define _MEMDEV_H_

#ifndef MEMDEV_MAJOR
#define MEMDEV_MAJOR 0   /*預設的mem的主裝置號*/
#endif

#ifndef MEMDEV_NR_DEVS
#define MEMDEV_NR_DEVS 2    /*裝置數*/
#endif

#ifndef MEMDEV_SIZE
#define MEMDEV_SIZE 4096
#endif

/*mem裝置描述結構體*/
struct mem_dev                                    
{                                                       
  char *data;                     
  unsigned long size;      
};

#endif /* _MEMDEV_H_ */

       2)memdev.c源碼

#include <linux/module.h>
#include <linux/types.h>
#include <linux/fs.h>
#include <linux/errno.h>
#include <linux/mm.h>
#include <linux/sched.h>
#include <linux/init.h>
#include <linux/cdev.h>
#include <asm/io.h>
#include <asm/system.h>
#include <asm/uaccess.h>

#include <linux/kernel.h>
#include "memdev.h"

static int mem_major = MEMDEV_MAJOR;

module_param(mem_major, int, S_IRUGO);

struct mem_dev *mem_devp; /*裝置結構體指標*/

struct cdev cdev;

/*檔案開啟函數*/
int mem_open(struct inode *inode, struct file *filp)
{
    struct mem_dev *dev;
   
    /*擷取次裝置號*/
    int num = MINOR(inode->i_rdev);

    if (num >= MEMDEV_NR_DEVS)
            return -ENODEV;
    dev = &mem_devp[num];
   
    /*將裝置描述結構指標賦值給檔案私人資料指標*/
    filp->private_data = dev;
   
    return 0;
}

/*檔案釋放函數*/
int mem_release(struct inode *inode, struct file *filp)
{
  return 0;
}
static int memdev_mmap(struct file*filp, struct vm_area_struct *vma)
{
      struct mem_dev *dev = filp->private_data; /*獲得裝置結構體指標*/
     
      vma->vm_flags |= VM_IO;
      vma->vm_flags |= VM_RESERVED;

    
      if (remap_pfn_range(vma,vma->vm_start,virt_to_phys(dev->data)>>PAGE_SHIFT, vma->vm_end - vma->vm_start, vma->vm_page_prot))
          return  -EAGAIN;
               
      return 0;
}

/*檔案操作結構體*/
static const struct file_operations mem_fops =
{
  .owner = THIS_MODULE,
  .open = mem_open,
  .release = mem_release,
  .mmap = memdev_mmap,
};

/*裝置驅動模組載入函數*/
static int memdev_init(void)
{
  int result;
  int i;

  dev_t devno = MKDEV(mem_major, 0);

  /* 靜態申請裝置號*/
  if (mem_major)
    result = register_chrdev_region(devno, 2, "memdev");
  else  /* 動態分配裝置號 */
  {
    result = alloc_chrdev_region(&devno, 0, 2, "memdev");
    mem_major = MAJOR(devno);
  } 
 
  if (result < 0)
    return result;

  /*初始化cdev結構*/
  cdev_init(&cdev, &mem_fops);
  cdev.owner = THIS_MODULE;
  cdev.ops = &mem_fops;
 
  /* 註冊字元裝置 */
  cdev_add(&cdev, MKDEV(mem_major, 0), MEMDEV_NR_DEVS);
  
  /* 為裝置描述結構分配記憶體*/
  mem_devp = kmalloc(MEMDEV_NR_DEVS * sizeof(struct mem_dev), GFP_KERNEL);
  if (!mem_devp)    /*申請失敗*/
  {
    result =  - ENOMEM;
    goto fail_malloc;
  }
  memset(mem_devp, 0, sizeof(struct mem_dev));
 
  /*為裝置分配記憶體*/
  for (i=0; i < MEMDEV_NR_DEVS; i++)
  {
        mem_devp[i].size = MEMDEV_SIZE;
        mem_devp[i].data = kmalloc(MEMDEV_SIZE, GFP_KERNEL);
        memset(mem_devp[i].data, 0, MEMDEV_SIZE);
  }
   
  return 0;

  fail_malloc:
  unregister_chrdev_region(devno, 1);
 
  return result;
}

/*模組卸載函數*/
static void memdev_exit(void)
{
  cdev_del(&cdev);   /*登出裝置*/
  kfree(mem_devp);     /*釋放裝置結構體記憶體*/
  unregister_chrdev_region(MKDEV(mem_major, 0), 2); /*釋放裝置號*/
}

MODULE_AUTHOR("yinjiabin);
MODULE_LICENSE("GPL");

module_init(memdev_init);
module_exit(memdev_exit);

 

3)測試程式源碼

#include <stdio.h>
#include<sys/types.h>
#include<sys/stat.h>
#include<fcntl.h>
#include<unistd.h>
#include<sys/mman.h>

int main()
{
 int fd;
 char *start;
 //char buf[100];
 char *buf;
 
 /*開啟檔案*/
 fd = open("/dev/memdev0",O_RDWR);
       
 buf = (char *)malloc(100);
 memset(buf, 0, 100);
 start=mmap(NULL,100,PROT_READ|PROT_WRITE,MAP_SHARED,fd,0);
 
 /* 讀出資料 */
 strcpy(buf,start);
 sleep (1);
 printf("buf 1 = %s\n",buf); 

 /* 寫入資料 */
 strcpy(start,"Buf Is Not Null!");
 
 memset(buf, 0, 100);
 strcpy(buf,start);
 sleep (1);
 printf("buf 2 = %s\n",buf);

      
 munmap(start,100); /*解除映射*/
 free(buf);
 close(fd); 
 return 0; 
}

 int munmap( void * addr, size_t len )
 該調用在進程地址空間中解除一個映射關係,addr是調用mmap()時返回的地址,len是映射區的大小。當映射關係解除後,對原來映射地址的訪問將導致段錯誤發生。

 int msync ( void * addr , size_t len, int flags)
 一般說來,進程在映射空間的對共用內容的改變並不直接寫回到磁碟檔案中,往往在調用munmap()後才執行該操作。可以通過調用msync()實現磁碟上檔案內容與共用記憶體區的內容一致。

有個地方查了很多資料,沒有詳細的解釋,在mmap成功以後,關閉檔案描述符close(fd). 共用記憶體區還是存在的,但是資料還是受保護的嗎。

 

 

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.