記憶體管理是作業系統的核心之一,最近在研究核心的記憶體管理以及 C 執行階段程式庫對記憶體的分配和管理,涉及到進程在記憶體的布局,在此對進程的記憶體布局做一下總結:
1. 32 位元模式下的 linux 記憶體布局
圖上的各個部分描述得比較清楚,不需再做過多的描述。從可以看到,棧至頂向下擴充,並且棧是有界的。堆至底向上擴充, mmap 映射地區至頂向下擴充, mmap 映射地區和堆相對擴充,直至耗盡虛擬位址空間中的剩餘地區,這種結構便於 C 執行階段程式庫使用 mmap 映射地區和堆進行記憶體配置。的布局形式是在核心 2.6.7 以後才引入的,這是 32 位元模式下的預設記憶體布局形式。看看 cat 命令在 2.6.36 上記憶體布局:
08048000-08051000 r-xp 00000000 08:01 786454 /bin/cat
08051000-08052000 r--p 00008000 08:01 786454 /bin/cat
08052000-08053000 rw-p 00009000 08:01 786454 /bin/cat
08053000-08074000 rw-p 00000000 00:00 0 [heap]
b73e3000-b75e3000 r--p 00000000 08:01 400578 /usr/lib/locale/locale-archive
b75e3000-b75e4000 rw-p 00000000 00:00 0
b75e4000-b773b000 r-xp 00000000 08:01 1053967 /lib/libc-2.12.1.so
b773b000-b773c000 ---p 00157000 08:01 1053967 /lib/libc-2.12.1.so
b773c000-b773e000 r--p 00157000 08:01 1053967 /lib/libc-2.12.1.so
b773e000-b773f000 rw-p 00159000 08:01 1053967 /lib/libc-2.12.1.so
b773f000-b7742000 rw-p 00000000 00:00 0
b774f000-b7750000 r--p 002a1000 08:01 400578 /usr/lib/locale/locale-archive
b7750000-b7752000 rw-p 00000000 00:00 0
b7752000-b7753000 r-xp 00000000 00:00 0 [vdso]
b7753000-b776f000 r-xp 00000000 08:01 1049013 /lib/ld-2.12.1.so
b776f000-b7770000 r--p 0001b000 08:01 1049013 /lib/ld-2.12.1.so
b7770000-b7771000 rw-p 0001c000 08:01 1049013 /lib/ld-2.12.1.so
bfbed000-bfc0e000 rw-p 00000000 00:00 0 [stack]
可以看到,棧和 mmap 映射地區並不是從一個固定地址開始,並且每次的值都不一樣,這是程式在啟動時隨機改變這些值的設定,使得使用緩衝區溢位進行攻擊更加困難。當然也可以讓程式的棧和 mmap 映射地區從一個固定位置開始,只需要設定全域變數 randomize_v a_space 值為 0 ,這個變數預設值為 1 。使用者可以通過設定 /proc/sys/kernel/randomize_va_space 來停用該特性,也可以用如下命令:
sudo sysctl -w kernel.randomize_va_space=0
設定 randomize_va_space 為 0 後,再看看 cat 的記憶體布局:
08048000-08051000 r-xp 00000000 08:01 786454 /bin/cat
08051000-08052000 r--p 00008000 08:01 786454 /bin/cat
08052000-08053000 rw-p 00009000 08:01 786454 /bin/cat
08053000-08074000 rw-p 00000000 00:00 0 [heap]
b7c72000-b7e72000 r--p 00000000 08:01 400578 /usr/lib/locale/locale-archive
b7e72000-b7e73000 rw-p 00000000 00:00 0
b7e73000-b7fca000 r-xp 00000000 08:01 1053967 /lib/libc-2.12.1.so
b7fca000-b7fcb000 ---p 00157000 08:01 1053967 /lib/libc-2.12.1.so
b7fcb000-b7fcd000 r--p 00157000 08:01 1053967 /lib/libc-2.12.1.so
b7fcd000-b7fce000 rw-p 00159000 08:01 1053967 /lib/libc-2.12.1.so
b7fce000-b7fd1000 rw-p 00000000 00:00 0
b7fde000-b7fdf000 r--p 002a1000 08:01 400578 /usr/lib/locale/locale-archive
b7fdf000-b7fe1000 rw-p 00000000 00:00 0
b7fe1000-b7fe2000 r-xp 00000000 00:00 0 [vdso]
b7fe2000-b7ffe000 r-xp 00000000 08:01 1049013 /lib/ld-2.12.1.so
b7ffe000-b7fff000 r--p 0001b000 08:01 1049013 /lib/ld-2.12.1.so
b7fff000-b8000000 rw-p 0001c000 08:01 1049013 /lib/ld-2.12.1.so
bffdf000-c0000000 rw-p 00000000 00:00 0 [stack]
可以看出,棧和 mmap 地區都從固定位置開始了, stack 的起始位置為 0x c0000000 , mmap 地區的起始位置為 0x b8000000 ,可見系統為 stack 地區保留了 128M 記憶體位址空間。
在某些情況下,設定 randomize_va_space 為 0 ,便於對系統做一些針對性的研究,例如:進程的記憶體映射有個叫 vdso 的地區,也就是用 ldd 命令看到的那個” linux-gate.so.1 “,這塊地區可以看成是核心用於實現 vsyscall 而建立的 virtual shared object ,遵循 elf 的格式,並且可以被使用者程式訪問。在設定 randomize_va_space 為 0 的情況下,使用如下命令就可以把這個地區 dump 出來看過究竟。如果不設定 randomize_va_space ,每次 vdso 的地址都是隨機的,下面的命令也無能為力。
zhuang@ubuntu:~$ dd if=/proc/self/mem of=gate.so bs=4096 skip=$[0xb7fe1] count=1
dd: `/proc/self/mem': cannot skip to specified offset
1+0 records in
1+0 records out
4096 bytes (4.1 kB) copied, 0.00144225 s, 2.8 MB/s
zhuang@ubuntu:~$ objdump -d gate.so
gate.so: file format elf32-i386
Disassembly of section .text:
ffffe400 <__kernel_sigreturn>:
ffffe400: 58 pop %eax
ffffe401: b8 77 00 00 00 mov $0x77,%eax
ffffe406: cd 80 int $0x80
ffffe408: 90 nop
ffffe409: 8d 76 00 lea 0x0(%esi),%esi
ffffe40c <__kernel_rt_sigreturn>:
ffffe40c: b8 ad 00 00 00 mov $0xad,%eax
ffffe411: cd 80 int $0x80
ffffe413: 90 nop
ffffe414 <__kernel_vsyscall>:
ffffe414: 51 push %ecx
ffffe415: 52 push %edx
ffffe416: 55 push %ebp
ffffe417: 89 e5 mov %esp,%ebp
ffffe419: 0f 34 sysenter
ffffe41b: 90 nop
ffffe41c: 90 nop
ffffe41d: 90 nop
ffffe41e: 90 nop
ffffe41f: 90 nop
ffffe420: 90 nop
ffffe421: 90 nop
ffffe422: eb f3 jmp ffffe417 <__kernel_vsyscall+0x3>
ffffe424: 5d pop %ebp
ffffe425: 5a pop %edx
ffffe426: 59 pop %ecx
ffffe427: c3 ret
2. 32 為模式下的經典布局:
這種布局 mmap 地區與棧地區相對增長,這意味著堆只有 1GB 的虛擬位址空間可以使用,繼續增長就會進入 mmap 映射地區,這顯然不是我們想要的。這是由於 32 模式地址空間限制造成的,所以 核心引入了前一種虛擬位址空間的布局形式。但是對 64 位元模式,提供了巨大的虛擬位址空間,這個布局就相當好。如果要在 2.6.7 以後的核心上使用 32 位元模式記憶體經典布局,有兩種辦法可以設定:
方法一: sudo sysctl -w vm.legacy_va_layout=1
方法二: ulimit -s unlimited
同時設定 randomize_va_space 為 0 後, cat 的記憶體布局已經回到經典形式了:
08048000-08051000 r-xp 00000000 08:01 786454 /bin/cat
08051000-08052000 r--p 00008000 08:01 786454 /bin/cat
08052000-08053000 rw-p 00009000 08:01 786454 /bin/cat
08053000-08074000 rw-p 00000000 00:00 0 [heap]
40000000-4001c000 r-xp 00000000 08:01 1049013 /lib/ld-2.12.1.so
4001c000-4001d000 r--p 0001b000 08:01 1049013 /lib/ld-2.12.1.so
4001d000-4001e000 rw-p 0001c000 08:01 1049013 /lib/ld-2.12.1.so
4001e000-4001f000 r-xp 00000000 00:00 0 [vdso]
4001f000-40021000 rw-p 00000000 00:00 0
40021000-40022000 r--p 002a1000 08:01 400578 /usr/lib/locale/locale-archive
4002f000-40186000 r-xp 00000000 08:01 1053967 /lib/libc-2.12.1.so
40186000-40187000 ---p 00157000 08:01 1053967 /lib/libc-2.12.1.so
40187000-40189000 r--p 00157000 08:01 1053967 /lib/libc-2.12.1.so
40189000-4018a000 rw-p 00159000 08:01 1053967 /lib/libc-2.12.1.so
4018a000-4018e000 rw-p 00000000 00:00 0
4018e000-4038e000 r--p 00000000 08:01 400578 /usr/lib/locale/locale-archive
bffdf000-c0000000 rw-p 00000000 00:00 0 [stack]
3. 64 位元模式下的記憶體布局
在 64 位元模式下各個地區的起始位置是什麼呢?對於 AMD64 , 記憶體布局採用的是傳統模式, text 的起始地址為 0x0000000000400000 ,堆緊接著 BSS 段向上增長, mmap 映射地區開始位置一般設為 TASK_SIZE/3 ,
#define TASK_SIZE_MAX ((1UL << 47) - PAGE_SIZE)
#define TASK_SIZE (test_thread_flag(TIF_IA32) ? \
IA32_PAGE_OFFSET :
TASK_SIZE_MAX)
#define STACK_TOP TASK_SIZE
#define TASK_UNMAPPED_BASE
(PAGE_ALIGN(TASK_SIZE / 3))
計算一下可知, mmap
的開始地區地址為 0x0000 2AAAAAAAA000,棧頂地址為
0x0000 7FFFFFFFF000