前言将内核分成了内核基础层和内核应用层。记得我们的目标是“快速流畅的阅读内核代码”,为了达到这个目标,必须先了解内核的基础和数据结构。这些知识使用范围很广,如果不了解,在内核代码的理解上就容易出现障碍。
1.内核对内存的使用
简单说,内核提供了两个层次的内存分配接口。一个是从伙伴系统分配,一个是从slab分配。关于伙伴系统和slab机制,在后面的章节再分析。这里只需要了解,伙伴系统是最底层的内存管理机制,提供基于基于页式的内存管理,而slab是伙伴系统之上的内存管理,提供基于对象的内存管理。
从伙伴系统分配内存的调用是alloc_pages,注意此时得到的页面的地址,如果要获得能使用的内存地址,还需要page_address调用来获得内存地址。
如果要直接获得内存地址,需要使用__get_free_pages。__get_free_pages其实封装了alloc_pages和page_address两个函数。
alloc_pages申请的内存是以页为单元的,最少也要一个页。如果只是一小块内存,一个页就浪费了,而且内核中很多应用也希望一种对象化的内存管理,希望内存管理能自动的构造和析构对象,这都很接近面向对象的思路了。这就是slab内存管理。
要从slab申请内存,则需要创建一个slab对象,使用kmem_cache_create创建slab对象,kmem_cache_create可以提供对象的名字和大小,构造函数和析构函数等。然后通过kmem_cache_alloc和kmem_cache_free来申请和释放内存。
内核中常用的kmalloc其实也是slab管理。只不过内核已经创建好了一些固定大小的对象,用户通过kmalloc申请的时候,就使用了这些对象。
提供一个内核的例子:
======================================================================
创建slab对象:
bh_cachep = kmem_cache_create("buffer_head",
sizeof(struct buffer_head), 0,
(SLAB_RECLAIM_ACCOUNT|SLAB_PANIC|
SLAB_MEM_SPREAD),
init_buffer_head,
NULL);
创建了一个名为“buffer_head"的对象,对象的初始化函数为init_buffer_head
申请slab对象:
struct buffer_head *ret = kmem_cache_alloc(bh_cachep, gfp_flags);
释放slab对象:
kmem_cache_free(bh_cachep, bh);
内核中还有一个内存分配调用:vmalloc。Vmalloc涉及到高端内存和建立页表映射的概念,作为内核基础的本节就不分析了。 理解了上面的几个函数调用,阅读内核代码的时候,就可以清晰内核中对内存的使用。至于内存管理的结构和细节,在后面我们再讨论。
2.内核使用的进程调度
内核中经常需要使用进程的调度。首先看一个例子。
#define wait_event(wq, condition) \
do { \
if (condition) \
break; \
__wait_event(wq, condition); \
} while (0)
#define __wait_event(wq, condition) \
do { \
DEFINE_WAIT(__wait); \
\
for (;;) { \
prepare_to_wait(&wq, &__wait, TASK_UNINTERRUPTIBLE); \
if (condition) \
break; \
schedule(); \
} \
finish_wait(&wq, &__wait); \
} while (0)
上文定义了一个wait对象,然后设置进程睡眠。如果有其它进程唤醒这个进程后,判断条件是否满足,如果满足则删除wait对象,否则进程继续睡眠。
这是一个很常见的例子,使用wait_event调用实现进程调度的实例在内核中很多,而且内核中还实现了一系列的函数,简单介绍一下。
wait_event_timeout :和wait_event的区别是有时间限制,如果条件满足,进程恢复运行,或者时间到达,进程同样恢复运行 wait_event_interruptible:和wait_event类似,不同之处进程处于可打断的睡眠。而wait_event设置进程处于不可打断的睡眠。两者区别何在?可打断的睡眠进程可以接收到信号,而不可打断的睡眠进程不能处理信号。 wait_event_interruptible_timeout:和wait_event_interruptible相比,多个了时间限制。在规定的时间到达后,进程恢复运行。 wait_event_interruptible_exclusive:和wait_event_interruptible区别是排它性的等待。何谓排它性的等待?有一些进程都在等待队列中,当唤醒的时候,内核是唤醒所有的进程。如果进程设置了排它性等待的标志,那么唤醒所有非排它性的进程和一个排它性进程。3.内核的软中断和tasklet