你好,我是 LMOS。
前面三节课,我们为调用 Cosmos 的第一个 C 函数 hal_start 做了大量工作。这节课我们要让操作系统 Cosmos 里的第一个 C 函数真正跑起来啦,也就是说,我们会真正进入到我们的内核中。
今天我们会继续在这个 hal_start 函数里,首先执行板级初始化,其实就是 hal 层(硬件抽象层,下同)初始化,其中执行了平台初始化,hal 层的内存初始化,中断初始化,最后进入到内核层的初始化。
第一个 C 函数
任何软件工程,第一个函数总是简单的,因为它是总调用者,像是一个管理者,坐在那里发号施令,自己却是啥活也不干。
由于这是第一个 C 函数,也是初始化函数,我们还是要为它单独建立一个文件,以显示对它的尊重,依然在 Cosmos/hal/x86/ 下建立一个 hal_start.c 文件。写上这样一个函数。
void hal_start()
{
for(;;);
return;
}
根据前面的设计,Cosmos 是有 hal 层和内核层之分,所以在上述代码中,要分两步走。第一步是初始化 hal 层;第二步,初始化内核层。只是这两步的函数我们还没有写。
然而最后的死循环却有点奇怪,其实它的目的很简单,就是避免这个函数返回,因为这个返回了就无处可去,避免走回头路。
hal 层初始化
为了分离硬件的特性,我们设计了 hal 层,把硬件相关的操作集中在这个层,并向上提供接口,目的是让内核上层不用关注硬件相关的细节,也能方便以后移植和扩展。(关于 hal 层的设计,可以回顾第 3 节课) 也许今天我们是在 x86 平台上写 Cosmos,明天就要在 ARM 平台上开发 Cosmos,那时我们就可以写个 ARM 平台的 hal 层,来替换 Cosmos 中的 x86 平台的 hal 层。
下面我们在 Cosmos/hal/x86/ 下建立一个 halinit.c 文件,写出 hal 层的初始化函数。
void init_hal()
{
return;
}
这个函数也是一个调用者,没怎么干活。不过根据代码的注释能看出,它调用的函数多一点,但主要是完成初始化平台、初始化内存、初始化中断的功能函数。
初始化平台
我们先来写好平台初始化函数,因为它需要最先被调用。
这个函数主要负责完成两个任务,一是把二级引导器建立的机器信息结构复制到 hal 层中的一个全局变量中,方便内核中的其它代码使用里面的信息,之后二级引导器建立的数据所占用的内存都会被释放。二是要初始化图形显示驱动,内核在运行过程要在屏幕上输出信息。
下面我们在 Cosmos/hal/x86/ 下建立一个 halplatform.c 文件,写上如下代码。
这个代码中别的地方很好理解,就是 kmachbsp 你可能会有点奇怪,它是个结构体变量,结构体类型是 machbstart_t,这个结构和二级引导器所使用的一模一样。
同时,它还是一个 hal 层的全局变量,我们想专门有个文件定义所有 hal 层的全局变量,于是我们在 Cosmos/hal/x86/ 下建立一个 halglobal.c 文件,写上如下代码。
前面的 EXTERN,在 halglobal.c 文件中定义为空,而在其它文件中定义为 extern,告诉编译器这是外部文件的变量,避免发生错误。
下面,我们在 Cosmos/hal/x86/ 下的 bdvideo.c 文件中,写好 init_bdvideo 函数。
init_defgraph() 函数初始了 dftgraph_t 结构体类型的变量 kdftgh,我们在 halglobal.c 文件中定义这个变量,结构类型我们这样来定义。
不难发现,我们正是把这些实际的图形驱动函数的地址填入了这个结构体中,然后通过这个结构体,我们就可以调用到相应的函数了。
因为写这些函数都是体力活,我已经帮你搞定了,你直接使用就可以。上面的 flush_videoram 函数已经证明了这一想法。
来,我们测试一下,看看结果,我们图形驱动程序初始化会显示背景图片——background.bmp,这是在打包映像文件时包含进去的,你自己可以随时替换,只要是满足 1024*768,24 位的位图文件就行了。
下面我们要把这些函数调用起来:
接下来,让我们一起 make vboxtest,应该很有成就感。一幅风景图呈现在我们面前,上面有 Cosmos 的版本、编译时间、CPU 工作模式,内存大小等数据。这相当一个我们 Cosmos 的水印信息。

图形驱动测试
初始化内存
首先,我们在 Cosmos/hal/x86/ 下建立一个 halmm.c 文件,用于初始化内存,为了后面的内存管理器作好准备。
hal 层的内存初始化比较容易,只要向内存管理器提供内存空间布局信息就可以。
你可能在想,不对啊,明明我们在二级引导器中已经获取了内存布局信息,是的,但 Cosmos 的内存管理器需要保存更多的信息,最好是顺序的内存布局信息,这样可以增加额外的功能属性,同时降低代码的复杂度。
不难发现,BIOS 提供的结构无法满足前面这些要求。不过我们也有办法解决,只要以 BIOS 提供的结构为基础,设计一套新的数据结构就搞定了。这个结构可以这样设计。
有些情况下内核要另起炉灶,不想把所有的内存空间都交给内存管理器去管理,所以要保留一部分内存空间,这就是上面结构中那两个 pmr_rrvmsaddr、pmr_rrvmend 字段的作用。
有了数据结构,我们还要写代码来操作它:
结合上面的代码,你会发现这是根据 e820map_t 结构数组,建立了一个 phymmarge_t 结构数组,init_one_pmrge 函数正是把 e820map_t 结构中的信息复制到 phymmarge_t 结构中来。理解了这个原理,即使不看我的,你自己也会写。
下面我们把这些函数,用一个总管函数调动起来,这个总管函数叫什么名字好呢?当然是 init_halmm,如下所示。
void init_halmm()
{
init_phymmarge();
return;
}
这里 init_halmm 函数中还调用了 init_memmgr 函数,这个正是这我们内存管理器初始化函数,我会在内存管理的那节课展开讲。而 init_halmm 函数将要被 init_hal 函数调用。
初始化中断
什么是中断呢?为了帮你快速理解,我们先来看两种情景:
你在开车时,突然汽车引擎坏了,你需要修复它才能继续驾驶汽车……
你在外旅游,你女朋友突然来电话了,你可以选择接电话或者不接电话,当然不接电话的后果很严重(笑)……
在以上两种情景中,虽然不十分恰当,但都是在做一件事时,因为一些原因而要切换到另一件事上。其实计算机中的 CPU 也是一样,在做一件事时,因为一些原因要转而做另一件事,于是中断产生了……
根据原因的类型不同,中断被分为两类。
异常,这是同步的,原因是错误和故障,就像汽车引擎坏了。不修复错误就不能继续运行,所以这时,CPU 会跳到这种错误的处理代码那里开始运行,运行完了会返回。
为啥说它是同步的呢?这是因为如果不修改程序中的错误,下次运行程序到这里同样会发生异常。
中断,这是异步的,我们通常说的中断就是这种类型,它是因为外部事件而产生的,就好像旅游时女朋友来电话了。通常设备需要 CPU 关注时,会给 CPU 发送一个中断信号,所以这时 CPU 会跳到处理这种事件的代码那里开始运行,运行完了会返回。
由于不确定何种设备何时发出这种中断信号,所以它是异步的。
在 x86 CPU 上,最多支持 256 个中断,还记得前面所说的中断表和中断门描述符吗,这意味着我们要准备 256 个中断门描述符和 256 个中断处理程序的入口。
下面我们来定义它,如下所示:
说到这里你会发现,中断表其实是个 gate_t 结构的数组,由 CPU 的 IDTR 寄存器指向,IDTMAX 为 256。
但是光有数组还不行,还要设置其中的数据,下面我们就来设计这个函数,建立一个文件 halsgdidt.c,在其中写一个函数,代码如下。
上面的代码,正是按照要求,把这些数据填入中断门描述符中的。有了中断门之后,还差中断处理程序,中断处理程序只负责这三件事:
1. 保护 CPU 寄存器,即中断发生时的程序运行的上下文。
2. 调用中断处理程序,这个程序可以是修复异常的,可以是设备驱动程序中对设备响应的程序。
3. 恢复 CPU 寄存器,即恢复中断时程序运行的上下文,使程序继续运行。
以上这些操作又要用汇编代码才可以编写,我觉得这是内核中最重要的部分,所以我们建立一个文件,并用 kernel.asm 命名。
我们先来写好完成以上三个功能的汇编宏代码,避免写 256 遍同样的代码,代码如下所示。
//保存中断后的寄存器
%macro SAVEALL 0
push rax
push rbx
push rcx
push rdx
push rbp
push rsi
push rdi
push r8
push r9
push r10
push r11
push r12
push r13
push r14
push r15
xor r14,r14
mov r14w,ds
push r14
mov r14w,es
push r14
mov r14w,fs
push r14
mov r14w,gs
push r14
%endmacro
//恢复中断后寄存器
%macro RESTOREALL 0
pop r14
mov gs,r14w
pop r14
mov fs,r14w
pop r14
mov es,r14w
pop r14
mov ds,r14w
pop r15
pop r14
pop r13
pop r12
pop r11
pop r10
pop r9
pop r8
pop rdi
pop rsi
pop rbp
pop rdx
pop rcx
pop rbx
pop rax
iretq
%endmacro
//保存异常下的寄存器
%macro SAVEALLFAULT 0
push rax
push rbx
push rcx
push rdx
push rbp
push rsi
push rdi
push r8
push r9
push r10
push r11
push r12
push r13
push r14
push r15
xor r14,r14
mov r14w,ds
push r14
mov r14w,es
push r14
mov r14w,fs
push r14
mov r14w,gs
push r14
%endmacro
//恢复异常下寄存器
%macro RESTOREALLFAULT 0
pop r14
mov gs,r14w
pop r14
mov fs,r14w
pop r14
mov es,r14w
pop r14
mov ds,r14w
pop r15
pop r14
pop r13
pop r12
pop r11
pop r10
pop r9
pop r8
pop rdi
pop rsi
pop rbp
pop rdx
pop rcx
pop rbx
pop rax
add rsp,8
iretq
%endmacro
//没有错误码CPU异常
%macro SRFTFAULT 1
push _NOERRO_CODE
SAVEALLFAULT
mov r14w,0x10
mov ds,r14w
mov es,r14w
mov fs,r14w
mov gs,r14w
mov rdi,%1 ;rdi, rsi
mov rsi,rsp
call hal_fault_allocator
RESTOREALLFAULT
%endmacro
//CPU异常
%macro SRFTFAULT_ECODE 1
SAVEALLFAULT
mov r14w,0x10
mov ds,r14w
mov es,r14w
mov fs,r14w
mov gs,r14w
mov rdi,%1
mov rsi,rsp
call hal_fault_allocator
RESTOREALLFAULT
%endmacro
//硬件中断
%macro HARWINT 1
SAVEALL
mov r14w,0x10
mov ds,r14w
mov es,r14w
mov fs,r14w
mov gs,r14w
mov rdi, %1
mov rsi,rsp
call hal_intpt_allocator
RESTOREALL
%endmacro
别看前面的代码这么长,其实最重要的只有两个指令:push、pop,这两个正是用来压入寄存器和弹出寄存器的,正好可以用来保存和恢复 CPU 所有的通用寄存器。
有的 CPU 异常,CPU 自动把异常码压入到栈中,而有的 CPU 异常没有异常码,为了统一,我们对没有异常码的手动压入一个常数,维持栈的平衡。
有了中断异常处理的宏,我们还要它们变成中断异常的处理程序入口点函数。汇编函数其实就是一个标号加一段汇编代码,C 编译器把 C 语言函数编译成汇编代码后,也是标号加汇编代码,函数名就是标号。
下面我们在 kernel.asm 中写好它们:
exc_divide_error:
SRFTFAULT 0
exc_single_step_exception:
SRFTFAULT 1
exc_nmi:
SRFTFAULT 2
exc_breakpoint_exception:
SRFTFAULT 3
exc_overflow:
SRFTFAULT 4
exc_segment_not_present:
SRFTFAULT_ECODE 11
exc_stack_exception:
SRFTFAULT_ECODE 12
exc_general_protection:
SRFTFAULT_ECODE 13
exc_page_fault:
SRFTFAULT_ECODE 14
hxi_exc_general_intpfault:
SRFTFAULT 256
hxi_hwint00:
HARWINT (INT_VECTOR_IRQ0+0)
hxi_hwint01:
HARWINT (INT_VECTOR_IRQ0+1)
hxi_hwint02:
HARWINT (INT_VECTOR_IRQ0+2)
hxi_hwint03:
HARWINT (INT_VECTOR_IRQ0+3)
hxi_hwint04:
HARWINT (INT_VECTOR_IRQ0+4)
hxi_hwint05:
HARWINT (INT_VECTOR_IRQ0+5)
hxi_hwint06:
HARWINT (INT_VECTOR_IRQ0+6)
hxi_hwint07:
HARWINT (INT_VECTOR_IRQ0+7)
为了突出重点,这里没有全部展示代码 ,你只用搞清原理就行了。那有了中断处理程序的入口地址,下面我们就可以在 halsgdidt.c 文件写出函数设置中断门描述符了,代码如下。
上面的代码已经很明显了,一开始把所有中断的处理程序设置为保留的通用处理程序,避免未知中断异常发生了 CPU 无处可去,然后对已知的中断和异常进一步设置,这会覆盖之前的通用处理程序,这样就可以确保万无一失。
下面我们把这些代码整理一下,安装到具体的调用路径上,让上层调用者调用到就好了。
我们依然在 halintupt.c 文件中写上 init_halintupt() 函数:
void init_halintupt()
{
init_idt_descriptor();
init_intfltdsc();
return;
}
到此为止,CPU 体系层面的中断就初始化完成了。你会发现,我们在 init_halintupt() 函数中还调用了 init_intfltdsc() 函数,这个函数是干什么的呢?请往下看。
我们先来设计一下 Cosmos 的中断处理框架,后面我们把中断和异常统称为中断,因为它们的处理方式相同。
前面我们只是解决了中断的 CPU 相关部分,而 CPU 只是响应中断,但是并不能解决产生中断的问题。
比如缺页中断来了,我们要解决内存地址映射关系,程序才可以继续运行。再比如硬盘中断来了,我们要读取硬盘的数据,要处理这问题,就要写好相应的处理函数。
因为有些处理是内核所提供的,而有些处理函数是设备驱动提供的,想让它们和中断关联起来,就要好好设计中断处理框架了。
下面我们来画幅图,描述中断框架的设计:

中断框架设计图
可以看到,中断、异常分发器的左侧的东西我们已经处理完成,下面需要写好中断、异常分发器和中断异常描述符。
我们先来搞定中断异常描述,结合框架图,中断异常描述也是个表,它在 C 语言中就是个结构数组,让我们一起来写好这个数组:
上面结构中,记录了中断了优先级。因为有些中断可以稍后执行,而有的中断需要紧急执行,所以要设计一个优先级。其中还有中断号,中断计数等统计信息。
中断可以由线程的方式执行,也可以是一个回调函数,该函数的地址放另一个结构体中,这个结构体我已经帮你写好了,如下所示。
如果内核或者设备驱动程序要安装一个中断处理函数,就要先申请一个 intserdsc_t 结构体,然后把中断函数的地址写入其中,最后把这个结构挂载到对应的 intfltdsc_t 结构中的 i_serfisrlst 链表中。
你可能要问了,为什么不能直接把中断处理函数放在 intfltdsc_t 结构中呢,还要多此一举搞个 intserdsc_t 结构体呢?
这是因为我们的计算机中可能有很多设备,每个设备都可能产生中断,但是中断控制器的中断信号线是有限的。你可以这样理解:中断控制器最多只能产生几十号中断号,而设备不止几十个,所以会有多个设备共享一根中断信号线。
这就导致一个中断发生后,无法确定是哪个设备产生的中断,所以我们干脆让设备驱动程序来决定,因为它是最了解设备的。
这里我们让这个 intfltdsc_t 结构上的所有中断处理函数都依次执行,查看是不是自己的设备产生了中断,如果是就处理,不是则略过。
好,明白了这两个结构之后,我们就要开始初始化了。首先是在 halglobal.c 文件定义 intfltdsc_t 结构。
下面我们再来实现中断、异常分发器函数,如下所示。
前面的代码确实是按照我们的中断框架设计实现的,下面我们去实现 hal_run_intflthandle 函数,它负责调用中断处理的回调函数。
上述代码已经很清楚了,循环遍历 intfltdsc_t 结构中,i_serlist 链表上所有挂载的 intserdsc_t 结构,然后调用 intserdsc_t 结构中的中断处理的回调函数。
我们 Cosmos 链表借用了 Linux 所用的链表,代码我已经帮你写好了,放在了 list.h 和 list_t.h 文件中,请自行查看。
初始化中断控制器
我们把 CPU 端的中断搞定了以后,还有设备端的中断,这个可以交给设备驱动程序,但是 CPU 和设备之间的中断控制器,还需要我们出面解决。
多个设备的中断信号线都会连接到中断控制器上,中断控制器可以决定启用或者屏蔽哪些设备的中断,还可以决定设备中断之间的优先线,所以它才叫中断控制器。
x86 平台上的中断控制器有多种,最开始是 8259A,然后是 IOAPIC,最新的是 MSI-X。为了简单的说明原理,我们选择了 8259A 中断控制器。
8259A 在任何 x86 平台上都可以使用,x86 平台使用了两片 8259A 芯片,以级联的方式存在。它拥有 15 个中断源(即可以有 15 个中断信号接入)。让我们看看 8259A 在系统上的框架图:

8259A在系统上的框架图
上面直接和 CPU 连接的是主 8259A,下面的是从 8259A,每一个 8259A 芯片都有两个 I/O 端口,我们可以通过它们对 8259A 进行编程。主 8259A 的端口地址是 0x20,0x21;从 8259A 的端口地址是 0xA0,0xA1。
下面我们来做代码初始化,我们程序员可以向 8259A 写两种命令字: ICW 和 OCW;ICW 这种命令字用来实现 8259a 芯片的初始化。而 OCW 这种命令用来向 8259A 发布命令,以对其进行控制。OCW 可以在 8259A 被初始化之后的任何时候被使用。
我已经把代码定好了,放在了 8259.c 文件中,如下所示:
void init_i8259()
{
out_u8_p(ZIOPT, ICW1);
out_u8_p(SIOPT, ICW1);
out_u8_p(ZIOPT1, ZICW2);
out_u8_p(SIOPT1, SICW2);
out_u8_p(ZIOPT1, ZICW3);
out_u8_p(SIOPT1, SICW3);
out_u8_p(ZIOPT1, ICW4);
out_u8_p(SIOPT1, ICW4);
out_u8_p(ZIOPT1, 0xff);
out_u8_p(SIOPT1, 0xff);
return;
}
如果你要了解 8259A 的细节,就是上述代码中为什么要写入这些数据,你可以自己在 Intel 官方网站上搜索 8259A 的数据手册,自行查看。
这里你只要在 init_halintupt() 函数的最后,调用这个函数就行。你有没有想过,既然我们是研究操作系统不是要写硬件驱动,为什么要在初始化中断控制器后,屏蔽所有的中断源呢?因为我们 Cosmos 在初始化阶段还不能处理中断。
到此,我们的 Cosmos 的 hal 层初始化就结束了。关于内存管理器的初始化,我会在内存管理模块讲解,你先有个印象就行。
进入内核层
hal 层的初始化已经完成,按照前面的设计,我们的 Cosmos 还有内核层,我们下面就要进入到内核层,建立一个文件,写上一个函数,作为本课程的结尾。
但是这个函数是个空函数,目前什么也不做,它是为 Cosmos 内核层初始化而存在的,但是由于课程只进行到这里,所以我只是写个空函数,为后面的课程做好准备。
由于内核层是从 hal 层进入的,必须在 hal_start() 函数中被调用,所以在此完成这个函数——init_krl()。
void init_krl()
{
die(0);
return;
}
下面我们在 hal_start() 函数中调用它就行了,如下所示
void hal_start()
{
init_hal();
init_krl();
return;
}
从上面的代码中,不难发现 Cosmos 的 hal 层初始化完成后,就自动进入了 Cosmos 内核层的初始化。至此本课程已经结束。
重点回顾
写一个 C 函数是容易的,但是写操作系统的第一个 C 函数并不容易,好在我们一路坚持,没有放弃,才取得了这个阶段性的胜利。但温故而知新,对学过的东西要学而时习之,下面我们来回顾一下本课程的重点。
1.Cosmos 的第一个 C 函数产生了,它十分简单但极其有意义,它的出现标志着 C 语言的运行环境已经完善。从此我们可以用 C 语言高效地开发操作系统了,由爬行时代进入了跑步前行的状态,可喜可贺。
2. 第一个 C 函数,干的第一件重要工作就是调用 hal 层的初始化函数。这个初始化函数首先初始化了平台,初始化了机器信息结构供内核的其它代码使用,还初始化了我们图形显示驱动、显示了背景图片;其次是初始化了内存管理相关的数据结构;接着初始了中断,中断处理框架是两层,所以最为复杂;最后初始化了中断控制器。
3. 当 hal 层初始化完成了,我们就进入了内核层,由于到了课程的尾声,我们先暂停在这里。
在这节课里我帮你写了很多代码,那些代码非常简单和枯燥,但是必须要有它们才可以。综合我们前面讲过的知识,我相信你有能力看懂它们。
思考题
请你梳理一下,Cosmos hal 层的函数调用关系。
欢迎你在留言区跟我交流互动,也欢迎把这节课转发给你的朋友和同事。
好,我是 LMOS,咱们下节课见!