详解linux系统调用原理

GQ00

2019-04-21

操作系统通过系统调用为运行于其上的进程提供服务。

当用户态进程发起一个系统调用， CPU 将切换到内核态并开始执行一个内核函数。内核函数负责响应应用程序的要求，例如操作文件、进行网络通讯或者申请内存资源等。

举一个最简单的例子，应用进程需要输出一行文字，需要调用 write 这个系统调用：

hello_world.c

#include <string.h>
#include <unistd.h>

int main(int argc, char *argv[])
{
 char *msg = "Hello, world!\n";
 write(1, msg, strlen(msg));

 return 0;
}

注解

读者可能会有些疑问――输出文本不是用 printf 等函数吗？

确实是。 printf 是更高层次的库函数，建立在系统调用之上，实现数据格式化等功能。因此，本质上还是系统调用起决定性作用。

调用流程

那么，在应用程序内，调用一个系统调用的流程是怎样的呢？

我们以一个假设的系统调用 xyz 为例，介绍一次系统调用的所有环节。

详解linux系统调用原理

如上图，系统调用执行的流程如下：

应用程序代码调用系统调用( xyz )，该函数是一个包装系统调用的库函数；
库函数 ( xyz )负责准备向内核传递的参数，并触发软中断以切换到内核；
CPU 被软中断打断后，执行中断处理函数，即系统调用处理函数 ( system_call )；
系统调用处理函数调用系统调用服务例程 ( sys_xyz )，真正开始处理该系统调用；

执行态切换

应用程序 ( application program )与库函数 ( libc )之间，系统调用处理函数 ( system call handler )与系统调用服务例程 ( system call service routine )之间，均是普通函数调用，应该不难理解。而库函数与系统调用处理函数之间，由于涉及用户态与内核态的切换，要复杂一些。

Linux 通过软中断实现从用户态到内核态的切换。用户态与内核态是独立的执行流，因此在切换时，需要准备执行栈并保存寄存器。

内核实现了很多不同的系统调用(提供不同功能)，而系统调用处理函数只有一个。因此，用户进程必须传递一个参数用于区分，这便是系统调用号 ( system call number )。在 Linux 中，系统调用号一般通过 eax 寄存器来传递。

总结起来，执行态切换过程如下：

应用程序在用户态准备好调用参数，执行 int 指令触发软中断，中断号为 0x80 ；
CPU 被软中断打断后，执行对应的中断处理函数，这时便已进入内核态；
系统调用处理函数准备内核执行栈，并保存所有寄存器 (一般用汇编语言实现)；
系统调用处理函数根据系统调用号调用对应的 C 函数―― 系统调用服务例程；
系统调用处理函数准备返回值并从内核栈中恢复寄存器；
系统调用处理函数执行 ret 指令切换回用户态；

编程实践

下面，通过一个简单的程序，看看应用程序如何在用户态准备参数并通过 int 指令触发软中断以陷入内核态执行系统调用：

hello_world-int.S

.section .rodata

msg:
 .ascii "Hello, world!\n"

.section .text

.global _start

_start:
 # call SYS_WRITE
 movl $4, %eax
 # push arguments
 movl $1, %ebx
 movl $msg, %ecx
 movl $14, %edx
 int $0x80

 # Call SYS_EXIT
 movl $1, %eax
 # push arguments
 movl $0, %ebx
 # initiate
 int $0x80

这是一个汇编语言程序，程序入口在 _start 标签之后。

第 12 行，准备系统调用号：将常数 4 放进寄存器 eax 。系统调用号 4 代表系统调用 SYS_write ，我们将通过该系统调用向标准输出写入一个字符串。

第 14-16 行，准备系统调用参数：第一个参数放进寄存器 ebx ，第二个参数放进 ecx ，以此类推。

write 系统调用需要 3 个参数：

文件描述符，标准输出文件描述符为 1 ；
写入内容(缓冲区)地址；
写入内容长度(字节数)；

第 17 行，执行 int 指令触发软中断 0x80 ，程序将陷入内核态并由内核执行系统调用。系统调用执行完毕后，内核将负责切换回用户态，应用程序继续执行之后的指令( 从 20 行开始 )。

第 20-24 行，调用 exit 系统调用，以便退出程序。

注解
注意到，这里必须显式调用 exit 系统调用退出程序。否则，程序将继续往下执行，最终遇到段错误( segmentation fault )！

读者可能很好奇――我在写 C 语言或者其他程序时，这个调用并不是必须的！

这是因为 C 库( libc )已经帮你把脏活累活都干了。

接下来，我们编译并执行这个汇编语言程序：

$ ls
hello_world-int.S
$ as -o hello_world-int.o hello_world-int.S
$ ls
hello_world-int.o hello_world-int.S
$ ld -o hello_world-int hello_world-int.o
$ ls
hello_world-int hello_world-int.o hello_world-int.S
$ ./hello_world-int
Hello, world!

其实，将系统调用号和调用参数放进正确的寄存器并触发正确的软中断是个重复的麻烦事。 C 库已经把这脏累活给干了――试试 syscall 函数吧！

hello_world-syscall.c

#include <string.h>
#include <sys/syscall.h>
#include <unistd.h>

int main(int argc, char *argv[])
{
 char *msg = "Hello, world!\n";
 syscall(SYS_write, 1, msg, strlen(msg));

 return 0;
}

系统调用 linux系统软中断

安科网

详解linux系统调用原理

GQ00

GQ00

相关推荐

从Linux源码看Socket(TCP)的Listen及连接队列

一篇读懂Linux 是如何管理内存的

浅析Linux中的零拷贝技术

课程学习总结报告

结合中断上下文切换和进程上下文切换分析Linux内核一般执行过程

结合中断上下文切换和进程上下文切换分析Linux内核的一般执行过程

结合中断上下文切换和进程上下文切换分析Linux内核的一般执行过程

Lab3：结合中断上下文切换和进程上下文切换分析Linux内核一般执行过程

结合中断上下文切换和进程上下文切换分析Linux内核的一般执行过程

结合中断上下文切换和进程上下文切换分析Linux内核的一般执行过程

结合中断上下文切换和进程上下文切换分析Linux内核的一般执行过程

结合中断上下文切换和进程上下文切换分析Linux内核一般执行过程

结合中断上下文切换和进程上下文切换分析Linux内核的一般执行过程

结合中断上下文切换和进程上下文切换分析Linux内核的一般执行过程

结合中断上下文切换和进程上下文切换分析Linux内核的一般执行过程

Lab3—结合中断上下文切换和进程上下文切换分析Linux内核的一般执行过程

结合中断上下文切换和进程上下文切换分析Linux内核的一般执行过程

结合中断上下文切换和进程上下文切换分析Linux内核的一般执行过程

结合中断上下文切换和进程上下文切换分析Linux内核的一般执行过程

结合中断上下文切换和进程上下文切换分析Linux内核的一般执行过程

GQ00