关于线程:Linux内核-进程管理

1. 过程和线程

1.1 定义

过程是处于运行状态的程序和相干资源的总称，是资源分配的最小单位。

线程是过程的外部的一个执行序列，是CPU调度的最小单位。

有一段可执行程序代码。
有一段过程专用的零碎堆栈空间和零碎空间堆栈。
有过程描述符，用于形容过程的相干信息。
有独立的存储空间，也就是专有的用户空间，相应的又会有用户空间堆栈。

Linux零碎对于线程实现十分非凡，他并不辨别线程和过程，线程只是一种非凡的过程罢了。从下面四点因素来看，领有前三点而缺第四点因素的就是线程，如果齐全没有第四点的用户空间，那就是零碎线程，如果是共享用户空间，那就是用户线程。

1.2 次要区别

过程作为分配资源的根本单位，而把线程作为独立运行和独立调度的根本单位，因为线程比过程更小，基本上不领有系统资源，故对它的调度所付出的开销就会小得多，能更高效的进步零碎多个程序间并发执行的水平。

过程和线程的次要差异在于它们是不同的操作系统资源管理形式。过程有独立的地址空间，一个过程解体后，在保护模式下不会对其它过程产生影响，而线程只是一个过程中的不同执行门路。线程有本人的堆栈和局部变量，但线程之间没有独自的地址空间，一个线程死掉就等于整个过程死掉，所以多过程的程序要比多线程的程序强壮，但在过程切换时，消耗资源较大，效率要差一些。但对于一些要求同时进行并且又要共享某些变量的并发操作，只能用线程，不能用过程。

总结：linux中，过程和线程惟一区别是有没有独立的地址空间。

2. 过程描述符及工作构造

32位机器上，大概有1.7KB，过程描述符残缺形容一个正在执行的过程的所有信息。

工作队列（双向循环链表）

过程描述符struct task_struct（源代码 | linnux/sched.h | v5.4）

struct task_struct {
    volatile long state;    // -1为不可运行, 0为可运行, >0为已中断
    int lock_depth;        // 锁的深度
    unsigned int policy; // 调度策略：个别有FIFO，RR，CFS
    pid_t pid;   // 过程标识符,用来代表一个过程
    struct task_struct *parent;    // 父过程
    struct list_head children;    // 子过程
    struct list_head sibling;   // 兄弟过程
}

2.1 调配过程描述符

2.1.1 slab分配器

linux采纳slab分配器调配task_struct构造

目标：对象复用和缓存着色。

slab分配器动静生成task_struct，只需在栈底（绝对于向下增长的栈）或栈顶（绝对于向上增长的栈）创立一个新构造struct thread_info。

2.1.2 过程描述符寄存

PID最大值默认为32768（short int 短整形的最大值<linux/threads.h>）可通过批改/proc/sys/kernel/pid_max进步下限。

current宏查找以后正在运行过程的过程描述符。

x86零碎中，current把栈指针后13个无效位屏蔽掉，用来计算出thread_info的偏移。

current_thread_info函数

movl $-8192,%eax
andl %esp,%eax

2.1.3 过程状态

TASK_RUNNING：1. 正在执行 2. 在运行队列中期待执行
TASK_INTERRUPTIBLE：阻塞（可中断）
TASK_UNINTERRUPTIBLE：阻塞（不可中断）
\_\_TASK_TRACED：被其余过程跟踪的过程
\_\_TASK_STOPPED：过程进行

陷入内核执行

零碎调用
异样处理程序

2.1.4 过程家族树

init过程

所有过程都是PID为1的init过程的后辈
内核在系统启动的最初阶段启动init过程。

init过程目标：读取零碎的初始化脚本，并执行其余的相干程序，最终实现系统启动的整个过程。

task_struct中记录父子过程

parent指针（指向父过程）
children子过程链表

3. 过程创立

其余操作系统提供产生（spawn）过程机制，首先在新地址空间里创立过程，读入可执行文件，最初开始执行。

UNIX将上述机制流程分成两步fork()和exec()

fork()拷贝以后过程创立一个子过程
exec()负责读取可执行文件，并将其入地址空间

3.1 写时拷贝（copy-on-write）

使地址空间上的页的拷贝推延到理论产生写入的时候才进行。

原理：如果有过程试图批改一个页，就会产生一个缺页中断。内核解决缺页中断的形式就是对该页进行一次通明复制。这时会革除页面的COW属性，示意着它不再被共享。

3.2 fork()函数

fork()的理论开销就是复制父过程的页表以及给子过程创立惟一的过程描述符。

在当初linux内核中，fork()实际上是由clone()零碎调用实现的

3.2.1 copy_process()函数

dup_task_struct()为新过程创立一个内核栈，thread_info构造和task_struct与以后过程雷同。父子过程描述符是完全相同的。（调配空间）
查看并确保新创建这个过程后，以后用户所领有的过程数目没有超出给它调配的资源的限度。（查看边界）
子过程与父过程区别开。过程描述符的许多成员都要被清0或设初始值，那些不是继承来的过程描述符的成员，次要是统计信息。task_struct中的大多数数据都仍然未被批改。（子过程初始化）
子过程的状态被设置为TASK_UNINTERRUPTIBLE（不可中断，阻塞状态），以保障它不会投入运行。（设置子过程状态）
copy_process()调用copy_flags()以更新task_struct的flags成员。（设置标记位）
- 表明过程是否领有超级用户权限的PF_SUPERPRIV标记被清0
- 表明过程还没有调用exec()函数的PF_FORKNOEXEC标记被设置
调用alloc_pid()为新过程调配一个无效的PID。（为子过程调配pid）
依据传递给clone()的参数，copy_process()拷贝或共享关上的文件、文件系统信息、信号处理函数、过程地址空间和命名空间等。个别状况下，这些资源会被给定的过程的所有线程共享；否则，这些资源对每个过程是不同的，因而被拷贝到这里。（将资源参数标记赋值给构造体）
copy_process()做开头工作并返回一个指向子过程的指针，再回到do_fork()函数，如果copy_process()函数胜利返回，新创建的子过程被唤醒并让其投入运行。（返回子过程指针，并唤醒子过程执行）

注：内核无意让子过程先执行，并非总能如此，因为个别子过程都会马上调用exec()函数，这样能够防止写时拷贝的额定开销。因为父过程先执行，可能往地址空间写入。

3.3 vfork函数

vfork()和fork()区别：vfork()不拷贝父过程的页表项。

vfork()：子过程作为父过程的一个独自线程在它的地址空间里运行，父过程被阻塞，直到子过程退出或执行exec()，子过程不能向地址空间写入。

4. 线程创立

线程创立和过程创立基本一致，通过调用clone()函数传递的参数标记，指明须要共享的资源。

创立线程

clone(CLONE_VM | CLONE_FS | CLONE_FILES | CLONE_SIGHAND, 0);

// CLONE_VM : 地址空间
// CLONE_FS : 文件系统
// CLONE_FILES : 文件描述符
// CLONE_SIGHAND : 信号处理程序及被阻断的信号

创立过程（等同fork()函数）

clone(SIGCHLD,0);

创立过程（等同vfork()函数）

clone(CLONE_VFORK | CLONE_VM | SIGCHLD, 0)

4.1 内核线程

内核线程只在内核空间执行，从不切换到用户空间。

内核线程和一般过程的区别：内核线程没有独立的地址空间。（task_struct的mm指针被设置为NULL）

内核线程只能由其余内核线程创立，通过kthreadd内核线程衍生出所有新的内核线程。（kthreadd是所有内核线程的祖宗）

4.1.1 kthreadd内核线程

kthreadd内核线程是在内核初始化时被创立，循环执行kthreadd函数，它的作用是治理调度其它的内核线程。

kthreadd函数的作用是运行kthread_create_list全局链表中保护的kthread。能够调用kthread_create函数创立一个kthread，它会被退出到kthread_create_list链表中，同时kthread_create函数会唤醒kthreadd_task。kthreadd在执行kthread会调用老的接口，kthreadd内核线程在运行kthread时，会调用老接口kernel_thread，它会运行一个名为“kthread”的内核线程，去运行创立kthread，被执行的kthread会从kthread_create_list链表中删除，并且kthreadd会一直地调用scheduler让出CPU，这个线程不能敞开。

创立内核线程，不运行

kthread_create函数（源代码 | linux/kthread.h | v5.4）是通过clone()零碎调用，创立一个内核线程，但新创建的线程处于不可运行状态。

kthread_create(threadfn, data, namefmt, arg...)

创立内核线程，并运行

kthread_run函数（源代码 | linux/kthread.h | v5.4），通过调用kthread_create函数创立内核线程，而后调用wake_up_process()进行唤醒。

#define kthread_run(threadfn, data, namefmt, ...)               \
({                                       \
    struct task_struct *__k                           \
        = kthread_create(threadfn, data, namefmt, ## __VA_ARGS__); \
    if (!IS_ERR(__k))                           \
        wake_up_process(__k);                       \
    __k;                                   \
})

内核线程进行

int kthread_stop(struct task_struct *k);

5. 过程终结

开释所占用的资源，并告知父过程。

一般来说，过程的析构是本身引起的，它产生在过程调用exit()零碎调用的时候。

既能够显式地调用exit()这个零碎调用，也能够隐性地从某个程序的主函数返回。（C语言编辑器会在main()函数的返回点前面搁置调用exit代码）

终结的工作大部分都靠do_exit()(<kernel/exit.c>)

5.1 do_exit()函数

将task_struct中标记成员设置成PF_EXITING
调用del_timer_sync()删除任一内核定时器。确保没有定时器在排队，也没有定时器处理程序在运行。
如果BSD的记账性能是开启的，do_exit()调用acct_update_integrals()来输入记账信息。
调用exit_mm()函数开释过程占用的mm_struct，如果没有别的过程同时应用它们（也就是说，这个地址空间没有被共享），就彻底开释它们。
调用sem__exit()函数，如果过程排队期待IPC信号，它则来到队列。
调用exit_files()和exit_fs()别离递加文件描述符，文件系统数据援用计数，如果其中某个援用计数的数值降为零，那就不必代表没有过程在应用相应的资源，此时能够开释。
把寄存在task_struct的exit_code()成员中的工作退出代码置为由exit()提供的退出代码，或者去实现任何其余有内核机制规定的退出动作。退出代码寄存在这里供父过程随时检索。
调用exit_notify向父过程发送信号，给子过程从新找养父（其余线程或init过程），并将寄存在task_struct构造中的exit_state设置为EXIT_ZOMBIE。
do_exit调用schedule()切换到新的过程，因为处于EXIT_ZOMBIE状态的过程不会被调度，所以这是过程所执行的最初一段代码，do_exit()永不返回。

5.2 wait族函数

wait族函数都是通过惟一但很简单的一个零碎调用wait4()来实现的，挂起调用它的过程，直到其中的一个子过程退出，此时函数会返回子过程的PID。此外，调用此函数时提供的指针会蕴含子函数的退出代码。

作者：世至其美

更多博客文章：https://hqber.com

关于线程:Linux内核-进程管理

1. 过程和线程

1.1 定义

1.2 次要区别

2. 过程描述符及工作构造

2.1 调配过程描述符

2.1.1 slab分配器

2.1.2 过程描述符寄存

2.1.3 过程状态

2.1.4 过程家族树

3. 过程创立

3.1 写时拷贝（copy-on-write）

3.2 fork()函数

3.2.1 copy_process()函数

3.3 vfork函数

4. 线程创立

4.1 内核线程

4.1.1 kthreadd内核线程

5. 过程终结

5.1 do_exit()函数

5.2 wait族函数

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于线程:Linux内核-进程管理

1. 过程和线程

1.1 定义

1.2 次要区别

2. 过程描述符及工作构造

2.1 调配过程描述符

2.1.1 slab分配器

2.1.2 过程描述符寄存

2.1.3 过程状态

2.1.4 过程家族树

3. 过程创立

3.1 写时拷贝（copy-on-write）

3.2 fork()函数

3.2.1 copy_process()函数

3.3 vfork函数

4. 线程创立

4.1 内核线程

4.1.1 kthreadd内核线程

5. 过程终结

5.1 do_exit()函数

5.2 wait族函数

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复