June » 2015 » JasonLe's TechBlog

Archive for June, 2015

内核线程与用户进程在信号处理上的区别

June 8th, 2015

Update 2015-6-11

在上一篇博客里面，我分析了信号在内核中处理的时机，发现对于内核线程没有类似于用户态程序信号处理的机制。后来我发邮件问了kthread的维护者Tetsuo Handa，他明确的给出了我内核线程没有类似于用户进程发送SIGSTOP将进程停止的机制。这个也就意味着我们要想让内核线程接收信号，并进行处理，必须在创建kernel thread代码中显式的允许某个信号。

进程对信号的响应

忽略信号：大部分信号可被忽略，除SIGSTOP和SIGKILL信号外（这是超级用户杀掉或停掉任意进程的手段）。
捕获信号：注册信号处理函数，它对产生的特定信号做处理。
让信号默认动作起作用：unix内核定义的默认动作，有5种情况：
- a) 流产abort：终止进程并产生core文件。
- b) 终止stop：终止进程但不生成core文件。
- c) 忽略：忽略信号。
- d) 挂起suspend：挂起进程。
- e) 继续continue：若进程是挂起的，则resume进程，否则忽略此信号。

通常意义上来说内核线程对于信号是不处理的，如果想显式的让kernel thread支持信号，必须在内核线程中开启signal。编程框架类似于

static int thread_process(void *arg)
{
....
    allow_signal(SIGURG);
    allow_signal(SIGTERM);
    allow_signal(SIGKILL);
    allow_signal(SIGSTOP);
    allow_signal(SIGCONT);  
...
    for ( ; !remove_mod; ) {
        /* Avoid infinite loop */
        msleep(1000);
        if (signal_pending(current)) {
                siginfo_t info;
                unsigned long signr;
                signr = dequeue_signal_lock(current, &current->blocked, &info);
                switch(signr) {
                        case SIGSTOP:
                                printk(KERN_DEBUG "thread_process(): SIGSTOP received.\n");
                                set_current_state(TASK_STOPPED);
                                schedule();
                                break;
                        case SIGCONT:
                                printk(KERN_DEBUG "thread_process(): SIGCONT received.\n");
                                set_current_state (TASK_INTERRUPTIBLE);
                                schedule();
                                break;

                        case SIGKILL:
                                printk(KERN_DEBUG "thread_process(): SIGKILL received.\n");
                                break;
                        //      goto die;

                        case SIGHUP:
                                printk(KERN_DEBUG "thread_process(): SIGHUP received.\n");
                                break;
                        default:
                                printk(KERN_DEBUG "thread_process(): signal %ld received\n", signr);
                        }
        }
        schedule_timeout_interruptible(msecs_to_jiffies(1));
    }
    return 0;
}

在用户态下，我们只需要编写信号处理函数，然后使用signal(sig,handler)方式将信号处理函数与特定信号连接。向内核线程发信号与用户态进程发送信号都是发送某个特定特定pid号,比如19号信号是SIGSTOP，那么我们使用kill -19 pid即可。具体pid解释。

创建内核线程，拥有两种方式1) kthread_create() 2) kernel_thread() 函数，虽然都是创建内核线程，但是二者在原理上不同。kthread_create() 创建的线程是挂在kthreadd()上面，kthread_create创建的内核线程有干净的上那上下文环境，适合于驱动模块或用户空间的程序创建内核线程使用，不会把某些内核信息暴露给用户程序。而kernel_thread()创建的线程来自于init进程。

所以我们推荐使用kthread_create()这种感觉方式创建内核线程，这种方式有利于模块的加载与卸载，有的时候kernel_thread创建的线程不容易卸载，只能通过reboot处理这种问题。

另外我们要非常注意内核线程的可重入性，在线程中使用函数必须保证函数是线程安全的，有些函数并不保证线程安全，如果我们在一个模块中修改全局变量，很有可能导致数据的不一致性，这里有必要要加锁。

参考：

http://www.spongeliu.com/165.html

http://blog.csdn.net/maimang1001/article/details/16906451

No comments »

Posted in Kernel内核编程, Linux, Linux下C编程, Linux驱动开发

Tags: Signal

信号处理的时机

June 4th, 2015

Update 2015-6-6

我们知道1-32是最早就拥有的信号，之后又加入了33~64信号。编号为33-64的信号又称为实时信号。需要注意的是：这里的“实时”和实时操作系统中的“实时”没有任何联系，实时信号在处理速度上并不会比普通信号快，它们之间的区别就是：普通信号会对多次的同一个信号进行“合并”处理，而实时信号会一一处理。这就要求我们在编写信号监听函数时，要捕获普通信号，必须时刻轮训监听，因为系统默认会丢弃同种类型的普通信号！

在用户态下，我们向一个进程发送信号，但是这个信号如何被处理呢？其实信号处理的时机就是从异常或中断恢复发生时处理，这里我们可以把中断理解为1）中断 2）system call 两个时机，这两个时机都会有从内核态->用户态切换的过程。

根据ULK中kernel返回用户态的流程图:

我们发现当kernel 从中断异常返回时,会检查USER_RPL决定返回 kernel 还是 userspace，当跳入到resume_userspace，也就意味着在返回用户空间时，检查_TIF_WORK_MASK 是否有信号，如果没有则返回restore_all，否则进入work_pending，其实这里就可以看到信号处理是一个异步的！

ret_from_exception:
    preempt_stop(CLBR_ANY)
ret_from_intr:
    GET_THREAD_INFO(%ebp)
#ifdef CONFIG_VM86
...
#else
    /*
     * We can be coming here from child spawned by kernel_thread().
     */
    movl PT_CS(%esp), %eax
    andl $SEGMENT_RPL_MASK, %eax
#endif
    cmpl $USER_RPL, %eax
    jb resume_kernel        # not returning to v8086 or userspace

ENTRY(resume_userspace)
    LOCKDEP_SYS_EXIT
    DISABLE_INTERRUPTS(CLBR_ANY)    # make sure we don't miss an interrupt
                    # setting need_resched or sigpending
                    # between sampling and the iret
    TRACE_IRQS_OFF
    movl TI_flags(%ebp), %ecx
    andl $_TIF_WORK_MASK, %ecx  # is there any work to be done on
                    # int/exception return?
    jne work_pending
    jmp restore_all
END(ret_from_exception)

如果返回是kernel的话，按照汇编代码与图示，要先禁中断，然后判断__preempt_count变量值，当出现中断嵌套这个值会+1,如果为0也就意味着当前系统没有出现中断的嵌套执行restore_all，否则然后查看X86_EFLAGS_IF是否是禁止屏蔽中断，如果屏蔽中断然后执行restore_all，否则调用preempt_schedule_irq，然后处理信号。直到__preempt_count==0，跳出这个循环。（Linux中的信号机制优先级是：高优先级中断->低优先级中断->软中断->信号->进程运行。）

#ifdef CONFIG_PREEMPT
ENTRY(resume_kernel)
    DISABLE_INTERRUPTS(CLBR_ANY)
need_resched:
    cmpl $0,PER_CPU_VAR(__preempt_count)
    jnz restore_all
    testl $X86_EFLAGS_IF,PT_EFLAGS(%esp)    # interrupts off (exception path) ?
    jz restore_all
    call preempt_schedule_irq
    jmp need_resched
END(resume_kernel)
#endif
    CFI_ENDPROC
...

这里我们进入到work_pending函数段，系统会进行调度，work_resched是个循环，一直在调度schedule，直到跳出循环。在这个汇编的末尾，kernel会判断$USER_RPL 值决定是返回kernel space还是user space，如果返回user space才会调用do_notify_resume()函数，这个函数是处理信号，调用do_signal（）的基础，这个也从侧面反映了内核空间没有信号处理机制！

work_pending:
    testb $_TIF_NEED_RESCHED, %cl
    jz work_notifysig
work_resched:
...
work_notifysig:             # deal with pending signals and
                    # notify-resume requests
#ifdef CONFIG_VM86
...
#else
    movl %esp, %eax
#endif
    TRACE_IRQS_ON
    ENABLE_INTERRUPTS(CLBR_NONE)
    movb PT_CS(%esp), %bl
    andb $SEGMENT_RPL_MASK, %bl
    cmpb $USER_RPL, %bl
    jb resume_kernel
    xorl %edx, %edx
    call do_notify_resume
    jmp resume_userspace

我们进入到do_notify_resume()函数，这个函数会调用do_signal,它就是处理系统调用或者中断发生信号的核心函数，这个函数又依次处理信号（通过调用handle_signal()）和建立用户态堆栈(通过调用setup_frame()或setup_rt_frame())。当进程又切换到用户态时，因为信号处理程序的起始地址被强制放进程序计数器中，因此开始执行信号处理程序。

__visible void
do_notify_resume(struct pt_regs *regs, void *unused, __u32 thread_info_flags)
{
...
    /* deal with pending signal delivery */
    if (thread_info_flags & _TIF_SIGPENDING)
        do_signal(regs);
...
}

当处理程序终止时，setup_frame()或setup_rt_frame()函数(这里的rt代表实时系统中的rt结构。)放在用户态堆栈中的返回代码就被执行。这个代码调用sigreturn()或rt_sigrenturn()系统调用，相应的服务例程把正常程序的用户态堆栈硬件上下文拷贝到内核堆栈，并把用户态堆栈恢复到它原来的状态(通过调用restore_sigcongtext()).当这个系统调用结束时，普通进程就因此能恢复自己的执行。

所以综上所述：

如果我们自定义一个信号处理函数，那么这个处理函数定义在用户空间，1. 在进入内核态时，内核态堆栈中保存了一个中断现场，也就是一个pt_regs结构，中断返回地址就保存在pt_regts中的pc中，因此我们这里只要把当前进程的pt_regs中pc设置为sa_handler，然后返回到用户态就开始从sa_handler处开始执行了。

2.当信号的用户态处理函数执行结束时，需要再次进入内核态，内核专门提供了一个系统调用sys_sigreturn()(还有一个sys_rt_sigreturn())

3.在构建临时堆栈环境时，内核会把最初的pt_regs上下文备份到临时堆栈中(位于用户态堆栈)，当通过系统调用sys_sigreturn()再次进入内核时，内核从用户态空间还原出原始的pt_regs。最后正常返回。

这里我们要考虑一种情况，进程处于TASK_INTERRUPTIBLE状态，某个进程向他发送一个信号，这时kernel将这个进程立即设置为TASK_RUNNING状态，但是系统宾没有完成当前的服务例程，并返回EINTR错误码，我们可以测试这个错误码，并重行发送新的system call，还有一些错误码用来判断kernel是否重行执行system call。

参考：

ULK P445～P446

http://wangyuxxx.iteye.com/blog/1703252

http://blog.csdn.net/ce123_zhouwei/article/details/8570616

1 comment »

Posted in Kernel内核分析, Linux

Tags: Interruption Signal Systemcall SystemTap

Combination Sum 思路

June 1st, 2015

最新刷leetcode的题目，发现了Combination Sum题目，这个题目分为I、II、III。难度层层递进，题目就是遍历vector容器，选择出符合target number的sum组合，这个题目的思路可以参考DFS通用解法。我们使用那个DFS模板，首先要构造dfs函数。

一般情况下，我们需要五个参数：结果，原始数据集，中间结果，当前指向的数据，满足target number的值：

void dfs(vector<vector<int>> &result,vector<int>& candidates,vector<int> path,int current,int target)

然后我们根据candidates中的数据集，深搜这个数据集的各种可能性，将达成target的path中间结果加入result，按照通用模版

void dfs(type &input, type &path, type &result, int cur or gap) {
              if (数据非法) return 0; // 终止条件
              if (cur == input.size()) { // 收敛条件
                  // if (gap == 0) {
                        将path 放入result
              }
              if (可以剪枝) return;
              for(...) { // 执行所有可能的扩展动作
                     执行动作，修改path
                     dfs(input, step + 1 or gap--, result);
                     恢复path
              }
}

第一步：收敛也就是target==0
第二步：使用for(),并在循环中剪枝 if(target-candidates[current]<0) return;
第三步：如果通过第二部，也就意味着这个current合格，可以将这个加入到path中，然后继续深度遍历。dfs(result,candidates,path,current,target-candidates[current]);这里的问题是candidates的数据是可重复的，可以多次使用。如果只使用一次的话，也就意味着我们需要sort(),然后需要将上个满足条件的值跳过，也就是II中的nums[i]==nums[i-1]比较（Combination Sum II）

void dfs(vector<vector<int>> &result,vector<int>& candidates,vector<int> path,int current,int target){
		if(!path.empty()&&target==0){
			result.push_back(path);
			return;
		}
		if(current<candidates.size()){
			int tmp = -1;//start from 0 and 1
			for(;current<candidates.size();current++){
				if(candidates[current]==tmp)
					continue;
				if(target-candidates[current]<0)
					return;

				tmp = candidates[current];
				path.push_back(candidates[current]);
				dfs(result,candidates,path,current+1,target-candidates[current]);
				path.pop_back();
			}
		}
	}

题目：

https://leetcode.com/problems/combination-sum/

https://leetcode.com/problems/combination-sum-ii/

https://leetcode.com/problems/combination-sum-iii/

No comments »

Posted in Algorithm, C/C++, Code杂谈, STL

Tags: Algorithm Code杂谈 STL