Linux下C编程 » JasonLe's TechBlog

Archive for the ‘Linux下C编程’ category

阻塞，非阻塞访问与异步通知的比较

August 25th, 2015

最近在编写字符设备驱动，在使用场景上面存在不同的实现：阻塞I/O，非阻塞I/O和异步通知三种，之前都是朦朦胧胧知道三者区别，而没有认真的学习三者不同，这这篇文章中我会仔细的比较三者的区别。

设备的阻塞访问

指的是执行设备操作时如果无法回去资源，那么挂起进程，挂起的进程进入休眠状态，kernel将其从rq中移出，直到条件满足，示例代码：

char buf;
fd = open("/dev/ttyS1",O_RDWR);
...
res = read(fd,&buf,1);
if(res == 1)
   printf("%c\n",buf);

阻塞访问的优点就是节省CPU资源，资源没有得到满足，那么挂起即可，进程进入休眠状态，将cpu资源让给其他进程（当然如果进入休眠，那么当资源满足，我们需要一种方式唤醒这个休眠进程，可以使用信号）。阻塞I/O 一般使用等待队列来实现。

设备的非阻塞访问

指的是如果得不到资源，那么立即返回，并不挂起这个进程，我们可以不断的轮训这个设备，直到这个设备满足资源。

char buf;
fd = open("/dev/ttyS1",O_RDWR | O_NONBLOCK);
...
while(read(fd,&buf,1)!= 1)
   printf("%c\n",buf);

非阻塞访问的最大缺点是因为要不停的轮训设备，会浪费大量的cpu时间，但是我们可以借助sigaction通过异步通知的方式访问串口提高cpu利用率，说到非阻塞，通常会用到select() poll() 系统调用，这两个调用最后都会调用到驱动设备中的poll函数。

poll函数原型是unsigned int (* poll)(struct file *filp,struct poll_table *wait),在驱动里面，调用poll_wait() 向poll_table注册等待队列，当字符设备中存在数据时，return POLLIN，POLLRDNORM，POLLOUT。这里我们要注意：设备驱动的poll函数本身并不会阻塞，但是poll和select()系统调用会阻塞等待文件描述符集合中的至少一个可访问或者超时。

异步通知

异步通知的全程是“信号驱动的异步I/O”，也就是说一旦设备准备就绪，主动通知应用程序，这样应用程序根本就不需要查询设备状态。

我们可以使用信号来通知设备处理,其中STDIN_FILENO是int类型，不同于STDIN 的FILE * 类型，使用signal添加信号处理函数，使用fcntl()设置SIGIO信号被STDIN_FILENO接收，之后使用O_ASYNC 使得IO具有异步特性。

#include <sys/types.h>
#include <sys/stat.h>
#include <stdio.h>
#include <fcntl.h>
#include <signal.h>
#include <unistd.h>

#define MAX_LEN 100

void input_handler(int num)
{
        char data[MAX_LEN];
        int len;

        len = read(STDIN_FILENO,&data,MAX_LEN);
        data[len] = 0;
        printf("input:%s\n",data);
}

int main()
{
        int oflags;
        signal(SIGIO,input_handler);
        fcntl(STDIN_FILENO,F_SETOWN,getpid());
        oflags = fcntl(STDIN_FILENO,F_GETFL);
        fcntl(STDIN_FILENO,F_SETFL,oflags | O_ASYNC);

        while(1);
}

[1] UNIX 高级编程

[2] Linux 设备驱动开发

[3] http://stackoverflow.com/questions/15102992/what-is-the-difference-between-stdin-and-stdin-fileno

[4] http://www.c4learn.com/c-programming/c-reference/fread-function/

No comments »

Posted in C/C++, Kernel内核编程, Linux, Linux下C编程

Tags: IO Signal

进程控制踩过的坑

July 1st, 2015

1. fork()与vfork()非常相似，但是使用场景有一些不同，vfork()主要用来创建子进程，然后执行exec()一个新的程序，不会发生COW(fork()出来的子进程exec()会产生COW，所以vfork()更加快速)，vfork()可以保证子进程先运行，调用exec()、exit之后才会被调度，如果子进程依赖父进程产生一些动作的话，可能产生死锁。

2. vfork()在父进程空间中运行，这个导致子进程可以修改父进程的值！

3. 之前在C/S模型下Server 中fork()的健壮性中说过，fork()产生的子进程退出后，发送SIGCHLD信号，如果不及时使用wait方式处理的话，会产生僵尸进程。反过来，如果父进程先停止，那么子进程退出时，会向init进程发送SIGCHLD信号。

4. wait()与waitpid()都可以接受终止子进程发送的信号，wait()是waitpid()的简化版本，wait()返回任意一个终止子进程的状态，waitpid()可以接受特定子进程的信号。

5. 按照之前第3条所叙述的，我们可以利用这个init领养子进程规则让init管理孤儿进程，这里有一个技巧：fork()两次！

int main(void)
{
        pid_t pid;
        if ((pid = fork()) < 0) {
             err_sys("fork error");
        } else if (pid == 0) { /* first child */
             if ((pid = fork()) < 0)
                  err_sys("fork error");
             else if (pid > 0)
                  exit(0); /* parent from second fork == first child */
//这个exit(0)退出的就是第一次fork()出来的子进程，也是第二次fork()的
//父进程，当这个进程退出后，也就意味着第二次fork()出来的子进程变成
//孤儿进程，直接由init接管！
/*
* We’re the second child; our parent becomes init as soon
* as our real parent calls exit() in the statement above.
* Here’s where we’d continue executing, knowing that when
* we’re done, init will reap our status.
*/
//下面这段是第二次fork()出来子进程执行的代码段
            sleep(2);//必须保证第二次fork()出来的父进程先退出！
            printf("second child, parent pid = %ld\n", (long)getppid());
            exit(0);
        }
        if (waitpid(pid, NULL, 0) != pid) /* wait for first child */
            err_sys("waitpid error");
/*
* We’re the parent (the original process); we continue executing,
* knowing that we’re not the parent of the second child.
*/
        exit(0);
}

这个代码设计的很精巧，开始我没有看懂，仔细分析才可以。

6. 对于某些父子进程拥有竞争条件的代码，必须要使用信号机制或者管道机制实现父子进程同步,其中TELL_WAIT(),TELL_PARENT(),WAIT_PARENT(),TELL_CHILD(pid),WAIT_CHILD()可以使用不同的机制定义，从而实现父子进程的有序执行！

     TELL_WAIT(); /* set things up for TELL_xxx & WAIT_xxx */
     if ((pid = fork()) < 0) {
      err_sys("fork error");
     } else if (pid == 0) { /* child */
     /* child does whatever is necessary ... */
     TELL_PARENT(getppid()); /* tell parent we’re done */
     WAIT_PARENT(); /* and wait for parent */
     /* and the child continues on its way ... */
     exit(0);
     }
    /* parent does whatever is necessary ... */
    TELL_CHILD(pid); /* tell child we’re done */
    WAIT_CHILD(); /* and wait for child */
    /* and the parent continues on its way ... */
    exit(0);

7. 使用信号机制来实现父子进程同步的话，可以自定义SIGUSR1，SIGUSR2的方式，在main()开始部位，设置中断处理函数，函数修改一个全局volatile sig_atomic类型的变量sigflag，然后在等待函数中，轮训挂起等待信号，直至进程处理信号，跳出这个循环：

while (sigflag == 0)
       sigsuspend(&zeromask); /* and wait for parent */
sigflag = 0;

8.使用pipe，可以在等待函数中读管道，在通知函数中写管道，达到父子进程的同步！

void TELL_PARENT(pid_t pid)
{
    if (write(pfd2[1], "c", 1) != 1)
        err_sys("write error");
}
void WAIT_PARENT(void)
{
    char c;
    if (read(pfd1[0], &c, 1) != 1)
        err_sys("read error");
    if (c != ’p’)
        err_quit("WAIT_PARENT: incorrect data");
}

参考：
APUE P185，P270，P402

No comments »

Posted in C/C++, Linux, Linux下C编程

Tags: Process

信号处理函数所踩过的坑

June 16th, 2015

Update 2015-6-24

最近在看APUE的信号章节,在这里我总结下进程信号处理中应该注意的一些坑。Unix中有很多的信号是可以被进程接管，然后跳到信号处理函数中。

1. 有两个信号是无法被接管或者被忽略的SIGKILL与SIGSTOP

2. SIGHUP 是要出现在远程ssh一台主机时，连接意外断开时，系统会向所有与这个终端相关的控制进程发送SIGHUP。

3. 在liunx中SIGIO与SIGPOLL相同，默认是终止这个进程。

4. SIGTERM可以由进程编写者定义，当收到这个信号那么，进程可以自行做退出操作的扫尾工作，然后退出程序。

5. signal与sigaction功能相似，但是signal在不同平台上实现不同，应该使用sigaction进程信号的接管。

6. 交互式进程后台运行时，shell会将后台进程设置为对于中断和退出信号的处理方式设置为忽略SIG_IGN。也就是说当向进程发送SIGINT时，捕捉这种类型的代码:

void sig_int(int), sig_quit(int);
if (signal(SIGINT, SIG_IGN) != SIG_IGN)
    signal(SIGINT, sig_int);
if (signal(SIGQUIT, SIG_IGN) != SIG_IGN)
    signal(SIGQUIT, sig_quit);

7. 当父进程fork()一个子进程，子进程将会继承父进程的信号处理函数，这种方式在早期fork()一个子进程后会把这个子进程信号处理函数复位到默认值，我们不必在代码中这么做：

int sig_int(); /* my signal handling function */
...
signal(SIGINT, sig_int); /* establish handler */
...
sig_int()
{
    signal(SIGINT, sig_int); /* reestablish handler for next time */
... /* process the signal ... */
}

8. 信号会发生在任何时刻，我们不能设置flag来使得进程进行忙等。下面这种代码在大多数情况下是正确的，但是如果信号发生在while()与pause()之间，会直接导致进程陷入睡眠，无法醒来。

int sig_int(); /* my signal handling function */
int sig_int_flag; /* set nonzero when signal occurs */
main()
{
     signal(SIGINT, sig_int); /* establish handler */
...
     while (sig_int_flag == 0)
            pause(); /* go to sleep, waiting for signal */
...
}
sig_int()
{
    signal(SIGINT, sig_int); /* reestablish handler for next time */
    sig_int_flag = 1; /* set flag for main loop to examine */
}

9. 被中断的syscall（通常是慢速系统调用：read，write，open()(如果open不返回，就意味着进程会被永久的阻塞) etc.）必须显式的处理出错返回,在linux中被中断的syscall，会重启这个syscall，但是在当次的调用中，会将errno设置为EINTR,所以我们要对这个EINTR进行处理。如下面的代码：

again:
if ((n = read(fd, buf, BUFFSIZE)) < 0) {
    if (errno == EINTR)
        goto again; /* just an interrupted system call */
    /* handle other errors */
}

10. 信号处理函数的可重入性。如果在信号处理函数中调用，会对进程主体的程序执行流造成破坏，产生Sigment fault。在内核中的实现，我发现为了实现进程处理函数在用户态执行，会将内核态的堆栈数据复制到用户空间的堆栈保存，返回用户空间，执行完sys_sigreturn() 再次陷入到内核，将正常程序的用户态堆栈硬件上下文拷贝到内核堆栈，并将之前备份在用户空间的堆栈还原到内核空间，完成这次中断处理函数。

不可重入性:(a) they are known to use static data structures, (b) they call malloc or free, or (c) they are part of the standard I/O library. Most implementations of the standard I/O library use global data structures in a nonreentrant way.

所以按照定义，为了保证函数是可重入的，需要做到一下几点：

不在函数内部使用静态或者全局数据
不返回静态或者全局数据，所有的数据都由函数调用者提供
使用本地数据，或者通过制作全局数据的本地拷贝来保护全局数据
如果必须访问全局数据，使用互斥锁来保护
不调用不可重入函数

getpwnam()函数是非可重入函数，他在中断处理函数中使用的话，就会修改原来应用程序的数据，导致程序出错

#include "apue.h"
#include <pwd.h>
static void
my_alarm(int signo)
{
       struct passwd *rootptr;
       printf("in signal handler\n");
       if ((rootptr = getpwnam("root")) == NULL)
           err_sys("getpwnam(root) error");
        alarm(1);
}
int main(void)
{
       struct passwd *ptr;
       signal(SIGALRM, my_alarm);
       alarm(1);
       for ( ; ; ) {
           if ((ptr = getpwnam("sar")) == NULL)
               err_sys("getpwnam error");
           if (strcmp(ptr->pw_name, "sar") != 0)
               printf("return value corrupted!, pw_name = %s\n",ptr->pw_name);
       }
}

这段代码中的rootptr其实最后都是指向ptr，这就是造成不可重入的关键！我们使用getpwnam_r()函数便可以正常工作。

void sig_handler(int signo)
{
   struct passwd root_ptr;
   struct passwd *result;
   int s;
   char *buf;
   size_t bufsize;

   bufsize = sysconf(_SC_GETPW_R_SIZE_MAX);
   if(bufsize==-1)
      bufsize = 16384;

   buf = malloc(bufsize);
   if(buf==NULL){
      perror("malloc");
      exit(EXIT_FAILURE);
   }

   printf("in sig_handler\n");
   s = getpwnam_r("root",&root_ptr,buf,bufsize,&result);
   if(result == NULL){
      if(s==0)
          printf("Not found\n");
      else{
          // errno = s;
          perror("getpwnam_r");
      }
      exit(EXIT_FAILURE);
   }
   printf("pw_name = %s\n", root_ptr.pw_name);
   alarm(1);
}

11. SIGCHLD这个信号非常特殊，这个信号很多时候与系统的信号实现相关。在linux平台上 SIGCHLD与SIGCLD等同，这里查看C/S模型下Server 中fork()的健壮性文章，我们需要在父进程信号处理函数中调用pid = wait(&stat);实现对于子进程退出的等待。

void sig_zchild(int signo)
{
      pid_t pid;
      int stat;

      while ((pid = waitpid(-1, &stat, WNOHANG)) > 0)
           printf("child %d terminated\n", pid);
      return;
}

12. kill() 函数负责将信号发送给进程或者进程组，raise()是进程向自己发送信号。一个程序全局只能有一个alarm()函数，如果多次调用，那么alarm()登记的值被新值代替。pause()使得调用进程挂起直至捕捉到一个信号，只有执行了一个信号处理函数返回后，pause()才返回。

#include <signal.h>
#include <unistd.h>
static void
sig_alrm(int signo)
{
/* nothing to do, just return to wake up the pause */
}
unsigned int
sleep1(unsigned int seconds)
{
      if (signal(SIGALRM, sig_alrm) == SIG_ERR)
               return(seconds);
      alarm(seconds); /* start the timer */
      pause(); /* next caught signal wakes us up */
      return(alarm(0)); /* turn off timer, return unslept time */
}

这个函数看似正确，但是有一个竞争条件，如果alarm（）后调用被阻塞，然后超时，pause()没有捕捉到信号，那么调用到pause()将永久挂起，这里我们要使用到longjmp() 与 setjmp() 可以使得信号处理函数返回到主函数中指定位置，在longjmp第二个参数设置返回值，在setjmp()中检查这个返回值。可以做到跨函数跳跃，类似于函数内部的goto。

所以使用alarm() pause() 慢速系统调用三者很有可能产生竞争，Linux中syscall是被中断后自启动的。

13. 使用sigprocmask() 可以用来屏蔽，或者取消屏蔽某个信号，但是如果在sigprocmask()之后调用sleep() 函数，程序进入睡眠，这个期间产生的某个屏蔽信号，他会被投递到这个进程，进行处理！ APUE 10-11

14. 使用sigaction(int signum, const struct sigaction *act,struct sigaction *oldact)对于信号进行处理，struct sigaction下的成员变量sa_flags可以定义各种中断的动作，包括被中断的系统调用是否会重启（SA_INTERUPT）还有信号处理函数只执行一次后复位等（SA_RESETHAND）默认sigaction()函数不再重启被中断的系统调用。

15. 使用int sigsuspend(const sigset_t *mask)函数可以挂起当前进程，但是当进程收到mask以外的信号并从中断处理函数返回，那么进程从这个函数返回！mask中的信号，进程会屏蔽掉[4]。

16. sleep() 函数与alarm()函数混用，实现需要依赖于具体实现。

17. SIGSTOP、SIGCONT不允许被接管，如果我们需要在SIGSTOP后自定义一些操作，那么我们可以自定义一个信号和信号处理函数。只要跳转到信号处理函数，那么就可以阻止进程访问错误内存地址，进而可以进行一些处理。

参考：

[1] http://www.cnblogs.com/mickole/p/3187770.html

[2] http://www.man7.org/linux/man-pages/man3/getpwnam.3.html

[3] http://blog.csdn.net/feiyinzilgd/article/details/5811157

[4] http://blog.sina.com.cn/s/blog_6af9566301013xp4.html

No comments »

Posted in C/C++, Linux, Linux下C编程

Tags: Process Signal

内核线程与用户进程在信号处理上的区别

June 8th, 2015

Update 2015-6-11

在上一篇博客里面，我分析了信号在内核中处理的时机，发现对于内核线程没有类似于用户态程序信号处理的机制。后来我发邮件问了kthread的维护者Tetsuo Handa，他明确的给出了我内核线程没有类似于用户进程发送SIGSTOP将进程停止的机制。这个也就意味着我们要想让内核线程接收信号，并进行处理，必须在创建kernel thread代码中显式的允许某个信号。

进程对信号的响应

忽略信号：大部分信号可被忽略，除SIGSTOP和SIGKILL信号外（这是超级用户杀掉或停掉任意进程的手段）。
捕获信号：注册信号处理函数，它对产生的特定信号做处理。
让信号默认动作起作用：unix内核定义的默认动作，有5种情况：
- a) 流产abort：终止进程并产生core文件。
- b) 终止stop：终止进程但不生成core文件。
- c) 忽略：忽略信号。
- d) 挂起suspend：挂起进程。
- e) 继续continue：若进程是挂起的，则resume进程，否则忽略此信号。

通常意义上来说内核线程对于信号是不处理的，如果想显式的让kernel thread支持信号，必须在内核线程中开启signal。编程框架类似于

static int thread_process(void *arg)
{
....
    allow_signal(SIGURG);
    allow_signal(SIGTERM);
    allow_signal(SIGKILL);
    allow_signal(SIGSTOP);
    allow_signal(SIGCONT);  
...
    for ( ; !remove_mod; ) {
        /* Avoid infinite loop */
        msleep(1000);
        if (signal_pending(current)) {
                siginfo_t info;
                unsigned long signr;
                signr = dequeue_signal_lock(current, &current->blocked, &info);
                switch(signr) {
                        case SIGSTOP:
                                printk(KERN_DEBUG "thread_process(): SIGSTOP received.\n");
                                set_current_state(TASK_STOPPED);
                                schedule();
                                break;
                        case SIGCONT:
                                printk(KERN_DEBUG "thread_process(): SIGCONT received.\n");
                                set_current_state (TASK_INTERRUPTIBLE);
                                schedule();
                                break;

                        case SIGKILL:
                                printk(KERN_DEBUG "thread_process(): SIGKILL received.\n");
                                break;
                        //      goto die;

                        case SIGHUP:
                                printk(KERN_DEBUG "thread_process(): SIGHUP received.\n");
                                break;
                        default:
                                printk(KERN_DEBUG "thread_process(): signal %ld received\n", signr);
                        }
        }
        schedule_timeout_interruptible(msecs_to_jiffies(1));
    }
    return 0;
}

在用户态下，我们只需要编写信号处理函数，然后使用signal(sig,handler)方式将信号处理函数与特定信号连接。向内核线程发信号与用户态进程发送信号都是发送某个特定特定pid号,比如19号信号是SIGSTOP，那么我们使用kill -19 pid即可。具体pid解释。

创建内核线程，拥有两种方式1) kthread_create() 2) kernel_thread() 函数，虽然都是创建内核线程，但是二者在原理上不同。kthread_create() 创建的线程是挂在kthreadd()上面，kthread_create创建的内核线程有干净的上那上下文环境，适合于驱动模块或用户空间的程序创建内核线程使用，不会把某些内核信息暴露给用户程序。而kernel_thread()创建的线程来自于init进程。

所以我们推荐使用kthread_create()这种感觉方式创建内核线程，这种方式有利于模块的加载与卸载，有的时候kernel_thread创建的线程不容易卸载，只能通过reboot处理这种问题。

另外我们要非常注意内核线程的可重入性，在线程中使用函数必须保证函数是线程安全的，有些函数并不保证线程安全，如果我们在一个模块中修改全局变量，很有可能导致数据的不一致性，这里有必要要加锁。

参考：

http://www.spongeliu.com/165.html

http://blog.csdn.net/maimang1001/article/details/16906451

No comments »

Posted in Kernel内核编程, Linux, Linux下C编程, Linux驱动开发

Tags: Signal

Coccinelle 使用

January 20th, 2015

Coccinelle是一个程序的匹配和转换引擎，它提供了语言SMPL（语义补丁语言）用于指定C代码所需的匹配和转换。Coccinelle 最初是用来帮助Linux的演变，支持更改库应用程序编程接口，比如重命名一个函数，增加一个依赖于上下文的函数参数或者重新组织一个数据结构。除此之外，Coccinelle页被人用来查找或者修复系统代码的bug。

项目地址：https://github.com/coccinelle/coccinelle

安装在这里不再赘述,这里要注意的是需要安装python的devel包，否则这个程序无法运行！

$git clone https://github.com/coccinelle/coccinelle
$git tag > git checkout -b build coccinelle-1.0.0-rc21
$apt-get install python2.6-dev libpycaml-ocaml-dev libmenhir-ocaml-dev menhir ocaml-native-compilers \
ocamlduce camlp4-extra ocaml-findlib pkg-config texlive-fonts-extra
$./configure --with-python --with-menhir
$make all
$apt-get remove coccinelle (prevent conflict)
$make install

安装完毕之后，我们可以定义脚本

@search@
identifier fn,call;
statement s1,s2;
expression E1,E2;
int fd;
position p;
constant C;
@@

<+...
* fd=open@p(...);
//  ...when != fn(<+...fd...+>);
  ...when !=fd=C
* if (fd<0||...){...}
...+>   

@script:python@
p << search.p;
@@

print "%s equal expression" % (p[0].line)

之后我们可以运行这个脚本，可以快速从代码中匹配。

$spatch -sp_file demos/simple.cocci demos/simple.c -o /tmp/new_simple.c

目前这个项目的问题是文档不是很完善，期待之后这个项目的发展。这个工具吸引人的地方在于可以智能的匹配譬如i++ <=> i=i+1这种形式。

目前我们可以更多的参考/usr/local/share/coccinelle/standard.iso

No comments »

Posted in C/C++, Linux, Linux下C编程

Tags: Code杂谈

Archive for the ‘Linux下C编程’ category

阻塞，非阻塞访问与异步通知的比较

设备的阻塞访问

设备的非阻塞访问

异步通知

进程控制踩过的坑

信号处理函数所踩过的坑

Update 2015-6-24

内核线程与用户进程在信号处理上的区别

Update 2015-6-11

进程对信号的响应

Coccinelle 使用

目前我们可以更多的参考/usr/local/share/coccinelle/standard.iso

Recent Posts

热门文章