Linux系统编程——进程替换:exec 函数族

在 Windows 平台下,我们可以通过双击运行可执行程序,让这个可执行程序成为一个进程;而在 Linux 平台,我们可以通过 ./ 运行,让一个可执行程序成为一个进程。

但是,如果我们本来就运行着一个程序( 进程 ),我们如何在这个进程内部启动一个外部程序,由内核将这个外部程序读入内存,使其执行起来成为一个进程呢?这里我们通过 exec 函数族 实现。

exec 函数族 ,顾名思义,就是一簇函数,在 Linux 中,并不存在 exec() 函数,exec 指的是一组函数,一共有 6 个:

#include <unistd.h>
int execl(const char *path, const char *arg, ...);
int execlp(const char *file, const char *arg, ...);
int execle(const char *path, const char *arg, ..., char * const envp[]);
int execv(const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);
int execve(const char *path, char *const argv[], char *const envp[]);

其中只有execve()是真正意义上的系统调用,其它都是在此基础上经过包装的库函数。

exec 函数族提供了六种 在进程中启动另一个程序的方法 。exec 函数族的作用是根据指定的文件名或目录名找到可执行文件,并用它来取代调用进程的内容, 换句话说 ,就是在调用进程内部执行一个可执行文件。

进程调用一种 exec 函数时,该进程完全由新程序替换,而新程序则从其 main 函数开始执行。因为调用 exec 并不创建新进程,所以前后的进程 ID (当然还有父进程号、进程组号、当前工作目录……)并未改变。exec 只是用另一个新程序替换了当前进程的正文、数据、堆和栈段(进程替换)。

exec 函数族 的 6 个函数看起来似乎很复杂,但实际上无论是作用还是用法都非常相似,只有很微小的差别。

l(list):参数地址列表,以空指针结尾。

v(vector):存有各参数地址的指针数组的地址。

p(path):按 PATH 环境变量指定的目录搜索可执行文件。

e(environment):存有环境变量字符串地址的指针数组的地址。

exec 函数族装入并运行可执行程序 path/file,并将参数 arg0 ( arg1, arg2, argv[], envp[] ) 传递给此程序。

exec 函数族与一般的函数不同,exec 函数族中的函数执行成功后不会返回,而且, exec 函数族下面的代码执行不到 。只有调用失败了,它们才会返回 -1,失败后从原程序的调用点接着往下执行。

需要C/C++ Linux服务器架构师学习资料加qun获取(资料包括C/C++,Linux,golang技术,Nginx,ZeroMQ,MySQL,Redis,fastdfs,MongoDB,ZK,流媒体,CDN,P2P,K8S,Docker,TCP/IP,协程,DPDK,ffmpeg等),免费分享

execl() 示例代码:

#include <stdio.h>
#include <unistd.h>
int main(int argc, char *argv[])
 printf("before exec\n\n");
 /* /bin/ls:外部程序,这里是/bin目录的 ls 可执行程序,必须带上路径(相对或绝对)
	   ls:没有意义,如果需要给这个外部程序传参,这里必须要写上字符串,至于字符串内容任意
	   -a,-l,-h:给外部程序 ls 传的参数
	   NULL:这个必须写上,代表给外部程序 ls 传参结束
	execl("/bin/ls", "ls", "-a", "-l", "-h", NULL);
 // 如果 execl() 执行成功,下面执行不到,因为当前进程已经被执行的 ls 替换了
	perror("execl");
 printf("after exec\n\n");
 return 0;
}

运行结果如下:

execv()示例代码:

execv() 和 execl() 的用法基本是一样的,无非将列表传参,改为用指针数组。

#include <stdio.h>
#include <unistd.h>
int main(int argc, char *argv[])
 // execv() 和 execl() 的用法基本是一样的,无非将列表传参,改为用指针数组
 // execl("/bin/ls", "ls", "-a", "-l", "-h", NULL);
 /* 指针数组
	   ls:没有意义,如果需要给这个外部程序传参,这里必须要写上字符串,至于字符串内容任意
	   -a,-l,-h:给外部程序 ls 传的参数
	   NULL:这个必须写上,代表给外部程序 ls 传参结束
 char *arg[]={"ls", "-a", "-l", "-h", NULL};
 // /bin/ls:外部程序,这里是/bin目录的 ls 可执行程序,必须带上路径(相对或绝对)
 // arg: 上面定义的指针数组地址
	execv("/bin/ls", arg);
	perror("execv");
 return 0;
}

execlp() 或 execvp() 示例代码:

execlp() 和 execl() 的区别在于,execlp() 指定的可执行程序可以不带路径名,如果不带路径名的话,会在环境变量 PATH指定的目录里寻找这个可执行程序,而 execl() 指定的可执行程序,必须带上路径名。

#include <stdio.h>
#include <unistd.h>
int main(int argc, char *argv[])
 // 第一个参数 "ls",没有带路径名,在环境变量 PATH 里寻找这个可执行程序
 // 其它参数用法和 execl() 一样
	execlp("ls", "ls", "-a", "-l", "-h", NULL);
	char *arg[]={"ls", "-a", "-l", "-h", NULL};
	execvp("ls", arg);
	perror("execlp");
 return 0;
}

execle() 或 execve() 示例代码:

execle() 和 execve() 改变的是 exec 启动的程序的环境变量( 只会改变进程的环境变量,不会影响系统的环境变量 ),其他四个函数启动的程序则使用默认系统环境变量。

execle()示例代码:

#include <stdio.h>
#include <unistd.h>
#include <stdlib.h> // getenv()
int main(int argc, char *argv[])
 // getenv() 获取指定环境变量的值
 printf("before exec:USER=%s, HOME=%s\n", getenv("USER"), getenv("HOME"));
 // 指针数据
 char *env[]={"USER=MIKE", "HOME=/tmp", NULL};
 /* ./mike:外部程序,当前路径的 mike 程序,通过 gcc mike.c -o mike 编译
		mike:这里没有意义
		NULL:给 mike 程序传参结束
		env:改变 mike 程序的环境变量,正确来说,让 mike 程序只保留 env 的环境变量
	execle("./mike", "mike", NULL, env);
	char *arg[]={"mike", NULL};		
	execve("./mike", arg, env);	
	perror("execle");
 return 0;
}

外部程序,mike.c 示例代码:

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
int main(int argc, char *argv[])