在TCP网络编程模型中,无论是客户端还是服务端,在网络编程的过程中都需要判断连接的对方网络状态是否正常。在linux系统中,有很多种方式可以判断连接的对方网络是否已经断开。

  • 通过错误码和信号判断
  • 通过select系统函数判断
  • 通过TCP_INFO套接字选项判断
  • 通过SO_KEEPALIVE套接字选项判断
  • 通过SO_RCVTIMEO/SO_SNDTIMEO判断
  • (一)通过错误码和信号判断

    (1)写数据信号和错误码判断

    在写TCP连接数据的时候,如果对方连接已经正常断开,那么写数据端将会收到一个SIGPIPE信号,可以通过这个信号知道对方连接已经断开。该信号信号会终止当前进程,如果不在对方连接断开不退出进程,那么就应该注册信号函数。

    同时,如果对方连接已经正常断开,那么write写数据端将会返回写错误。返回的写长度为-1,此时的错误码为:32,对应错误值为EPIPE;因此可以写数据时write的返回值和错误码来判断对方连接是否已经断开了。

    (2)读数据判断返回值

    如果当前是默认的阻塞模式读取,那么此时read读取返回的长度为0,错误码也是为0,其实表示读取成功。这里需要注意read 和recv接口的默认返回值是不一样的,使用recv接口也会返回EPIPE错误码。
    client_tcp.c

    /************************************************************
    *FileName: 01_client_tcp.c
    *BlogAddr: caibiao-lee.blog.csdn.net
    *Description: TCP 客户端收发数据 
    *Date:     2020-01-04
    *Author:   Caibiao Lee
    *Version:  V1.0
    *Others:
        通过read write 函数的返回值和错误码判断对方连接是否已经断开
    *History:
    ***********************************************************/
    #include <sys/uio.h>
    #include <string.h>
    #include <stdlib.h>
    #include <stdio.h>
    #include <stdlib.h>
    #include <strings.h>
    #include <sys/types.h>
    #include <sys/socket.h>
    #include <unistd.h>
    #include <arpa/inet.h>
    #include <signal.h>
    #include <errno.h>
    #include <netinet/ip.h>
    #include <netinet/tcp.h>
    #define SERVER_IP_ADDR        "192.168.1.111"
    #define PORT 8888    /* 侦听端口地址 */
    void sig_proccess(int signo)
        printf("Catch a exit signal\n");
        exit(0);    
    void sig_pipe(int sign)
        printf("Catch a SIGPIPE signal\n");
        /* 释放资源 */    
    void process_conn_client(int s32SocketFd)
        int size = 0;
        char buffer[1024] = {0};
        char *sendData = "I am client";
        for(;;)
            size = write(s32SocketFd, sendData, strlen(sendData)+1);    
            if(size!=strlen(sendData)+1)
                printf("write data error size=%d errno=%d \n",size,errno);
                //return ;
            size = read(s32SocketFd, buffer, 1024);
            if(size<=0)
                printf("read data error size=%d errno=%d \n",size,errno);
                //return ;                
            }else
                printf("recv Data: %s\n",buffer);
            sleep(1);
    int main(int argc, char *argv[])
        struct sockaddr_in server_addr;    
        int l_s32SocketFd = 0;
        signal(SIGINT, sig_proccess);
        signal(SIGPIPE, sig_pipe);
        /* 建立一个流式套接字 */
        l_s32SocketFd = socket(AF_INET, SOCK_STREAM, 0);
        if(l_s32SocketFd < 0)
        {/* 出错 */
            printf("socket error\n");
            return -1;    
        /* 设置服务器地址 */
        bzero(&server_addr, sizeof(server_addr));        /* 清0 */
        server_addr.sin_family = AF_INET;                /* 协议族 */
        server_addr.sin_addr.s_addr = inet_addr(SERVER_IP_ADDR);/*服务器IP地址*//* 本地地址 */
        server_addr.sin_port = htons(PORT);                /* 服务器端口 */
        /* 连接服务器 */
        connect(l_s32SocketFd, (struct sockaddr*)&server_addr, sizeof(struct sockaddr));
        process_conn_client(l_s32SocketFd);    /* 客户端处理过程 */
        close(l_s32SocketFd);    /* 关闭连接 */
        return 0;
    

    server_tcp.c

    /************************************************************
    *FileName: 01_server_tcp.c
    *BlogAddr: caibiao-lee.blog.csdn.net
    *Description: TCP 客户端收发数据 
    *Date:     2020-01-04
    *Author:   Caibiao Lee
    *Version:  V1.0
    *Others:
        通过read write 函数的返回值和错误码判断对方连接是否已经断开
    *History:
    ***********************************************************/
    #include <sys/uio.h>
    #include <string.h>
    #include <stdlib.h>
    #include <stdio.h>
    #include <stdlib.h>
    #include <strings.h>
    #include <sys/types.h>
    #include <sys/socket.h>
    #include <unistd.h>
    #include <arpa/inet.h>
    #include <signal.h>
    #include <errno.h>
    #include <netinet/ip.h>
    #include <netinet/tcp.h>
    #define SERVER_IP_ADDR        "192.168.1.111"
    #define PORT 8888        /* 侦听端口地址 */
    #define BACKLOG 2        /* 侦听队列长度 */
    void sig_proccess(int signo)
        printf("Catch a exit signal\n");
        exit(0);    
    void sig_pipe(int sign)
        printf("Catch a SIGPIPE signal\n");
        /* 释放资源 */    
    /* 服务器对客户端的处理 */
    void process_conn_server(int s32SocketFd)
        int size = 0;
        char buffer[1024];    /* 数据的缓冲区 */
        for(;;)
            /* 从套接字中读取数据放到缓冲区buffer中 */
            size = read(s32SocketFd, buffer, 1024);    
            if(size==0)
            {/* 没有数据 */
                printf("read size = %d, error %d \n",size,errno);
                //return;    
            }else if(size<0)
                printf("read size = %d, error %d \n",size,errno);
                //return ;
            }else 
                printf("recv data:%s \n",buffer);
            memset(buffer,0,sizeof(buffer));    
            /* 构建响应字符,为接收到客户端字节的数量 */
            strcpy(buffer,"I am server");
            size = write(s32SocketFd, buffer, strlen(buffer)+1);/* 发给客户端 */
            if((strlen(buffer)+1)==size)
            }else
                printf("write data error size = %d, errno=%d\n",size,errno);
            //return ;
            sleep(1);
    int main(int argc, char *argv[])
        int l_s32ServerFd = -1;
        int l_s32ClientrFd = -1;        
        struct sockaddr_in server_addr; /* 服务器地址结构 */
        struct sockaddr_in client_addr;    /* 客户端地址结构 */
        int l_s32Ret = 0;    /* 返回值 */
        pid_t pid;    /* 分叉的进行id */
        signal(SIGINT, sig_proccess);
        signal(SIGPIPE, sig_pipe);
        /* 建立一个流式套接字 */
        l_s32ServerFd = socket(AF_INET, SOCK_STREAM, 0);
        if(l_s32ServerFd < 0)
        {/* 出错 */
            printf("socket error\n");
            return -1;    
        /* 设置服务器地址 */
        bzero(&server_addr, sizeof(server_addr));    /* 清0 */
        server_addr.sin_family = AF_INET;            /* 协议族 */
        server_addr.sin_addr.s_addr = inet_addr(SERVER_IP_ADDR);/*服务器IP地址*/
        server_addr.sin_port = htons(PORT);            /* 服务器端口 */
        /*设置IP地址可以重复绑定*/
        int l_s32UseAddr = 1;
        if(setsockopt(l_s32ServerFd, SOL_SOCKET, SO_REUSEADDR, &l_s32UseAddr, sizeof(int)) < 0)
            printf("%s %d\tsetsockopt error! Error code: %d,Error message: %s\n", 
                __FUNCTION__, __LINE__, errno, strerror(errno));
            return -2;
        /* 绑定地址结构到套接字描述符 */
        l_s32Ret = bind(l_s32ServerFd, (struct sockaddr*)&server_addr, sizeof(server_addr));
        if(l_s32Ret < 0)
        {/* 出错 */
            printf("bind error\n");
            return -1;    
        /* 设置侦听 */
        l_s32Ret = listen(l_s32ServerFd, BACKLOG);
        if(l_s32Ret < 0)
        {/* 出错 */
            printf("listen error\n");
            return -1;    
        /* 主循环过程 */
        for(;;)
            int addrlen = sizeof(struct sockaddr);
            /* 接收客户端连接 */
            l_s32ClientrFd = accept(l_s32ServerFd, (struct sockaddr*)&client_addr, &addrlen);
            if(l_s32ClientrFd < 0)
            {    /* 出错 */
                continue;    /* 结束本次循环 */
            /* 建立一个新的进程处理到来的连接 */
            pid = fork();        /* 分叉进程 */
            if( pid == 0 )
            {        /* 子进程中 */
                close(l_s32ServerFd);        /* 在子进程中关闭服务器的侦听 */
                process_conn_server(l_s32ClientrFd);/* 处理连接 */
            }else
                close(l_s32ClientrFd);        /* 在父进程中关闭客户端的连接 */
    

    (二)通过select系统函数判断

    select实际是IO复用的一个接口,它可以同时检测多个连接是否有数据可读写操作,并且可以设置检测的超时时间。
    在点对点的连接中如果select超时,它返回值为0;

  • 当出现异常的时候,返回-1,如果对方断开可能收到104的错误码,也就是ECONNRESET,表示连接被重置
  • 当select返回1,表示正常,如果read此时返回的值为0,表示对方连接已经断开。
  • /******************************************************** 
    Function:     process_conn_server    
    Description: 服务器对客户端的处理
    Input:    s32SocketFd :服务端接收到客户端连接的ID;
    OutPut: none
    Return: 0: success,none 0:error
    Others: 通过select判断客户端的连接状态
    Author: Caibiao Lee
    Date:    2020-01-04
    *********************************************************/
    void process_conn_server(int s32SocketFd)
        int size = 0;
        int l_s32Ret = 0;
        char buffer[1024];    /* 数据的缓冲区 */
        fd_set l_stReadfd;
        struct timeval l_stTimeout={0};
        for(;;)
            l_stTimeout.tv_sec=0;
            l_stTimeout.tv_usec=10000;
            FD_ZERO(&l_stReadfd);
            FD_SET(s32SocketFd ,&l_stReadfd);
            l_s32Ret = select(s32SocketFd+1, &l_stReadfd,NULL,NULL, &l_stTimeout);
            if (l_s32Ret<=0)
                printf("select error l_s32Ret=%d errno=%d\n",l_s32Ret,errno);
                usleep(100000);
            else if(FD_ISSET(s32SocketFd,&l_stReadfd))
                printf("l_s32Ret = %d \n",l_s32Ret);
                /* 从套接字中读取数据放到缓冲区buffer中 */
                size = read(s32SocketFd, buffer, 1024);    
                if(size==0)
                {/* 没有数据 */
                    printf("read size = %d, error %d \n",size,errno);
                //return;    
                }else if(size<0)
                    printf("read size = %d, error %d \n",size,errno);
                //return ;
                }else 
                    printf("recv data:%s \n",buffer);
            memset(buffer,0,sizeof(buffer));    
            /* 构建响应字符,为接收到客户端字节的数量 */
            strcpy(buffer,"I am server");
            size = write(s32SocketFd, buffer, strlen(buffer)+1);/* 发给客户端 */
            if((strlen(buffer)+1)==size)
            }else
                printf("write data error size = %d, errno=%d\n",size,errno);
            //return ;
            sleep(1);
    

    (三)通过TCP_INFO套接字选项判断

    通过getsockopt函数可以获取TCP连接的连接状态,当状态为ESTABLISHED的时候表示该连接正常。TCP的其它状态还有:

  • CLOSED:表示初始状态。对服务端和C客户端双方都一样。
  • LISTEN:表示监听状态。服务端调用了listen函数,可以开始accept连接了。
  • SYN_SENT:表示客户端已经发送了SYN报文。当客户端调用connect函数发起连接时,首先发SYN给服务端,然后自己进入SYN_SENT状态,并等待服务端发送ACK+SYN。
  • SYN_RCVD:表示服务端收到客户端发送SYN报文。服务端收到这个报文后,进入SYN_RCVD状态,然后发送ACK+SYN给客户端。
  • ESTABLISHED:表示连接已经建立成功了。服务端发送完ACK+SYN后进入该状态,客户端收到ACK后也进入该状态。
  • FIN_WAIT_1:表示主动关闭连接。无论哪方调用close函数发送FIN报文都会进入这个这个状态。
  • FIN_WAIT_2:表示被动关闭方同意关闭连接。主动关闭连接方收到被动关闭方返回的ACK后,会进入该状态。
  • TIME_WAIT:表示收到对方的FIN报文并发送了ACK报文,就等2MSL后即可回到CLOSED状态了。如果FIN_WAIT_1状态下,收到对方同时带FIN标志和ACK标志的报文时,可以直接进入TIME_WAIT状态,而无须经过FIN_WAIT_2状态。
  • CLOSING:表示双方同时关闭连接。如果双方几乎同时调用close函数,那么会出现双方同时发送FIN报文的情况,此时就会出现CLOSING状态,表示双方都在关闭连接。
  • CLOSE_WAIT:表示被动关闭方等待关闭。当收到对方调用close函数发送的FIN报文时,回应对方ACK报文,此时进入CLOSE_WAIT状态。
  • LAST_ACK:表示被动关闭方发送FIN报文后,等待对方的ACK报文状态,当收到ACK后进入CLOSED状态。
    功能代码如下:
  • /******************************************************** 
    Function:     check_tcp_alive    
    Description: 通过TCP_INFO查询网络状态
    Input:    s32SocketFd :服务端接收到客户端连接的ID;
    OutPut: none
    Return: 0: success,none 0:error
    Others: 
    Author: Caibiao Lee
    Date:    2020-01-04
    *********************************************************/
    int check_tcp_alive(int s32SocketFd)
        while(1)
            printf("alive  s32SocketFd = %d \n",s32SocketFd);
            if(s32SocketFd>0)
                struct tcp_info info;
                int len = sizeof(info);
                getsockopt(s32SocketFd, IPPROTO_TCP, TCP_INFO, &info, (socklen_t *)&len);
                printf("info.tcpi_state = %d\n",info.tcpi_state);
                if(info.tcpi_state == TCP_ESTABLISHED)
                    printf("connect ok \r\n");
                    //return 0;
                    printf("connect error\r\n");
                    //return -1;
            sleep(1);
            printf("\n\n");
    

    (四)通过SO_KEEPALIVE套接字选项判断

    选项SO_KEEPALIVE用于设置TCP连接的保持,当设置此项后,连接会测试连接的状态。这个选项用于可能长时间没有数据交流的连接,通常在服务器端进行设置。

    当设置SO_KEEPALIVE选项后,如果在两个小时内没有数据通信时,TCP会自动发送一个活动探测数据报文,对方必须对此进行响应,通常有如下3种情况。

  • TCP的连接正常,发送一个ACK响应,这个过程应用层是不知道的。再过两个小时,又会再发送一个。
  • 对方发送RST响应,对方在2个小时内进行了重启或者崩溃。之前的连接己经失效,套接字收到一个ECONNRESET错误,之前的套接字关闭。
  • 如果对方没有任何响应,则本机会发送另外8个活动探测报文,时间的间隔为75s,当第一个活动报文发送11分15秒后仍然没有收到对方的任何响应,则放弃探测,套接字错误类型设置为ETIMEOUT,并关闭套接字连接。如果收到一个ICMP控制报文响应,此时套接字也关闭,这种情况通常收到的是一个主机不可达的ICMP报文,此时套接字错误类型设置为EHOSTUNREACH,并关闭套接字连接。
     SO_KEEPALIVE的使用场景主要是在可能发送长时间无数据响应的TCP连接,例如Telnet会话,经常会出现打开一个telnet客户端后,长时间不用的情况,这需要服务器或 者客户端有一个探测机制知道对方是否仍然活动。根据探测结果服务器会释放己经失效的客户端,保证服务器资源的有效性,例如有的telnet客户端没有按照正常步骤进行关闭。
  • 网上有不少资料介绍不推荐使用SO_KEEPALIVE来判断网络连接是否断开,具体原因没有去追踪,这里不再介绍它的使用。

    (五)通过SO_RCVTIMEO/SO_SNDTIMEO判断

    这个是通过套接字的SO_RCVTIMEOSO_SNDTIMEO来设置收发数据超时。对于前面的前面的几种判断方式,都是基于对方正常网络断开后,主机才能够正常的判断到网络状态。如果连接的某一方突然断电,主机并不能知道对方设备突然断电,通过TCP_INFO查询到的也是网络正常,但实际情况是这是网络连接已经断开了。

    这时,可以使用收发数据超时来判断:
        如果设置的时间没有收到数据,read时会返回-1,同时有错误码EAGAIN产生,这时是可以判断出对连接已经断开了。
        这种方式的确定就是,如果设定的一段时间没有收发数据,就会被判断为超时断开连接。

    /******************************************************** 
    Function:     process_conn_server    
    Description: 通过设置收发操作判断对方连接已经断开了
    Input:    s32SocketFd :服务端接收到客户端连接的ID;
    OutPut: none
    Return: 0: success,none 0:error
    Others: 
    Author: Caibiao Lee
    Date:    2020-01-04
    *********************************************************/
    void process_conn_server(int s32SocketFd)
        int size = 0;
        char buffer[1024];    /* 数据的缓冲区 */
        int optlen = -1;    /* 整型的选项类型值 */
        int l_s32Ret = 0;
        /* 设置发送和接收超时时间 */
        struct timeval tv;
        tv.tv_sec = 10;    /* 1秒 */
        tv.tv_usec = 200000;/* 200ms */
        optlen = sizeof(tv);
        l_s32Ret = setsockopt(s32SocketFd, SOL_SOCKET, SO_RCVTIMEO, &tv, optlen); /* 设置接收超时时间 */
        if(l_s32Ret == -1){/* 设置接收超时时间失败 */
            printf("设置接收超时时间失败\n");            
        l_s32Ret = setsockopt(s32SocketFd, SOL_SOCKET, SO_SNDTIMEO, &tv, optlen);/* 设置发送超时时间 */
        if(l_s32Ret == -1){
            printf("设置发送超时时间失败\n");            
        for(;;)
            /* 从套接字中读取数据放到缓冲区buffer中 */
            size = read(s32SocketFd, buffer, 1024);    
            if(size==0)
            {/* 没有数据 */
                printf("read size = %d, error %d \n",size,errno);
                //return;    
            }else if(size<0)
                printf("read size = %d, error %d \n",size,errno);
                //return ;
            }else 
                printf("recv data:%s \n",buffer);
            memset(buffer,0,sizeof(buffer));    
            /* 构建响应字符,为接收到客户端字节的数量 */
            strcpy(buffer,"I am server");
            size = write(s32SocketFd, buffer, strlen(buffer)+1);/* 发给客户端 */
            if((strlen(buffer)+1)==size)
            }else
                printf("write data error size = %d, errno=%d\n",size,errno);
            //return ;
            sleep(1);
    

    (六)自定义通信心跳判断

    在一些比较重要的命令收发链接中,一般是客户端和服务端会建立心跳机制,心跳时间间隔根据不同的业务需求而不同。当约定的时间段内没有收到心跳数据包,就可以判断对方是否已经断开了连接。

    这种方式非常简单,对于嵌入式设备而言,主要的缺点是心跳会耗费流量,同时会增加一点点系统负载,并且不适合并发连接的情况。

    以上就是现在比较常用的判断网络连接的方法。 如有错误,欢迎指出!

    ---------------------------End---------------------------

    长按识别二维码
    关注 liwen01 公众号