//非阻塞连接

   //非阻塞连接

一. 常见的socket API读写函数:(注意linux下tcp socket有发送缓冲区和接收缓冲区,调用write/send实际是先发到内核缓冲区中,由内核协议栈等待网络空闲时再发送出去;接收同理。udp只有接收缓冲区而没有发送缓冲区)

1. 读函数read (默认阻塞)
ssize_t read(int fd,void *buf,size_t nbyte);

read函数是负责从fd中读取内容.当读成功 时,read返回实际所读的字节数,如果返回的值是0 表示已经读到文件的结束了,小于0表示出现了错误.如果错误为EINTR说明读是由中断引起 的, 如果是ECONNREST表示网络连接出了问题. 和上面一样,我们也写一个自己的读函数

int my_read(int fd,void *buffer,int length)
 {
 int bytes_left;
 int bytes_read;
 char *ptr;
   
 bytes_left=length;
 while(bytes_left>0)
 {
     bytes_read=read(fd,ptr,bytes_read);
     if(bytes_read<0)
     {
       if(errno==EINTR)
          bytes_read=0;
       else
          return(-1);
     }
     else if(bytes_read==0)
         break;
      bytes_left-=bytes_read;
      ptr+=bytes_read;
 }
 return(length-bytes_left);
 }2.写函数write   (非阻塞,除非发送缓冲区已满?)
ssize_t write(int fd, const void*buf,size_t nbytes);
write函数将buf中的nbytes字节内容写入文件描述符fd.成功时返回写的字节数.失败时返回-1. 并设置errno变量. 在网络程序中,当我们向套接字文件描述符写时有两可能.
 1)write的返回值大于0,表示写了部分或者是全部的数据. 这样我们用一个while循环来不停的写入,但是循环过程中的buf参数和nbyte参数得由我们来更新。也就是说,网络写函数是不负责将全部数据写完之后在返回的。
 2)返回的值小于0,此时出现了错误.我们要根据错误类型来处理.
 如果错误为EINTR表示在写的时候出现了中断错误.
 如果为EPIPE表示网络连接出现了问题(对方已经关闭了连接).
 为了处理以上的情况,我们自己编写一个写函数来处理这几种情况.int my_write(int fd,void *buffer,int length)
 {
 int bytes_left;
 int written_bytes;
 char *ptr;

 ptr=buffer;
 bytes_left=length;
 while(bytes_left>0)
 {
         
          written_bytes=write(fd,ptr,bytes_left);
          if(written_bytes<=0)
          {       
                  if(errno==EINTR)
                          written_bytes=0;
                  else             
                          return(-1);
          }
          bytes_left-=written_bytes;
          ptr+=written_bytes;     
 }
 return(0);
 }3. recv和send  (默认阻塞属性和read/write一致)
 recv和send函数提供了和read和write差不多的功能.不过它们提供了第四个参数来控制读写操作.

 int recv(int sockfd,void *buf,int len,int flags)
 int send(int sockfd,void *buf,int len,int flags)

 前面的三个参数和read,write一样,第四个参数可以是0或者是以下的组合
 _______________________________________________________________
 | MSG_DONTROUTE | 不查找表 |
 | MSG_OOB | 接受或者发送带外数据 |
 | MSG_PEEK | 查看数据,并不从系统缓冲区移走数据 |
 | MSG_WAITALL | 等待所有数据 |
 |--------------------------------------------------------------|



MSG_DONTROUTE:是send函数使用的标志.这个标志告诉IP.目的主机在本地网络上面,没有必要查找表.这个标志一般用网络诊断和路由程序里面.
MSG_OOB:表示可以接收和发送带外的数据.关于带外数据我们以后会解释的.

MSG_PEEK:是recv函数的使用标志,表示只是从系统缓冲区中读取内容,而不清除系统缓冲区的内容.这样下次读的时候,仍然是一样的内容.一般在有多个进程读写数据时可以使用这个标志.

MSG_WAITALL是recv函数的使用标志,表示等到所有的信息到达时才返回.使用这个标志的时候recv回一直阻塞,直到指定的条件满足,或者是发生了错误. 1)当读到了指定的字节时,函数正常返回.返回值等于len 2)当读到了文件的结尾时,函数正常返回.返回值小于len 3)当操作发生错误时,返回-1,且设置错误为相应的错误号(errno)

二. 关于非阻塞连接(一般用于客户端)

socket API中read,accept(服务端),connect(客户端)均会阻塞,一般服务端为单独一个线程,可以一直阻塞等待客户端连接,而客户端在很多应用场景中往往仅需要进行一次短连接而不想一直阻塞线程,这时候有一般有两种方法实现非阻塞:方法一,将socket句柄设置为非阻塞状态ioctl或fcntl+select(使connect非阻塞);方法二、使用setsockopt函数设置接收超时时间(使read/recv非阻塞,但一般也可直接使用select)   

1.  使用ioctl或fcntl+select

客户端调用connect()发起对服务端的socket连接,如果客户端的socket描述符为阻塞模式,则connect()会阻塞到连接建立成功或连接建立超时(linux内核中对connect的超时时间限制是75s, Soliris 9是几分钟,因此通常认为是75s到几分钟不等)。如果为非阻塞模式,则调用connect()后函数立即返回,如果连接不能马上建立成功(返回-1),则errno设置为EINPROGRESS,此时TCP三次握手仍在继续。此时可以调用select()检测非阻塞connect是否完成。select指定的超时时间可以比connect的超时时间短,因此可以防止连接线程长时间阻塞在connect处,以下是测试实现代码

#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <sys/types.h>
#include <errno.h>
#include <unistd.h>
#include <fcntl.h>
#include <sys/select.h>
#include<sys/ioctl.h>
 
 
//inet_addr()
#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>
 
 
#define PEER_IP     "192.254.1.1"
#define PEER_PORT   7008
int main(int argc, char **argv)
{
 int ret = 0;
 int sock_fd;
 int flags;
 struct sockaddr_in addr;
 
 /* obtain a socket */
 sock_fd = socket(AF_INET, SOCK_STREAM, 0);
 
 /* set non-blocking mode on socket*/
#if 1
 flags = fcntl(sock_fd, F_GETFL, 0);
 fcntl(sock_fd, F_SETFL, flags|O_NONBLOCK);
#else
 int imode = 1;
 ioctl(sock_fd, FIONBIO, &imode);
#endif
 
 
 /* connect to server */
 addr.sin_family  = AF_INET;
 addr.sin_port  = htons(PEER_PORT);
 addr.sin_addr.s_addr = inet_addr(PEER_IP);
 int res = connect(sock_fd, (struct sockaddr *)&addr, sizeof(struct sockaddr_in));
 if (0 == res)
 {
  printf("socket connect succeed immediately.\n");
        ret = 0;
 }
 else
 {
  printf("get the connect result by select().\n");
   if (errno == EINPROGRESS)
   {
            int times = 0;
            while (times++ < 5)
            {
                fd_set rfds, wfds;
                struct timeval tv;
                
                printf("errno = %d\n", errno);
                FD_ZERO(&rfds);
                FD_ZERO(&wfds);
                FD_SET(sock_fd, &rfds);
                FD_SET(sock_fd, &wfds);
                
                /* set select() time out */
                tv.tv_sec = 10; 
                tv.tv_usec = 0;
                int selres = select(sock_fd + 1, &rfds, &wfds, NULL, &tv);
                switch (selres)
                {
                    case -1:
                        printf("select error\n");
                        ret = -1;
                        break;
                    case 0:
                        printf("select time out\n");
                        ret = -1;
                        break;
                    default:
                        if (FD_ISSET(sock_fd, &rfds) || FD_ISSET(sock_fd, &wfds))
                        {
                        #if 0 // not useable in linux environment, suggested in <<Unix network programming>>
                            int errinfo, errlen;
                            if (-1 == getsockopt(sock_fd, SOL_SOCKET, SO_ERROR, &errinfo, &errlen))
                            {
                                printf("getsockopt return -1.\n");
                                ret = -1;
                                break;
                            }
                            else if (0 != errinfo)
                            {
                                printf("getsockopt return errinfo = %d.\n", errinfo);
                                ret = -1;
                                break;
                            }
                            
                            ret = 0;
                            printf("connect ok?\n");
                        #else
                        #if 1
                            connect(sock_fd, (struct sockaddr *)&addr, sizeof(struct sockaddr_in));
                            int err = errno;
                            if  (err == EISCONN)
                            {
                                printf("connect finished 111.\n");
                                ret = 0;
                            }
                            else
                            {
                                printf("connect failed. errno = %d\n", errno);
                                printf("FD_ISSET(sock_fd, &rfds): %d\n FD_ISSET(sock_fd, &wfds): %d\n", FD_ISSET(sock_fd, &rfds) , FD_ISSET(sock_fd, &wfds));
                                ret = errno;
                            }
                        #else
                        char buff[2];
                        if (read(sock_fd, buff, 0) < 0)
                        {
                            printf("connect failed. errno = %d\n", errno);
                            ret = errno;
                        }
                        else
                        {
                            printf("connect finished.\n");
                            ret = 0;
                        }
                        #endif
                        #endif
                        }
                        else
                        {
                            printf("haha\n");
                        }
                }
                
                if (-1 != selres && (ret != 0))
                {
                    printf("check connect result again... %d\n", times);
                    continue;
                }
                else
                {
                    break;
                }
            }
  }
  else
  {
   printf("connect to host %s:%d failed.\n", PEER_IP, PEER_PORT);
   ret = errno;
  }
 }
 if (0 == ret)
    {
        send(sock_fd, "12345", sizeof("12345"), 0);
    }
    else
    {
        printf("connect to host %s:%d failed.\n", PEER_IP, PEER_PORT);
    }
    
    close(sock_fd);
 return ret;
}

2.  使用setsockopt函数

在TCP连接中,recv等函数默认为阻塞模式(block),即直到有数据到来之前函数不会返回,而我们有时则需要一种超时机制使其在一定时间后返回而不管是否有数据到来,这里我们就会用到setsockopt()函数:
  

int  setsockopt(int  s, int level, int optname, void* optval, socklen_t* optlen);
     这里我们要涉及到一个结构:
     struct timeval
     {
             time_t tv_sec;
             time_t tv_usec;
     };
     这里第一个域的单位为秒,第二个域的单位为微秒。
     struct timeval tv_out;
     tv_out.tv_sec = 1;
     tv_out.tv_usec = 0;
     填充这个结构后,我们就可以以如下的方式调用这个函数:
     setsockopt(fd, SOL_SOCKET, SO_RCVTIMEO, &tv_out, sizeof(tv_out));(具体参数可以man一下,或查看MSDN)
     这样我们就设定了recv()函数的超时机制,当超过tv_out设定的时间而没有数据到来时recv()就会返回0值。 
(1).closesocket(一般不会立即关闭而经历TIME_WAIT的过程)后想继续重用该socket:
 BOOL bReuseaddr=TRUE;
 setsockopt(s,SOL_SOCKET ,SO_REUSEADDR,(const char*)&bReuseaddr,sizeof(BOOL)); (2). 如果要已经处于连接状态的soket在调用closesocket后强制关闭,不经历
 TIME_WAIT的过程:
 BOOL bDontLinger = FALSE;
 setsockopt(s,SOL_SOCKET,SO_DONTLINGER,(const char*)&bDontLinger,sizeof(BOOL)); (3).在send(),recv()过程中有时由于网络状况等原因,发收不能预期进行,而设置收发时限:
 int nNetTimeout=1000;//1秒
 //发送时限
 setsockopt(socket,SOL_S0CKET,SO_SNDTIMEO,(char *)&nNetTimeout,sizeof(int));
 //接收时限
 setsockopt(socket,SOL_S0CKET,SO_RCVTIMEO,(char *)&nNetTimeout,sizeof(int)); (4).在send()的时候,返回的是实际发送出去的字节(同步)或发送到socket缓冲区的字节
 (异步);系统默认的状态发送和接收一次为8688字节(约为8.5K);在实际的过程中发送数据
 和接收数据量比较大,可以设置socket缓冲区,而避免了send(),recv()不断的循环收发:
 // 接收缓冲区
 int nRecvBuf=32*1024;//设置为32K
 setsockopt(s,SOL_SOCKET,SO_RCVBUF,(const char*)&nRecvBuf,sizeof(int));
 //发送缓冲区
 int nSendBuf=32*1024;//设置为32K
 setsockopt(s,SOL_SOCKET,SO_SNDBUF,(const char*)&nSendBuf,sizeof(int)); (5). 如果在发送数据的时,希望不经历由系统缓冲区到socket缓冲区的拷贝而影响
 程序的性能:
 int nZero=0;
 setsockopt(socket,SOL_S0CKET,SO_SNDBUF,(char *)&nZero,sizeof(nZero)); (6).同上在recv()完成上述功能(默认情况是将socket缓冲区的内容拷贝到系统缓冲区):
 int nZero=0;
 setsockopt(socket,SOL_S0CKET,SO_RCVBUF,(char *)&nZero,sizeof(int)); (7).一般在发送UDP数据报的时候,希望该socket发送的数据具有广播特性:
 BOOL bBroadcast=TRUE;
 setsockopt(s,SOL_SOCKET,SO_BROADCAST,(const char*)&bBroadcast,sizeof(BOOL)); (8).在client连接服务器过程中,如果处于非阻塞模式下的socket在connect()的过程中可
 以设置connect()延时,直到accpet()被呼叫(本函数设置只有在非阻塞的过程中有显著的
 作用,在阻塞的函数调用中作用不大)
 BOOL bConditionalAccept=TRUE;
 setsockopt(s,SOL_SOCKET,SO_CONDITIONAL_ACCEPT,(const char*)&bConditionalAccept,sizeof(BOOL));

(9).如果在发送数据的过程中(send()没有完成,还有数据没发送)而调用了closesocket(),以前我们
一般采取的措施是"从容关闭"shutdown(s,SD_BOTH),但是数据是肯定丢失了,如何设置让程序满足具体
应用的要求(即让没发完的数据发送出去后在关闭socket)?

struct linger {
 u_short l_onoff;
 u_short l_linger;
 };
 linger m_sLinger;
 m_sLinger.l_onoff=1;//(在closesocket()调用,但是还有数据没发送完毕的时候容许逗留)
 // 如果m_sLinger.l_onoff=0;则功能和2.)作用相同;
 m_sLinger.l_linger=5;//(容许逗留的时间为5秒)
 setsockopt(s,SOL_SOCKET,SO_LINGER,(const char*)&m_sLinger,sizeof(linger));

    setsockopt()函数功能描述:

        获取或者设置与某个套接字关联的选 项。选项可能存在于多层协议中,它们总会出现在最上面的套接字层。当操作套接字选项时,

选项位于的层和选项的名称必须给出。为了操作套接字层的选项,应该 将层的值指定为SOL_SOCKET。为了操作其它层的选项,控制选

项的合适协议号必须给出。例如,为了表示一个选项由TCP协议解析,层应该设定为协议 号TCP。

用法:

#include <sys/types.h>
 #include <sys/socket.h>

 int getsockopt(int sock, int level, int optname, void *optval, socklen_t *optlen);

 int setsockopt(int sock, int level, int optname, const void *optval, socklen_t optlen);



参数:  
sock:将要被设置或者获取选项的套接字。
level:选项所在的协议层。通常为SOL_SOCKET 

optname:需要访问的选项名。
 optval:对于getsockopt(),指向返回选项值的缓冲。对于setsockopt(),指向包含新选项值的缓冲。
 optlen:对于getsockopt(),作为入口参数时,选项值的最大长度。作为出口参数时,选项值的实际长度。对于setsockopt(),现选项的长度。

 返回说明:  
 成功执行时,返回0。失败返回-1,errno被设为以下的某个值  
 EBADF:sock不是有效的文件描述词
 EFAULT:optval指向的内存并非有效的进程空间
 EINVAL:在调用setsockopt()时,optlen无效
 ENOPROTOOPT:指定的协议层不能识别选项
 ENOTSOCK:sock描述的不是套接字

 参数详细说明:
 level指定控制套接字的层次.可以取三种值:
 1)SOL_SOCKET:通用套接字选项.
 2)IPPROTO_IP:IP选项.
 3)IPPROTO_TCP:TCP选项. 

 optname指定控制的方式(选项的名称),我们下面详细解释 
 optval获得或者是设置套接字选项.根据选项名称的数据类型进行转换 
 选项名称        说明                  数据类型
 ========================================================================
             SOL_SOCKET
 ------------------------------------------------------------------------
 SO_BROADCAST      允许发送广播数据            int
 SO_DEBUG        允许调试                int
 SO_DONTROUTE      不查找路由               int
 SO_ERROR        获得套接字错误             int
 SO_KEEPALIVE      保持连接                int
 SO_LINGER        延迟关闭连接              struct linger
 SO_OOBINLINE      带外数据放入正常数据流         int
 SO_RCVBUF        接收缓冲区大小             int
 SO_SNDBUF        发送缓冲区大小             int
 SO_RCVLOWAT       接收缓冲区下限             int
 SO_SNDLOWAT       发送缓冲区下限             int
 SO_RCVTIMEO       接收超时                struct timeval
 SO_SNDTIMEO       发送超时                struct timeval
 SO_REUSERADDR      允许重用本地地址和端口         int
 SO_TYPE         获得套接字类型             int
 SO_BSDCOMPAT      与BSD系统兼容              int
SO_BINDTODEVICE          绑定socket使用的网卡 (多网卡时,服务端监听时使用INADDR_ANY即可监听任意网卡来的数据,但客户端连接需绑定网卡发送,否则可能找不到正确的默认网关路由)
 ========================================================================
             IPPROTO_IP
 ------------------------------------------------------------------------
 IP_HDRINCL       在数据包中包含IP首部          int
 IP_OPTINOS       IP首部选项               int
 IP_TOS         服务类型
 IP_TTL         生存时间                int
 ========================================================================
             IPPRO_TCP
 ------------------------------------------------------------------------
 TCP_MAXSEG       TCP最大数据段的大小           int
 TCP_NODELAY       不使用Nagle算法             int
 ========================================================================

 返回说明:  
 成功执行时,返回0。失败返回-1,errno被设为以下的某个值  
 EBADF:sock不是有效的文件描述词
 EFAULT:optval指向的内存并非有效的进程空间
 EINVAL:在调用setsockopt()时,optlen无效
 ENOPROTOOPT:指定的协议层不能识别选项
 ENOTSOCK:sock描述的不是套接字

 SO_RCVBUF和SO_SNDBUF每个套接口都有一个发送缓冲区和一个接收缓冲区,使用这两个套接口选项可以改变缺省缓冲区大小。

 // 接收缓冲区
 int nRecvBuf=32*1024;         //设置为32K
 setsockopt(s,SOL_SOCKET,SO_RCVBUF,(const char*)&nRecvBuf,sizeof(int));

 //发送缓冲区
 int nSendBuf=32*1024;//设置为32K
 setsockopt(s,SOL_SOCKET,SO_SNDBUF,(const char*)&nSendBuf,sizeof(int));



注意:
        当设置TCP套接口接收缓冲区的大小时,函数调用顺序是很重要的,因为TCP的窗口规模选项是在建立连接时用SYN与对方互换

得到的。对于客户,O_RCVBUF选项必须在connect之前设置;对于服务器,SO_RCVBUF选项必须在listen前设置。

结合原理说明:

        1.每个套接口都有一个发送缓冲区和一个接收缓冲区。 接收缓冲区被TCP和UDP用来将接收到的数据一直保存到由应用进程来读。

TCP:TCP通告另一端的窗口大小。 TCP套接口接收缓冲区不可能溢出,因为对方不允许发出超过所通告窗口大小的数据。 这就是TCP的

流量控制,如果对方无视窗口大小而发出了超过窗口大小的数据,则接 收方TCP将丢弃它。 UDP:当接收到的数据报装不进套接口接收缓

冲区时,此数据报就被丢弃。UDP是没有流量控制的;快的发送者可以很容易地就淹没慢的接收者,导致接收方的UDP丢弃数据报。

        2.我们经常听说tcp协议的三次握手,但三次握手到底是什么,其细节是什么,为什么要这么做呢?
        第一次:客户端发送连接请求给服务器,服务器接收;
        第二次:服务器返回给客户端一个确认码,附带一个从服务器到客户端的连接请求,客户机接收,确认客户端到服务器的连接.
        第三次:客户机返回服务器上次发送请求的确认码,服务器接收,确认服务器到客户端的连接.
        我们可以看到:
        1). tcp的每个连接都需要确认.
        2). 客户端到服务器和服务器到客户端的连接是独立的.
        我们再想想tcp协议的特点:连接的,可靠的,全双工的,实际上tcp的三次握手正是为了保证这些特性的实现.