我们知道,使用 read 或 recvfrom 函数从 socket 上读取数据时,可能会导致阻塞。特别是 UDP 服务器,稍有不甚,数据报就丢失就会直接导致程序假死(阻塞在 recvfrom)。
还有 connect 函数,如果去连接一个网络上不存在的主机,需要等待很长时间,可能长达 2 分钟。如果我们能控制它在指定的时间内连接不上,就直接报错,行不行呢?
很可惜,上面的问题 linux 并未直接提供带超时的函数帮我们解决,所以我们需要一些奇技淫巧来完成上面的功能。
1. 如何设置超时?
常用的有 3 种方法来设置超时:
- 1) 使用 alarm 函数,一旦到期就产生 SIGALRM 信号,打断正在执行的系统调用。
- 2) 使用 select 函数。
- 3) 使用套接字选项 SO_RCVTIMEO 和 SO_SNDTIMEO.
关于这几个方案,有几点要说明:
- 三个技术都可用于输入和输出(read 和 write)
- 对于阻塞的 connect 只能使用方案一,对于非阻塞的 connect,只能使用 select.
- 方案三对 connect 不适用。
- 方案一和二适用于任何描述符,而方案三仅适用于套接字描述符。
2. 使用 alarm 设置超时
它的伪代码如下,这里以 connect 为例:
void sighandler(int sig) { // 信号处理函数,什么也不用做 return; } int connect_timeo(/*...*/, int nsec) { // 注册信号 registSignal(SIGALRM, sighandler, &oldhandler); // 开启一个 nsec 秒的 alarm alarm(nsec); ret = connect(/*...*/); // 如果被信号打断,则表示超时 if (ret < 0 && errno == EINTR) { errno = ETIMEDOUT; } // 删除 alarm alarm(0); registSignal(SIGALRM, oldhandler); return ret; }
3. 实验代码
代码托管在 gitos 上,请使用下面的命令获取:
git clone https://git.oschina.net/ivan_allen/unp.git
如果你已经 clone 过这个代码了,请使用 git pull
更新一下。本节程序所使用的程序路径是 unp/program/advcio/conn_timeo/conn_timeo.cc
,另一个使用 alarm 为 recvfrom 设置超时的例子是 unp/program/advcio/read_timeo/read_timeo_alarm
.
4. 实验结果
ip 地址 192.168.166.4 在网络上并不存在,直接连接它就会导致 connect 函数阻塞,一直在发送 SYN 请求。
- 不使用超时的 connect
图1 不使用超时的 connect
可以看到,默认的 connect 函数超时值约为 127 秒。
- 使用超时的 connect
通过命令行 --timeo
选项传递超时值给 connec_timeo 函数。
图2 使用超时的 connect
5. 总结
- 掌握使用 alarm 编写超时函数的方法
练习:使用 alarm 编写一个带超时的 recvfrom 函数(答案在read_timeo 文件下可以找到)。