别以为上一节我们修复了那个 bug 就没事了。还有一个非常隐秘的错误,这里必须要指出来:
不要将 stdio 库提供的 C 语言函数与 IO 复用混合使用!!!
1. 程序路径
代码托管在 gitos 上,请使用下面的命令获取:
git clone https://git.oschina.net/ivan_allen/unp.git
如果你已经 clone 过这个代码了,请使用 git pull 更新一下。本节程序所使用的程序路径是 unp/program/echo/multiplexing_select_client_nobuffer
。
2. 分析
以 select 为例。
select 函数返回的条件是有 IO 事件发生。假设我们监听了 STDIN_FILENO (标准输入),某个时刻 select 监听到了标准输入上有数据,于时客户端调用 fgets 读取一行数据。
看起来一切是那么自然,不过别忘记了,stdio 的函数是带有缓冲区的。别以为 fgets 真的只读了一行数据,它只是将自己缓冲区中的一行数据返回给了你。实际上,fgets 早已把 STDIN_FILENO 上的所有数据读完了,保存到了自己的缓冲中了,见图 1。
图1 stdio 函数都有缓冲
接下来,你的程序又回到了 select 调用上,很不幸,select 永远再也不会触发标准输入上的 IO 事件,因为 select 认为,你的数据早已被读取完(虽然这不是你干的),它并不知道 stdio 使用了缓冲区——它只是从 read 系统调用的角度指出是否有数据可读,而不是从 fgets 之类调用的角度考虑。
基于上述原因,混合使用 stdio 和 IO 复用类的函数被认为是非常容易犯的错误,编写这样的程序时需要极其小心。
当然除此之外,我们要小心任何带有缓冲的 IO 与 IO 复用的混合使用。
3. 程序修改
程序的修改非常简单,只是将之前使用的 fgets 替换成系统调用 read 就行了。
if (FD_ISSET(STDIN_FILENO, &fds)) { // fgets 带有缓冲区,与 select 一起使用太危险,换成 iread,就是对 read 包装了一下。 nr = iread(STDIN_FILENO, buf, 4096); if (nr > 0) { nw = writen(sockfd, buf, nr); if (nw < nr) { perror("short write"); } } else if (nr == 0){ // 不直接 break shutdown(sockfd, SHUT_WR); FD_CLR(STDIN_FILENO, &rfds); stdinclosed = 1; } else { ERR_EXIT("iread"); } }
iread 函数只是简单的封装了一下,处理了被信号打断的错误:
int iread(int fd, char* buf, int n) { int ret; while(1) { ret = read(fd, buf, n); if (ret < 0) { if (errno == EINTR) continue; return -1; } break; } return ret; }
4. 总结
- 知道为什么 IO 复用不能与 stdio 函数混合使用,具体一点说是 IO 复用不能与带缓冲的 IO 函数使用。