说服务器崩溃,言外之意就是说服务器挂了,但是没有发送 FIN 报文给客户端。
不管是崩溃也好,服务器断网也好,还是中间路由器故障,只要客户机发送数据给对方,数据达到不了对方,或对方数据传送不过来,客户端和服务器都互相不能感知到对方是否出现异常。
所以,模拟服务器崩溃,我们可以让服务器断网,一方面是不让服务器发送报文给客户端,另一方面客户端发送的报文也到不了服务器。
实际上,本文实验在不久前在讲 TCP 半打开的连接时做过一次,不过当时是用 windows 进行测试的。请大家务必复习《半打开的 TCP 连接》。
1. 程序路径
代码托管在 gitos 上,请使用下面的命令获取:
git clone https://git.oschina.net/ivan_allen/unp.git
如果你已经 clone 过这个代码了,请使用 git pull 更新一下。本节程序所使用的程序路径是unp/program/echo/processzombie
。
2. 实验步骤
这里的实验步骤相当简单,只要连接上服务器后,让服务器断网,然后再次让客户端发送数据即可。
- 在 flower 上启动服务器
flower $ ./echo -s -h flower
- 在 sun 上启动客户端(记得抓包)
// 加 time 是为了计时,这次客户端运行了多久 sun $ time ./echo -h flower
3. 实验结果
我进行了两次实验,结果如下:
图1 客户端两次运行的结果,发送第二次数据
'haha'
时,对方已经断网了 我们看到整个程序运行了约 16 分钟左右后,readline 返回错误,程序退出。响应 No route to host 的错误(errno = EHOSTUNREACH)。我们再来看看第一次 tcpdump 的输出。
图2 只抓了 tcp 协议的数据包
'haha'
报文重传了 9 次后停止。
第二次实验的时候,我抓取了所有报文。
图3 抓取了所有的报文,第 9 次重传后,执行 arp 协议
4. 结果分析
因为在实验的时候,我的两台主机在同一个网段,并没有中间路由器参与。所以,不同的网络拓扑,实验结果可能是不一样的,这里简单的总结一下:
对于服务器崩溃的情况,一般 readline 会返回
- EHOSTUNREACH 错误(网络存在,但是主机不存在)
- ENETUNREACH(网络不存在,可能是中间路由器宕机了)
- ETIMEDOUT 主机存在,但是主机根本不响应。
5. 总结
- 掌握服务器崩溃时客户端的行为