浅入HTTP
## OSI模型wiki
(开放式系统互联通信参考模型)(1984年)
- 应用层–提供为应用软件而设的接口,以设置与另一应用软件之间的通信。例如: HTTP,HTTPS,FTP,TELNET,SSH,SMTP,POP3等。
- 表示层–把数据转换为能与接收者的系统格式兼容并适合传输的格式。
- 会话层–负责在数据传输中设置和维护计算机网络中两台计算机之间的通信连接。
- 传输层–把传输表头(TH)加至数据以形成数据包。传输表头包含了所使用的协议等发送信息。例如:TCP、UDP等。
- 网络层–决定数据的路径选择和转寄,将网络表头(NH)加至数据包,以形成分组。网络表头包含了网络数据。例如:互联网协议(IP)等。
- 数据链路层–负责网络寻址、错误侦测和改错。当表头和表尾被加至数据包时,会形成帧。数据链表头(DLH)是包含了物理地址和错误侦测及改错的方法。数据链表尾(DLT)是一串指示数据包末端的字符串。例如以太网、无线局域网(Wi-Fi)和通用分组无线服务(GPRS)等。
- 物理层–在局部局域网上传送数据帧(data frame),它负责管理计算机通信设备和网络媒体之间的互通。包括了针脚、电压、线缆规范、集线器、中继器、网卡、主机适配器等。
ps. 已被TCT/IP四层模型替代
TCP/IP四层模型
应用层–是大多数普通与网络相关的程序为了通过网络与其他程序通信所使用的层。这个层的处理过程是应有特有的;数据从网络相关的程序以这种应用内部使用的格式进行传送,然后被编码成标准协议的格式。每一个应用层协议一般都会使用到传输层协议TCP和UDP协议之一:
运行在TCP协议上的协议:
1. HTTP(80端口),主要用于普通浏览。
2. HTTPS(443端口),HTTP协议的安全版本。
3. FTP(20和21端口),顾名思义,用于文件传输
4. POP3(110端口),收邮件用。
5. SMTP(25端口),用来发送电子邮件。
6. SSH(22端口),用于加密安全登录用。
运行在UDP协议上的协议:
1. DHCP(67端口,动态主机配置协议),动态配置IP地址。
其他:
1. DNS(Domain Name Service,域名服务),用于完成地址的查找,邮件转发等工作(运行在TCP和UDP协议上)。
2. SNMP(Simple Network Management Protocol,简单网络管理协议),用于网络信息的收集和网络管理。
3. ARP(Address Resolution Protocol,地址解析协议),用于动态解析以太网硬件的地址。传输层–解决诸如端到端可靠性(数据是否已经到达目的地?)和保证数据按照正确的顺序到达这样的问题。TCP、UDP都是传输层协议。
网络层–解决在一个单一网络上传输数据包的问题。IP协议是网络层协议。
数据链路层–它是数据包从一个设备的网络层传输到另外一个设备的网络层的方法。这个过程能够在网卡的软件驱动程序中控制或者专用芯片中控制。这将完成如添加报头准备发送、通过实体介质实际发送这样一些数据链路功能。另一端,链路层将完成数据帧接收、去除报头并且将接收到的包传到网络层。
一般的web应用的通信传输流是这样的:
发送端在层与层之间传输数据时,每经过一层时会被打上一个该层所属的首部信息。反之,接收端在层与层之间传输数据时,每经过一层时会把对应的首部信息去除。
TCP三步握手(建立连接之前做的事情)
关于TCP:
TCP(Transmission Control Protocol, 传输控制协议)是一种面向连接的、可靠的、基于字节流的传输层通信协议。与之对应的是UDP(User Datagram Protocol ,用户数据报协议),是不可靠的传输层协议。
解读上图
客户端发送SYN
报文给服务器端,序列号是x
,进入SYN_SEND
状态。
服务器端收到SYN
报文,回应一个ACK(序列号是x+1
)同时发一个SYN
(序列号是y
),进入SYN_RECV
状态。
客户端收到服务器端的SYN
报文,回应一个ACK
(序列号是y+1
)报文,进入Established
状态。
通俗来说:
- 客户端发出第一次请求:对服务器发出询问(使用
SYN = 1
这个询问记号),和内容seq = x
(表示此次收到请在此做标记) 。- 服务器收到请求:服务器收到请求后打上回应记号(
ACK = 1
),并把客户的seq
内容加1
记录成ack = x+1
(回应值),同时加上自己的内容seq = y
,然后服务器也要确认一下客户是否回到自己的回应,所以也需要加上询问记号(SYN = 1
)。- 客户收到服务器的回应以后也打上回应记号(
ACK = 1
),并把服务器的seq
内容加1
记录成ack = y+1
(回应值),同时加上自己的内容seq = x+1
。
四步挥手(通信结束时做的事情)
解读上图
- 客户端发送一个
FIN
,告诉服务器想关闭连接。- 服务器收到这个
FIN
,发回一个ACK
。- 服务器通知应用程序关闭网络连接,应用程序关闭后通知服务器。服务器发送一个
FIN
给客户端 。- 客户端发回
ACK
报文确认。
通俗来说
- 客户端先发送结束信号(使用
FIN = 1
这个标记),和内容seq = u
。- 服务器收到请求后,先发一次通讯告诉客户端已经收到你的结束请求啦(并通知应用程序们结束),打上回应记号(
ACK = 1
),并把服务器的seq
内容加1
记录成ack = u+1
(回应值),同时加上自己的内容seq = v
。- 然后服务器等到应用程序结束(应用程序收到结束信号以后赶紧发完数据,然后告诉服务器你可以结束了),然后服务器就再次发送一次通讯,这次也加上结束信号
FIN = 1
、回应记号ACK = 1
,内容seq = w
,回应值ack = u+1
- 客户端收到服务器也结束的响应以后,最后发送一次通讯告诉服务器自己收到了结束响应,最后此次通讯结束。
为什么挥手要四步
这是因为服务端的 LISTEN 状态下的 SOCKET 当收到客户端建立连接请求的SYN 报文后,它可以把 ACK 和 SYN ( ACK 起应答作用,而 SYN 起同步作用)放在一个报文里来发送。
但关闭连接时,当服务器收到客户端的 FIN 报文通知时,服务器只能发一个回应报文ACK:“哦,我知道了”,然后通知应用程序。(正式因为这里服务器与应用程序通知结束的时间间隔,所以结束需要四步,不能把第二第三步合成一步)
应用程序完成全部数据发送并确定可以终止了,服务器才能发送FIN告诉客户端可以真正断开连接了。所以这一步ACK报文和FIN报文需要分开发送,因此多了一个步骤。
TCP报文格式
ACK
:TCP
协议规定,只有ACK=1
时有效,也规定连接建立后所有发送的报文的ACK
必须为1
。SYN
(SYNchronization) : 在连接建立时用来同步序号。当SYN = 1
而ACK = 0
时,表明这是一个连接请求报文。对方若同意建立连接,则应在响应报文中使SYN=1
和ACK = 1
. 因此,SYN
置1
就表示这是一个连接请求或连接接受报文。FIN
(finis)即完,终结的意思, 用来释放一个连接。当FIN = 1
时,表明此报文段的发送方的数据已经发送完毕,并要求释放连接。
参考
·