web及网络基础¶
通过HTTP访问web[C/S]¶

TCP/IP四层模型¶

数据包的封装¶

TCP/IP协议族¶
负责传输的IP协议¶
使用ARP协议凭借MAC地址通信

确保可靠的TCP协议¶

负责域名解析的DNS服务¶

各协议与HTTP的关系¶

URI与URL¶
URI(Uniform Resource Identifier):统一资源标识符
URL(Uniform Resource Locator):统一资源定位符;URL是URI的子集
URI的格式¶

| 字段 | 说明 |
|---|---|
| 协议 | http/https |
| 登录信息(认证) | user:pass@(一般没有) |
| 服务器地址 | 域名或IP |
| 服务器端口号 | 服务端口号,省略则取默认端口号 |
| 带层次的文件路径 | 指定服务器上的文件路径来定位特指的资源 |
| 查询字符串 | 使用查询字符串传入参数 |
| 片段标识符 | 标记以获取资源中的子资源(文档内的某个位置) |
URI的示例¶

HTTP协议¶
通过请求和响应的交换达成通信¶

请求报文¶

响应报文¶

HTTP请求方法¶
GET:获取资源¶

POST:传输实体主体¶


PUT:传输文件¶
PUT方法用来传输文件,像FTP协议一样,要求在请求报文的主体中包含文件内容,然后保存到请求URI指定的位置。
因为自身不带验证机制,有安全问题,因此一般不采用。若配合验证机制或者REST标准则可使用。

#### HEAD:获取报文头部¶
HEAD和GET一样但不返回报文主体部分,用于确认URI的有效性及资源的更新时间等。

DELETE:删除文件¶
DELETE与PUT作用相反,但不带安全验证机制一般不采用。


OPTIONS:询问支持的方法¶
OPTIONS用来查询针对请求URI指定的资源支持的方法

TRACE:追踪路径¶
TRACE用来查询发送出去的请求是怎样被加工修改/篡改的,因为易引发XST(跨站追踪)攻击,一般不使用。

CONNECT:要求用隧道协议连接代理¶
CONNECT要求在与代理服务器通信时建立隧道,实现用隧道协议进行TCP通信。主要使用SSL(Source Sockets Layer:安全套接字)和TLS(Transport Layer Security:传输层安全)协议把通信内容加密后经网络隧道传输。
方法格式如下:


持久连接¶
keep-alive¶
为解决每进行一次HTTP通信就要断开一次TCP连接,增加了通信量的开销,HTTP/1.1通过keep-alive持久连接,只要任意一端没有明确提出断开连接,则保持TCP连接状态。
持久连接减少了TCP连接的重复建立和断开所造成的额外开销,减轻了服务器端的负载。

管线化¶
持续连接使得多数请求以管线化(pipelining)方式发送成为可能。管线化即同时并行发送多个请求,而不需要一个接一个等待响应。管线化技术比持续连接速度快,请求数越多越明显。

HTTP报文¶
HTTP报文¶
用于HTTP协议交互的信息被称为HTTP报文,客户端的HTTP报文叫做请求报文,服务端的叫做响应报文。报文大致分为报文首部和报文主体,但并不一定要有报文主体。

报文结构¶


| 字段 | 说明 |
|---|---|
| 请求行 | 请求方法,请求URI和HTTP版本 |
| 状态行 | 响应结果的状态码,原因短语和HTTP版本 |
| 首部字段 | 请求和响应的各种条件和属性的各类首部:通用首部、请求首部、响应首部、实体首部 |
| 其他 | HTTP的RFC里未定义的首部(Cookie等) |
编码提升传输速率¶
HTTP在传输数据时可以按照数据原貌直接传输也可以在传输过程中编码提升传输速率;通过编码可以处理大量请求但会消耗更多的CPU等资源。
报文主体和实体主体的差异¶
报文:是HTTP通信中的基本单位,由8位组字节流组成,通过HTTP通信传输。
实体:作为请求或响应的有效载荷数据被传输,其内容由实体首部和实体主体组成。
通常报文主体等于实体主体,但当传输中进行编码时,实体主体的内容发生变化才会与报文主体产生差异。
压缩传输的内容编码¶
HTTP中的内容编码指明应用在实体内容上的编码格式,并保持实体信息原样压缩,内容编码后的实体由客户端接收并负责解码。

常用的内容编码:
gzip(GNU ZIP)
compress(UNIX系统的标准压缩)
deflate(zlib)
identity(不进行编码)
分块传输编码¶
分块传输编码会将实体主体分成多个块,每一块都会用十六进制来标记快的大小,而实体的最后一块会使用“0(CR+LF)”来标记。
由接收的客户端负责解码,回复到编码前的实体主体。

发送多种数据的多部分对象集合¶
HTTP中的多部分对象集合即发送一份报文主体内可含有多类型实体,通常是图片或文本文件上传等。
多部分对象集合包含的对象:
multipart/form-data:在web表单文件上传时使用
multipart/byteranges:状态码206响应报文包含了多个范围的内容时使用
获取部分内容的范围请求¶
指定范围发送的请求叫做范围请求,对于一份10000字节大小的资源,如果使用范围请求,可以只请求5001-10000字节内的资源。

执行范围请求时,会用到首部字段Range来指定资源的byte范围

内容协商返回最合适的内容¶
内容协商机制是指客户端和服务端就响应的资源内容进行交涉,然后提供给客户端最合适的资源。内容协商会以响应资源的语言、编码方式等作为判断的基准。
内容协商类型:
服务器驱动协商
客户端驱动协商
透明协商
HTTP状态码¶
状态码即服务器返回的请求结果。
| 状态码 | 类型 | 说明 |
|---|---|---|
| 1xx | Informational(信息性状态码) | 接收的请求正在处理 |
| 2xx | Success(成功) | 请求正常处理完毕 |
| 3xx | Redirection(重定向) | 需要进行附加操作以完成请求 |
| 4xx | Client Error(客户端错误) | 服务器无法处理请求 |
| 5xx | Server Error(服务端错误) | 服务器处理请求出错 |

2XX成功¶
200 OK¶

204 No Content¶

表示请求已成功处理,但在返回的响应报文中不含实体的主体部分。
206 Partial Content¶

该状态码表示客户端进行了范围请求,服务器成功执行了这部分的GET请求。响应报文中包含由Content-Range指定范围的实体内容。
3XX 重定向¶
301 Moved Permanently¶
永久性重定向,表示资源已被分配了新的URI,以后应使用新的URI。

302 Found¶
临时性重定向,表示请求的资源已被分配了新的URI,但是临时性的。

303 See Other¶
表示由于请求的资源存在另一个URI,应使用GET方法重定向获取请求的资源。

304 Not Modified¶
表示客户端发送附带条件的请求时(GET中的If-Modified-Since等首部),服务器允许访问资源,但未满足附带条件因此直接返回304(服务器的资源未改变,可直接使用客户端未过期的缓存),不包含任何响应的主体部分。

307 Temporary Redirect¶
临时重定向,该状态与302有相同的含义。
4XX 客户端错误¶
400 Bad Request¶
表示请求报文中存在语法错误,需修改内容重新发送请求。

403 Forbidden¶
表示请求被服务器拒绝,未获得访问授权。

404 No Found¶
表明服务器上找不到请求的资源,也可以在服务器拒绝请求且不想说明理由时使用。

5XX 服务器错误¶
500 Internal Server Error¶
表明服务器在执行请求时发生了错误,也可能是Web应用存在bug或临时故障等。





