第五章 与HTTP协作的Web服务器

5.1 用单台虚拟主机实现多个域名

在传统的基于IP地址的服务器配置中,一台服务器通常只能提供一个域名的服务。然而,通过虚拟主机的技术,同一台服务器可以根据请求中的域名,区分并提供不同的网站内容。这使得在一台物理或虚拟服务器上托管多个域名成为可能,从而在资源更加有限的环境中实现更高的资源利用率。

实现这一功能的关键是在服务器的配置中定义多个虚拟主机,并为每个虚拟主机指定相应的域名和相关的配置信息,以确保服务器能够正确地区分和响应来自不同域名的请求。

在一台物理或虚拟服务器上,通过配置使得这台服务器能够响应来自多个不同域名的 HTTP 请求。这个概念通常被称为虚拟主机(Virtual Host)。

在这里插入图片描述

客户端使用HTTP协议访问服务器时,会经常采用类似www.hackrjp这样的主机名和城名

在互联网上,域名通过DNS服务映射到IP地址(域名解析)之后访问目标网站。可见,当请求发送到服务器时,已经是以IP地址形式访问了。

所以,如果一台服务器内托管了www.tricorderjp和wwwhackrjp这两个域名,当收到请求时就需要弄清楚究竟要访问哪个域名。

在这里插入图片描述

在相同的IP地址下,由于虚拟主机可以寄存多个不同主机名和城名的Web网站,因此在发送HTTP请求时,必须在Host首部内完整指定主机名或域名的URI

5.2 通信数据转发程序: 代理, 网关, 隧道

HTTP通信时,除客户端和服务器以外,还有一此用于通信数据转发的应用程序,例如代理、网关和隧道。它们可以配合服务器工作。

这些应用程序和服务器可以将请求转发给通信线路上的下一站服务器,并且能接收从那台服务器发送的响应再转发给客户端。

5.2.1 代理

在这里插入图片描述

代理服务器的基本行为就是接收客户端发送的请求后转发给其他服务器。代理不改变请求 URI,会直接发送给前方持有资源的目标服务器。

持有资源实体的服务器被称为源服务器。从源服务器返回的响应经过代理服务器后再传给客户端

在这里插入图片描述

HTTP通信过程中, 可以级联多台代理服务器, 请求和响应的转发会经过数台连接起来的代理服务器, 转发时, 需要附加Via首部字段以标记出经过的主机信息

功能:

  • 访问控制: 代理可以根据一些规则控制对特定资源的访问,实现访问控制策略。
  • 安全性: 代理可以提供额外的安全层,隐藏客户端的真实 IP 地址,防范攻击。
  • 缓存: 代理可以缓存先前请求的响应,提高对重复请求的响应速度。
  • 日志记录: 代理可以记录经过它的请求和响应,用于分析和监控网络活动。

透明代理

转发请求或响应时,不对报文做任何加工的代理类型被称为透明代理(Transparent Proxy)。反之,对报文内容进行加工的代理被称为非透明代理。

5.2.2 网关

在这里插入图片描述

网关的工作机制和代理十分相似。而网关能使通信线路上的服务器提供非HTTP协议服务

利用网关能提高通信的安全性,因为可以在客户端与网关之间的通信线路上加密以确保连接的安全。比如,网关可以连接数据库,使用SQL语句查询数据。另外,在Web 购物网站上进行信用卡结算时,网关可以和信用卡结算系统联动。

5.2.3 隧道

隧道是一种通过网络传输层直接连接两个端点的通信机制。隧道通常用于在两个网络之间创建私密、安全的连接,将数据以加密的方式传输。

隧道本身不会去解析HTTP请求, 即请求会原样中转给之后的服务器, 隧道会在通信双方断开连接时结束

在这里插入图片描述

5.3 保存资源的缓存

缓存是指代理服务器或客户端本地磁盘内保存的资源副本。利用缓存可减少对源服务器的访问,因此也就节省了通信流量和通信时间

缓存服务器是代理服务器的一种,并归类在缓存代理类型中。换句话说,当代理转发从服务器返回的响应时,代理服务器将会保存一份资源的副本。

在这里插入图片描述

缓存服务器的优势在于利用缓存可避免多次从源服务器转发资源。因此客户端可就近从缓存服务器上获取资源,而源服务器也不必多次处理相同的请求了。

5.3.1 缓存的有效期限

即便缓存服务器内有缓存,也不能保证每次都会返回对同资源的请求。因为这关系到被缓存资源的有效性问题

当遇上源服务器上的资源更新时,如果还是使用不变的缓存,那就会演变成返回更新前的“旧”资源了

即使存在缓存,也会因为客户端的要求、缓存的有效期等因素,向源服务器确认资源的有效性。若判断缓存失效,缓存服务器将会再次从源服务器上获取“新”资源。

在这里插入图片描述

5.3.2 客户端的缓存

缓存不仅可以存在于缓存服务器内,还可以存在客户端浏览器中。以Internet Explorer程序为例,把客户端缓存称为临时网络文件(TemporaryInternet File )。

浏览器缓存如果有效,就不必再向服务器请求相同的资源了,可以直接从本地磁盘内读取。

另外,和缓存服务器相同的一点是,当判定缓存过期后,会向源服务器确认资源的有效性。若判断浏览器缓存失效,浏览器会再次请求新资源。

在这里插入图片描述