📄 rfc3040.txt
字号:
组织:中国互动出版网(http://www.china-pub.com/)
RFC文档中文翻译计划(http://www.china-pub.com/compters/emook/aboutemook.htm)
E-mail:ouyang@china-pub.com
译者:郝国生(booking gs_hao@263.net)
译文发布时间:2001-8-14
版权:本中文翻译文档版权归中国互动出版网所有。可以用于非商业用途自由转载,但必须
保留本文档的翻译及版权信息。
Network Working Group I. Cooper
Request for Comments: 3040 Equinix, Inc.
Category: Informational I. Melve
UNINETT
G. Tomlinson
CacheFlow Inc.
January 2001
Internet网复制和分类法
(RFC3040——Internet Web Replication and Caching Taxonomy)
备忘录状态
该备忘录专为Internet 组织提供信息。它不指定任何类型的Internet 标准。本备忘录的发行
不受任何限制。
版权声明
Copyright (C) The Internet Society (2001). All Rights Reserved.
摘要
本备忘录指定了标准术语和网络复制的分类法,以及正如当今所配置的存储基础结构。
该备忘录阐述了各标准概念,和当今在这一应用领域中使用的各协议。当前提出的配置解决
方案是利用这些技术建立一种标准的分类法。众所周知的存储代理问题存在于题为"Known
HTTP Proxy/Caching Problems"的文献中,且不是本文献要讲述的部分。该文献介绍了各公
开的协议和对于每一份协议所公布材料的观点。
目录
1. 介绍 4
2. 术语学 5
2.1 基础术语 5
2.2 一级派生术语 6
2.3 二级派生术语 7
2.4 可拓扑的术语 7
2.5 代理服务器的自动应用 7
3. 分布式系统的关系 8
3.1复制关系 8
3.1.1复制品的客户 8
3.1.2相互复制 9
3.2代理关系 9
3.2.1非拦截代理的客户服务器 9
3.2.2源服务器的代理客户 10
3.2.3间接代理 10
3.2.3.1(高速缓存)代理网眼 10
3.2.3.2(高速缓存)代理队列 11
3.2.4高速缓存的网络要素 12
4.复制品的选择 12
4.1导航超级链接 12
4.2复制品的HTTP重定向 13
4.3域名服务的重定向 13
5.内部复制通信 14
5.1批量驱动的复制 14
5.2要求驱动复制 14
5.3同步复制 15
6.用户代理的带代理服务器配置 15
6.1手工操作代理配置 15
6.2代理自动配置(PAC) 16
6.3缓存阵列路线协议(CARP)1.0版 16
6.4网页代理自动发现协议(WPAD) 17
7. inter-proxy 通信 18
7.1 宽带耦合inter-proxy通信 18
7.1.1网络高速缓冲协议(ICP) 18
7.1.2超文本缓冲协议 18
7.1.3 Cache Digest 19
7.1.4 Cache Pre-filling 19
7.2紧耦合Inter-Cache 通信 20
7.2.1 Cache Array Routing Protocol (CARP)v1.0 参看6.3部分 20
8.网络元件通信 20
8.1 常用网络高速缓冲控制协议(WCCP)参考资料: 20
8.2网络元件控制协议(NECP) 21
8.3 SOCKS 21
9.安全性考虑 21
9.1鉴定 22
9.1.1 中介攻击 22
9.1.2值得信赖的第三方代理 22
9.2保密性 22
9.2.1信任第三方的服务 22
9.2.2登陆和合法的含义 22
9.3服务器的安全性 23
9.3.1服务器拒绝 23
9.3.2重新实施攻击 23
9.3.3乏味的代理配置 23
9.3.4版权暂用拷贝 23
9.3.5应用级存取 23
10.鸣谢 23
作者地址 26
1. 介绍
自从本备忘录的介绍在1990年公开以来,万维网已经从一个简单的客户服务器模型发
展成一个复杂的分布式体系结构。以指数级增长的缩放比例问题在很大程度上推动了这一发
展。为满足特殊的需求已经出现了独特的范例和解决方案。同时,为满足这一增长要求而正
在使用的两个核心基础结构元件是复制和高速缓存。在许多情况下,有一种对网络高速缓存
器和复制服务能够共存的需要。
本备忘录详细说明了标准术语和网络复制的分类方法,以及当今配置于国际互联网中的
高速缓存基础结构。该文献的主要目标是要建立一种对这一应用领域的共同理解和参考点。
也期望该文献将来可以用于创建高效的、可靠的和可预测的服务的标准建筑框架,在这种网
络服务中既包括复制品又包括高速缓存器。
本备忘录所提及的一些协议仅被列入公司技术论文或工作进展文献清单中。这些参考用
来证明这些协议的存在,论证当今在国际互联网中他们的实验配置,或者帮助读者加深对这
一技术领域的理解。
当今有许多公开的和私有的协议被应用于网络复制和高速缓存。大多数公开的协议包括
DNS [8], Cache Digests [21][10], CARP [14], HTTP [1], ICP[2], PAC [12], SOCKS [7], WPAD
[13], and WCCP [18][19].接下来讨论这些协议以及他们在高速缓存和复制环境中的使用。
2. 术语学
接下来的术语学为在网络复制和高速缓存体中应用的通用术语提供了定义。基础术语可
能来自于HTTP/1.1的说明[1],在此用作参考。一级和二级派生术语由基础术语构造出,以
帮助定义存在于这一领域中的关系。
具有共同使用方法的术语,以及在RFC 2616和本文献中定义相反的术语是比较突出的。
2.1 基础术语
这些术语中的大多数被认为来自于RFC 2616 [1]中,在此用作参考。
客户机程序(来自于[1])
一种为了传送请求而建立连接的程序。
代理服务器程序(来自于[1])
一种为满足服务请求而通过返回响应接受连接的应用程序。
任何给出的程序可以既是一个客户机程序又是一个服务器程序,这些术语的使用仅仅涉
及到为了一种特殊的连接而被程序执行的任务,通常涉及不到程序的实际能力。同样,任何
一个服务器程序都可以作为起始服务器程序、代理服务器程序、网关或通道,及基于每一个
请求本质的转换行为。
代理程序(来自于[1])
一种为满足代表其他用户提出请求的目的,而既可作为服务器程序又可作为客户机程序
的中间程序。请求可在内部进行处理,或在可能的转化下把请求传送到其它的服务器。代理
服务器必须执行规约的客户机程序和服务器程序。"透明服务器"是一种不更改请求或响应代
理服务器,这些请求或响应需要服务器在另一端进行鉴定和辨认。"非透明服务器"是一种更
改请求或响应代理服务器,以便提供给用户代理商一些额外的服务,例如一些批注释服务、
媒体类型转换、协议缩减或者是匿名筛选。除了在代理服务器中或者透明或者非透明服务器
被准确规定之外,HTTP代理服务器程序要求适用于两种类型的代理服务器。
注意:术语"透明服务器程序"是指像在[1]中所描述的一种语义上清晰的代理服务器程序,
不是在高速缓存体中通常理解的那样。建议术语"透明服务器程序"始终放在前边以避免混肴
(如"网络透明服务器程序")。不管怎样,看下面的"中断服务器程序"定义。
以上所述服务器程序和客户机程序执行HTTP/1.1请求的条件仅适合于非网络透明服务器程
序。
高速缓存(来自于[1])
是指程序响应信息的局部存储以及控制其存储、恢复和删除的子系统。在相同的请求下,
高速缓存器存储可缓存的程序响应以减少响应时间和将来网络带宽的消耗量。尽管高速缓存
器不能被正用作通道的服务器所使用,但是任何一个客户机程序或服务器程序都可以包括一
个高速缓存器。
注意:术语"高速缓存"被单独使用时通常是指"高速缓存代理服务器程序"。
注意:使用高速缓存有其它的目的,例如,减少服务器程序的负载(作为将来减少响应时间
的手段)。
可缓存的(来自于[1])
如果高速缓存器允许存储用于响应并发请求的消息响应,则响应是可缓存的。用来确定
HTTP响应缓存性能的标准在第13部分中定义。尽管资源是可缓存的,也可能有额外的约
束,即高速缓存器是否能够使用为特殊请求而缓存的副本。
网关(来自于[1])
是一种作为其它服务器中间媒介的网间连接器。和代理服务器不同,网关接受请求就如
同它是被请求资源的起始服务器,而提出请求的客户机可能不知道它正和网关进行通讯。
通道(来自于[1])
一种用来在两条线路之间随意传输的中间程序。一旦发挥作用,通道便不再看作HTTP
通讯的一部分,尽管通道可能已经被一个HTTP请求所触发。当传输线路两端都关闭时,通
道便不再存在。
复制
"在另一个不同计算机上创建和保存数据库或文件系统一个完全相同的副本,是服务器
一个典型的应用。" - Free Online Dictionary of Computing (FOLDOC)
入站/出站(来自于[1])
入站和出站是指信息请求和响应路径:"入站"是"将请求和响应传向起始服务器",而"出
站"是"将请求和响应传向用户代理服务器"。
网络元件
一种在原文件和目标文件之间引入多路径的网络装置,对HTTP是透明的。
2.2 一级派生术语
下列术语是根据以上所述基础术语进行构造的。
起始服务器(来自于[1])
在该服务器上已经存有给出的或将要创造出资源。
用户代理服务器(来自于[1])
是指提出请求的客户机。通常拥有浏览器、编辑器、蜘蛛(网络传输遥控设备)或者其
它的终端用户设备。
高速缓存代理服务器
一个带有高速缓存器的代理服务器,用作客户机的服务器,也是起始服务器的一个客户。
高速缓存代理服务器常被称作"代理服务器高速缓存"或者简单地称为"高速缓存"。当提到高
速缓存代理服务器时,常会误用"代理服务器程序"这一术语。
代理服务器
和起始服务器协同定位的网关,或是位于网络中的不同点处被赋予操作的职权,典型地
与一个或多个起始服务器密切协同工作。响应从内在的高速缓存器被典型地传送。
代理服务器可以驱动来自起始服务器或来自另一个起始服务器的代理服务器的高速缓存器
端口。在某些情况下,代理服务器可以传送这些请求。
代理服务器和起始服务器之间的密切协作,可以对协议的一些要求进行修改,其中包括在[1]
中的高速缓存控制指令。这些修改仍然要被充分地说明。
通常被称作"反向服务器"和"(起始)服务器加速器"的设备应被更适当地定义为代理服务器。
反向服务器
参见"代理服务器"
服务器加速器
参见"代理服务器"
2.3 二级派生术语
以下术语进一步建立在一级派生术语的基础上。
主起始服务器
是指拥有资源最终版本的起始服务器。
备份起始服务器
是指拥有资源副本的起始服务器,但这一资源可用作客户请求的权威参考。
满足消费者
通过用户代理服务器的使用,用户或系统发出进站请求。
浏览器
为使消费者满意而用作浏览装置的一种用户代理服务器的特殊设备。
2.4 可拓扑的术语
下列定义进一步描述高速缓存装置的拓扑。
用户代理程序高速缓存
在用户代理程序中的高速缓存。
局域高速缓存代理服务器
和用户代理服务器相连的高速缓存代理服务器。
中间高速缓存代理服务器
从容量消费者的观点看来,是指所有参加高速缓存网的高速缓存器,这些高速缓存器不
是用户代理的局域高速缓存代理服务器。
高速缓存服务器
是由局域和中间高速缓存代理服务器提出请求的服务器,而它本身不作为代理服务器。
高速缓存阵列
是指一系列的高速缓存代理服务器,逻辑上当作一种服务,以及划分穿过阵列的资源名
空间。高速缓存阵列也称作"扩散阵列"或"高速缓存器群"。
高速缓存网
一套松散连接的协作代理高速缓存服务器,或服务器组,各服务器独立工作但通过内部
高速缓存通信协议共享缓存容量。
2.5 代理服务器的自动应用
网络管理员可能希望通过代理人推动或促进代理服务器的应用,使在网络内部的这种配
置本身或用户代理服务器的自动化系统成为可能,这样能使消费者满意,且没有必要知道任何
配置上的问题。
下面给出描述这些配置的术语。
自动用户代理服务器配置
是指发现一个或多个代理服务器有效性的技术以及用户代理使用它们的自动配置。代理
服务器的使用显然是为了满足用户的需求而不是为了满足用户代理。术语"自动代理服务器
配置"也是在这种意义下使用的。
通行拦截
是指利用网络元件检查网络通讯量以决定其是否需要改变方向的过程。
通行变向
从网络元件执行通行拦截到代理服务器客户机请求的变向。可用来配置(高速缓存)代
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -