📄 rfc1691.txt
字号:
物理关联文件举例
+0|CORNELL|OLINLIB|00000001|Boole. Mary Everest||Philoscophy||
|0|1|00000002|5|1|| (关联文件号2,物理关联文件号5,600dpi TIFF影像文件)
|0|2|00000003|5|2|| (关联文件号3,物理关联文件号5,100dpi TIFF影像文件)
|0|3|00000004|6|1|| (关联文件号4,物理关联文件号6,600dpi TIFF影像文件)
|0|4|00000005|6|2|| (关联文件号5,物理关联文件号6,100dpi TIFF影像文件)
注:在上面的例子中,已经确保了关联文件2和3是同一页的两个不同版本,关
联文件4和5也一样。
【逻辑结构文件】
逻辑结构文件是将影像文件连结起来构成文档来提供文档视,该文件实际上
是一棵未安装的树,当文件打开的时候,读入该文件,就会重新建立了树结构。
为了方便起见,逻辑结构文件只包括一种逻辑结构,即页,用来按照纸板图书页
的顺序来排列文档。
文档结构行
字段 内容 备注
1 父结构号 是谁的子结构
2 顺序号
3 逻辑结构名 该结构的标号
4 结构号 和物理关联文件相同
5 子逻辑结构 该结构的逻辑子结构号
6 子物理结构 该结构的物理子结构号
7 关联
逻辑关联文件举例
|0|0|ROOT|0|4|0|0| 结构0,根,有四个逻辑子结构
|0|1|PAGES|1|100|0|1| 结构1,页,有100个逻辑子结构
|0|2|CONTENTS|2|22|0|1| 结构2,目录,有22个逻辑子结构,无物理子结构
...
|1|1|Production note|5|0|2|2| 结构5,是结构1的子结构,
标号为 "Production note"
无逻辑子结构,有两个物理子结构
在本文档中引用两次
|1|2||6|0|2|1| 结构6无标号
|1|3||7|0|2|1| 结构7有两个物理关联
|1|4||8|0|2|1| 结构8仅被引用一次
|1|5||9|0|2|1| 结构9是页的第五个子结构
...
|1|99||103|0|2|2|
|1|100||104|0|2|2|
|2|1|Production note|105|1|0|1| 结构105是结构的子结构
|2|2|Title page|106|1|0|1| 结构106有1个逻辑子结构
|2|3|Table of contents|107|2|0|1|
|2|4|Chapter 1. From Arithmetic to Algebra|108|6|0|1|
|2|5|Chapter 2. The Making of Algebras|109|4|0|1|
|2|6|Chapter 3. Simultaneous Problems|110|4|0|1|
|2|7|Chapter 4. Partial Solutions...|111|3|0|1|
|2|8|Chapter 5. Mathematical Certainty...|112|3|0|1|
|2|9|Chapter 6. The First Hebrew Algebra|113|8|0|1|
|2|10|Chapter 7. How to Choose our Hypotheses|114|9|0|1|
|2|11|Chapter 8. The Limits of the Teachers Function|115|5|0|1|
|2|12|Chapter 9. The Use of Sewing Cards|116|4|0|1|
...
|2|20|Chapter 17. From Bondage to Freedom|124|5|0|1|
|2|21|Appendix|125|2|1|1|
|2|22|advertisements|126|4|1|2|
|105|1|Production note|5|0|2|2| 结构是结构105的子结构
|106|1|Title page|11|0|2|2| 结构11的第二次引用
|107|1|7|15|0|2|2|
|107|2|8|16|0|2|2|
...
|126|4||104|0|2|2|
【实现细节】
用组元 <library ID>+<collection ID>+<document ID>+<filetype>+ <file
reference>( <图书馆代号>+<馆藏集代号>+<文档代号>+<文件类型>+<关联文件
>)来保证对文件的定位。 文件定位程序在特定操作系统的文件系统中将该组元
解析成完全路径和文件名。 由于图书馆计算机总是具有和UNIX文件系统相同的
体系结构,采用这种组元结构很适合查找优化。体系的每一层都有一个信息文件
来描述其底层体系结构。当打开一个图书馆、馆藏集、或文档时,文件定位程序
读取该信息文件来获得文件目录结构信息。下面给出两个例子。
实例一. 采用图书馆、馆藏集、文档、文件类型层次体系。
/<library name> (图书馆名)
LIBINFO.TXT 图书馆层结构信息描述文件
/<collection name> (馆藏集名)
COLINFO.TXT 馆藏集层结构信息描述文件
/<document ID> (文档标号)
DOCINFO.TXT 文档层结构信息描述文件
LOGSTR.000 逻辑结构文件
PHYSREF.000 物理关联文件
/<filetype1> 文件类型1
00001.TIF
00002.TIF
...
/<filetype2> 文件类型2
00001.TIF
00002.TIF
...
实例二. 采用图书馆、文件类型、馆藏集、文档层次体系。
/<library name> 图书馆名
LIBINFO.TXT 图书馆层结构信息描述文件
/<filetype1> 文件类型1
/<collection name> 馆藏集名
COLINFO.TXT 馆藏集结构信息描述文件
/<document ID> 文档标号
DOCINFO.TXT 文档层结构信息描述文件
LOGSTR.000 逻辑结构文件
PHYSREF.000 物理关联文件
00001.TIF
00002.TIF
...
/<filetype2> 文件类型2
/<collection name> 馆藏集名
COLINFO.TXT 馆藏集结构信息描述文件
/<document ID> 文件标号
DOCINFO.TXT 文档层结构信息描述文件
LOGSTR.000 逻辑结构文件
PHYSREF.000 物理关联文件
00001.TIF
00002.TIF
....
这种结构形式数据有些冗余,但是在讲一个完整的馆藏集安装到不同文件系
统上时获得性能上的优化。特别是第二中实现形式能使所有低分辨率的图像文件
存储在高速磁盘上,而将高分辨率图像文件存储在低速磁盘上,对低分辨率文件
实现快速访问,又能降低费用。这也限制其它软件系统(FTP、Gopher)访问权限
便于实现,只允许其访问低分辨率的图像文件、限制对高分辨率的图像文件的访
问。
【安全措施】
该体系结构未考虑安全措施。
【参考文献】
[1] Turner, W., "Cornell Digital Library Document Architecture,
Version 1.1 - 3/22/94", Library Technology Department, Cornell
University.
Author's Address
William Turner
Library Technology
502 Olin Library
Cornell University
Ithaca, NY 14853
Phone: 607-255-9098
Fax: 607-255-9346
EMail: wrt1@cornell.edu
RFC 1691 The Document Architecture for the Cornell Digital Library 康奈尔大学数字图书馆文档体系结构
1
RFC文档中文翻译计划
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -