⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 rfc1691.txt

📁 RFC规范的翻译稿
💻 TXT
📖 第 1 页 / 共 2 页
字号:
物理关联文件举例

+0|CORNELL|OLINLIB|00000001|Boole. Mary Everest||Philoscophy||
|0|1|00000002|5|1|| (关联文件号2,物理关联文件号5,600dpi TIFF影像文件)
|0|2|00000003|5|2|| (关联文件号3,物理关联文件号5,100dpi TIFF影像文件)
|0|3|00000004|6|1|| (关联文件号4,物理关联文件号6,600dpi TIFF影像文件)
|0|4|00000005|6|2|| (关联文件号5,物理关联文件号6,100dpi TIFF影像文件)
注:在上面的例子中,已经确保了关联文件2和3是同一页的两个不同版本,关
联文件4和5也一样。

【逻辑结构文件】

逻辑结构文件是将影像文件连结起来构成文档来提供文档视,该文件实际上
是一棵未安装的树,当文件打开的时候,读入该文件,就会重新建立了树结构。
为了方便起见,逻辑结构文件只包括一种逻辑结构,即页,用来按照纸板图书页
的顺序来排列文档。

文档结构行

字段	内容		备注
1	父结构号	是谁的子结构
2	顺序号
3	逻辑结构名	该结构的标号
4	结构号		和物理关联文件相同
5	子逻辑结构	该结构的逻辑子结构号
6	子物理结构	该结构的物理子结构号
7	关联		

逻辑关联文件举例

|0|0|ROOT|0|4|0|0|	结构0,根,有四个逻辑子结构
|0|1|PAGES|1|100|0|1|   结构1,页,有100个逻辑子结构
|0|2|CONTENTS|2|22|0|1|	结构2,目录,有22个逻辑子结构,无物理子结构       
 ...
|1|1|Production note|5|0|2|2| 结构5,是结构1的子结构,
				标号为 "Production note"
				无逻辑子结构,有两个物理子结构
				在本文档中引用两次
|1|2||6|0|2|1|                结构6无标号
|1|3||7|0|2|1|                结构7有两个物理关联
|1|4||8|0|2|1|                结构8仅被引用一次
|1|5||9|0|2|1|                结构9是页的第五个子结构
 ...
|1|99||103|0|2|2|
|1|100||104|0|2|2|
|2|1|Production note|105|1|0|1|          结构105是结构的子结构
|2|2|Title page|106|1|0|1|               结构106有1个逻辑子结构
|2|3|Table of contents|107|2|0|1|
|2|4|Chapter 1. From Arithmetic to Algebra|108|6|0|1|
|2|5|Chapter 2. The Making of Algebras|109|4|0|1|
|2|6|Chapter 3. Simultaneous Problems|110|4|0|1|
|2|7|Chapter 4. Partial Solutions...|111|3|0|1|
|2|8|Chapter 5. Mathematical Certainty...|112|3|0|1|
|2|9|Chapter 6. The First Hebrew Algebra|113|8|0|1|
|2|10|Chapter 7. How to Choose our Hypotheses|114|9|0|1|
|2|11|Chapter 8. The Limits of the Teachers Function|115|5|0|1|
|2|12|Chapter 9. The Use of Sewing Cards|116|4|0|1|
 ...

|2|20|Chapter 17. From Bondage to Freedom|124|5|0|1|
|2|21|Appendix|125|2|1|1|
|2|22|advertisements|126|4|1|2|
|105|1|Production note|5|0|2|2|          结构是结构105的子结构
|106|1|Title page|11|0|2|2|              结构11的第二次引用
|107|1|7|15|0|2|2|
|107|2|8|16|0|2|2|
 ...
|126|4||104|0|2|2|

【实现细节】

   用组元 <library ID>+<collection ID>+<document ID>+<filetype>+  <file 
reference>( <图书馆代号>+<馆藏集代号>+<文档代号>+<文件类型>+<关联文件
>)来保证对文件的定位。 文件定位程序在特定操作系统的文件系统中将该组元
解析成完全路径和文件名。 由于图书馆计算机总是具有和UNIX文件系统相同的
体系结构,采用这种组元结构很适合查找优化。体系的每一层都有一个信息文件
来描述其底层体系结构。当打开一个图书馆、馆藏集、或文档时,文件定位程序
读取该信息文件来获得文件目录结构信息。下面给出两个例子。
     实例一. 采用图书馆、馆藏集、文档、文件类型层次体系。
  /<library name>			  (图书馆名)
          LIBINFO.TXT                      图书馆层结构信息描述文件
          /<collection name>		  (馆藏集名)
                 COLINFO.TXT               馆藏集层结构信息描述文件
                 /<document ID>		  (文档标号)
                       DOCINFO.TXT         文档层结构信息描述文件
                       LOGSTR.000          逻辑结构文件
                       PHYSREF.000         物理关联文件
                       /<filetype1>	   文件类型1
                               00001.TIF
                               00002.TIF
                               ...
                       /<filetype2>	   文件类型2
                               00001.TIF
                               00002.TIF
                               ...

   实例二.  采用图书馆、文件类型、馆藏集、文档层次体系。

  /<library name>						   	图书馆名	
          LIBINFO.TXT                  	图书馆层结构信息描述文件
          /<filetype1>						文件类型1
                  /<collection name>		馆藏集名
                         COLINFO.TXT     	馆藏集结构信息描述文件
                         /<document ID>	文档标号
                               DOCINFO.TXT  文档层结构信息描述文件
                               LOGSTR.000   逻辑结构文件
                               PHYSREF.000  物理关联文件
                               00001.TIF
                               00002.TIF
                               ...
          /<filetype2>						文件类型2
                  /<collection name>		馆藏集名	
                         COLINFO.TXT      馆藏集结构信息描述文件
                         /<document ID>	文件标号
                               DOCINFO.TXT   文档层结构信息描述文件
                               LOGSTR.000    逻辑结构文件
                               PHYSREF.000   物理关联文件
                               00001.TIF
                               00002.TIF
                               ....

这种结构形式数据有些冗余,但是在讲一个完整的馆藏集安装到不同文件系
统上时获得性能上的优化。特别是第二中实现形式能使所有低分辨率的图像文件
存储在高速磁盘上,而将高分辨率图像文件存储在低速磁盘上,对低分辨率文件
实现快速访问,又能降低费用。这也限制其它软件系统(FTP、Gopher)访问权限
便于实现,只允许其访问低分辨率的图像文件、限制对高分辨率的图像文件的访
问。

【安全措施】

   该体系结构未考虑安全措施。

【参考文献】

   [1] Turner, W., "Cornell Digital Library Document Architecture,
       Version 1.1 - 3/22/94", Library Technology Department, Cornell
University.

Author's Address

       William Turner
       Library Technology
       502 Olin Library
       Cornell University
       Ithaca, NY  14853

       Phone: 607-255-9098
       Fax:   607-255-9346
       EMail: wrt1@cornell.edu
RFC 1691  The Document Architecture for the Cornell Digital Library  康奈尔大学数字图书馆文档体系结构


1
RFC文档中文翻译计划

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -