⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 中文—[4]数据仓库技术在图书馆数字化中的应用研究.txt

📁 KEJIJISNASUO ,QIKAN ,HUANYINGNIDE XIAZAI ! LIANXIFANGSHI:BINDIYI@163.COM
💻 TXT
📖 第 1 页 / 共 2 页
字号:
在认识上,要充分认识到:(a)目前图书馆的信息管理系统中的数据基本上都是原始的操作型数据,数
据间缺乏关联,没有层次,从而导致了大量有价值的信息被淹没在数据的海洋中,要使这些有价值的信息浮
出水面,需要有更强有力的信息系统工具,来支持对信息和知识的分析和挖掘工作. 数据仓库技术是目前解
决这类问题的理想选择. (b)认识到数据仓库系统是基于事务处理系统和其他形式的数据管理系统的,不
是有了数据仓库系统就可以不要事务处理系统和其他形式的数据管理系统,它们各自的工作层面和服务对象
不同. (c)认识到数据仓库是为管理者服务的,管理者想要的信息必须作为开发目标,此只有领导自己才
说得清他到底想要什么. (d)认识到项目开发中,往往会遇到与图书馆现行的机构设置、管理规定、运作
流程等相互矛盾的问题,这时必须要由一把手来协调解决出现的矛盾,直至做出改革图书馆存在问题的决策. 
因而单位一把手必须任项目总负责人. 

数据基础
因为没有丰富的数据基础,数据仓库将面临无米之炊,同时这些数据一般应处于网络环境中,这样便于
集成. 因此图书馆首先应重视各种业务处理系统、管理系统的建设,解决图书馆服务与管理自动化,为数据
仓库建设积累原始数据. 目前我国大多数图书馆经过多年的信息化建设,普遍建立力以网络为平台的信息管
理系统,有许多图书馆还接入了Internet 网,获取信息的能力大大提高,积累了包括读者基本信息、资料流
通信息、书刊音像资料信息、光盘数据库等大量的数据资源,特别是高校图书馆这方面的基础较好. 

技术人才基础
由于数据仓库建设涉及到计算机网络、数据库、系统集成等众多技术,所以它在建设中和今后的维护、
使用和进一步的应用开发都比现有图书馆信息管理系统要复杂的多. 这对图书馆现有技术人才队伍的构成
和水平都是一个很大的挑战. 这是目前图书馆存在的薄弱之处. 

3.2 图书馆数据仓库建设的策略
在数据仓库建设中,从策略上说应解决好眼前与长远、局部与全局、投入与效益之间的关系. 
数据仓库是反复建设的,它在不断的迭代过程中逐步壮大和完善仓库中的主题和数据. 所以,从策
略上讲,应做好长远规划,定位准它在整个图书馆信息系统中的层次、地位和服务对象,明确当前所需解决
的问题. 第一次开发不要过多地去追求主题的多少,数据的全面,而应该将注意力集中在要解决的当务之急
问题的有关主题上. 这样可以减少开发的复杂性,尽快见效. 

袁磊,王培凤:数据仓库技术在图书馆数字化中的应用研究

确定到底是要全局数据仓库,还是数据集市. 这决定了实现数据仓库是采用“自顶向下”方法,还
是“自底向上”方法. 所谓“自顶向下”就是首先从全局数据仓库建起,再根据部门和分析工作的需要,从
全局数据仓库抽取数据建立数据集市,数据流向如图1 所示. 其优点是全局数据仓库中各主题之间关系定义
清楚,数据结构的独立性高,适应查询工具的面广,一旦建成,多种应用可以很快实现. 其不足是首次建设
复杂程度高,难度大,时间长,所选用的软硬件和技术要求高,投资大. 所谓“自底向上”方法,就是从各
有关部门的数据集市建起,以后再根据发展的需要,在数据集市的基础上综合成全局数据仓库. 其优缺点基
本上和“自顶向下”的优缺点相反. 值得注意的是“自底向上”方法中,一旦全局数据仓库建成之后,其数
据集市生成也应调整为如图1 中的办法生成. 这主要取决于所要解决问题的涉及面大小和所能投入的资金. 
作为图书馆来说,特别是高校图书馆,我们认为数据仓库建设还是应从数据集市开始起步,其原因有:

·数据仓库技术还很不成熟,它应用于图书馆还有许多技术问题有待解决,例如,各种形式的资料如何按
主题集成进入数据仓库就很值得研究. 
·利用数据集市可以很快有针对性地解决图书馆的一些应用问题,同时可以积累经验,锻炼技术队伍. 
·高校图书馆是学校的一个部门,它所需要的许多综合数据,以后可以来自学校的全局数据仓库,避免
许多重复建设. 
3.3 图书馆数据仓库系统的开发方法
图书馆数据仓库系统的开发可分为三个阶段,内容包括调研、系统分析与规划,系统设计与测试和系统
维护,具体实现包括以下步骤:

3.3.1 前期调研
在数据仓库开发前,图书馆应对以下项目进行调研和准备:
·图书馆自身现行的运作模式,包括机构设置及职责、运作流程、数据流向及它们之间的内在联系等情
况. 
·搞清现有事务处理系统、信息管理系统的情况,并对准备建设的数据仓库系统与现有系统之间的关系
进行研讨和定位. 
·搞清所希望获得的信息以及它的表现形式. 
·分析现有技术人员的水平与能力,并对他们进行必要的培训. 
·调研他人的成功经验与失败教训. 
·调研产品及其技术情况. 包括产品的主要技术指标,技术的先进性和是否成熟,产品的开放性与兼容
性,产品所需的支持条件,产品的典型用户及市场占有情况,产品的技术支持与售后服务情况等. 
·调研开发商的情况. 主要有开发商的技术队伍、设计开发能力、工程管理水平、典型的开发项目及用
户、经济实力、技术支持与后期服务等情况. 
·在调研的基础上,做好长远规划,明确本次数据仓库开发项目的目标. 
3.3.2 系统分析与规划
·详细分析本次数据仓库开发的需求. 建立开发数据仓库工程的目标、制定工程计划,计划包括数据仓
库的主题及数据范围、技术设备的选型和提供者、可用资源、参与开发人员所需技能与技术培训、双方的责
任、系统将采用的体系结构、工程跟踪及详细工程调度等. 
·分析和建立技术环境. 选择实现数据仓库的软硬件资源,包括开发平台、DWMS、网络通信、开发工
具、终端访问工具,同时建立服务水平目标(关于可用性、装载、维护及查询性能)等. 
3.3.3 系统设计
·根据所确定的数据仓库主题进行数据建模. 即根据图书馆决策需求所确定的主题,选择数据源,并对
数据仓库的数据组织进行逻辑结构设计,包括多维数据结构的事实表、维表和有关视图. 
·设计数据仓库中数据的物理存储结构,即确定各种表的存储位置、存储方式,建立索引等. 
·设计数据抽取转换程序. 数据抽取与转换是数据仓库开发中最困难、最复杂、工作最大的一部分工作. 
抽取需要通过多种数据访问接口访问各种不同的数据源,需要制定读取源数据的策略与方法,从各种途径抽
取来的源数据必须经过析取、条件、合并、删除、关系识别、扩展、校验、更新和重组等数据转换方式处理
62 



第24 卷第5 期襄樊学院学报 2003 年第5 期

后,才能加载到数据仓库中. 数据抽取转换程序实现从图书馆业务系统和行政系统,甚至包括图书馆外部的
有关数据源中抽取数据、清理数据、一致性格式化数据、综合数据、装载数据等过程. 

·定义元数据,即表示、定义数据的意义及系统各组成部件之间的关系. 元数据是关于数据的数据,它
描述了数据仓库的数据和环境,包括关键字、属性、数据描述、物理数据结构、源数据结构、数据间映射及
转换规则、综合算法、代码、缺省值、安全要求、变化及数据时限等. 元数据通常可以分为两类:一类是管
理元数据,它对源数据及其内容、数据仓库主题、数据转换及各种操作信息进行描述;另一类是用户元数据,
它帮助用户查询信息、理解结果、了解数据仓库中的数据和组织. 
·开发支持图书馆决策的数据分析工具. 建立结构化的决策支持查询,实现和使用数据仓库的数据分析
工具,包括优化查询工具、统计分析工具、OLAP 
工具及数据开采工具等,必要时应建立模型库、知识库及推
理机制,帮助进行数据分析. 通过分析工具实现图书馆决策支持的需求. 
3.3.4 系统测试
·对后台数据仓库进行测试,以确保数据抽取转换程序运行正确,数据仓库中数据符合要求. 
·对前台应用程序、查询工具、远程登录程序和分析工具等进行测试,以确保前台程序的健壮性. 
3.3.5 系统维护与完善
数据仓库系统像其它系统一样必须进行不间断地维护与完善,包括系统安全监控、数据质量检测、数据
访问效率评估、管理决策支持工具、重写或完善应用程序、定期进行数据追加等,使图书馆数据仓库能及时
反映数据源的最新变化,系统正常运行. 必要时,应向数据仓库中增加新的主题数据,完善数据构成,以适
应新的数据分析应用的需要. 

4 结束语

本文针对图书馆信息化建设,讨论了数据仓库技术用于图书馆的管理与决策,提高服务水平,以及图书
馆开发数据仓库系统的策略与步骤问题. 结论是数据仓库技术用于图书馆的信息化建设是可行的,是符合现
代图书馆发展趋势的. 然而,此是数据仓库技术应用的一个新领域,有许多技术问题需要解决. 可喜的是,
我国在这方面的探索工作已经开始,并且是将其作为数字图书馆的关键技术来研究的,这必将加快数据仓库
技术在图书馆的应用. 

参考文献:

[1] INMON W H. Building the Data Warehouse[M]. John Wiley & Sons ,Inc.,1996.20-44. 
[2] 王珊,等. 数据仓库技术与联机分析处理[M]. 北京:科学技术出版社,1998.77-124. 
[3] 金岩. 数据仓库与图书馆的发展[J]. 现代图书情报技术, 2000,(3):13-16. 
[4] 方东权. 国外数字图书馆发展特点综述. http://www.ccw.com.cn/htm/center/app/02_11_26_3.asp 
[5] 王伟, 董逸生. 新型数据库技术在数字图书馆中的应用研究[J]. 计算机科学, 2000,( 增刊):360-363. 
[6] 徐慧. 文献数据仓库系统设计方法[J]. 煤炭自动化, 2000,(1):29-31. 
Study on the Application of Data Warehouse Technique in Library Digitalising 

YUAN Lei1, WANG Pei-feng2 

(1 Department of Electrici & Information Engineering, Xiangfan University, Xiangfan 441053, China;) 

(2 Library , Xiangfan University, Xiangfan 441053, China) 
Abstract: The paper has introduced the concepts about data warehouse and data warehouse system,and discussed 
the application of data warehouse technique in decision support, service quality and digital library construction. The 
requirement motive power, foundation of knowledge, data, specialists for building data warehouse are analyzed. The 
methods to realize data warehouse and develop data warehouse system in library are put forward.
Keywords: Library;Data Warehouse;Decision Support 




⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -