⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 中文—[9]数据仓库技术在图书馆管理中的应用研究.txt

📁 KEJIJISNASUO ,QIKAN ,HUANYINGNIDE XIAZAI ! LIANXIFANGSHI:BINDIYI@163.COM
💻 TXT
字号:
第20 卷第5期
  情 报 科 学  Vol1 20, No 1 5 
2002 年5月M ay, 2002 

数据仓库技术在图书馆管理中的应用研究

张泽英 郭光莹

(天津大学图书馆, 天津300072) 

摘 要 本文探讨了数据仓库技术, 并对数据仓库技术在图书馆中的应用进行了研究, 描述了图书馆数据
仓库技术开发步骤, 提出了一种基于数据仓库技术的数字图书馆管理模型。
关键词 数据仓库 数据挖掘 OLA P  数字图书馆

Research on the Application of Database in L ibrary Management 

Zhang Zeying  Guo Guangying 
(LibraryofTianjinUniversity, Tianjin300072) 

  有着H. 
其里程碑式的著作《Building theDataWarehouse 》
一书中对数据仓库的定义是: 数据仓库就是支持管
理决策过程的、面向主题的、集成的、稳定的、不
“数据仓库之父”之称的W. 光盘查
询, 网上查询, 图书流通借阅率; 并通过联机分析
处理OLA P 、决策支持系统(DSS) 和数据挖掘技术
等数据仓库技术为采购文献提供科学、合理的各种

Abstract  The paper discusses database technique and researches its application in library, and states the 
and points out a digital library management mode based on 
Keywords  Database  Database exploring  OLA P  Digital library 
Immon 在多渠道地收集。这些多渠道包括专家推荐,
developing steps of library database technique,
database.



同时间的数据集合。分析及预测信息。

数据仓库是一种概念, 不是一种产品。它包括(2) 数据仓库为图书馆信息咨询和信息检索提
电子邮件文档、语音邮件文档、CD -ROM 、多媒体供决策支持。目前, 许多图书馆都开展了信息咨询
信息以及其它还未考虑到的数据。数据仓库最根本业务。在信息咨询过程中, 当用户提出高层次的信
的特点是要物理地存放数据, 而且这些数据并非是息需求时, 特别是面对诸如多媒体、电子文件等各
最新的、专有的, 而是来源于其它的数据库。数据种形式的大量无序信息资源, 要检索、分析、优化
仓库的建立并不是要取代原有的数据库, 而是建立组合出用户满意的决策支持结果时, 一般的数据库
一个较全面和完善的信息应用的基础上, 用于支持技术就不能胜任了。采用数据仓库的多维数据库存
高层决策分析。数据仓库是数据库技术的一种新的储方式, 能够包容决策分析所需的大量数据, 并保
应用, 它还需用数据库管理系统来管理数据仓库中证数据的一致性、完整性和安全性, 其分析查询高
的数据。效率和交互式图形接口能够高质量、迅速地满足用

户特定信息需求。
1 数据仓库在图书馆管理中的应用(3) 数据仓库为数字图书馆的建立和发展提供
技术支持。21 世纪是数字图书馆的时代, 但在数字

(1) 数据仓库对图书馆采购起决策支持作用。图图书馆的研究和发展中存在着巨大的技术困难和障
书采购是图书馆信息资源重要保障的关键环节。传碍, 如此海量的信息资源, 运用何种技术对之进行
统的采购信息大多通过出版社、期刊社、书店的新有效的存储、管理和利用呢? 我们认为数据仓库可
书书目来获取。这种有限的信息传递, 一方面导致以为数字图书馆的建设提供关键技术。
出现重复购置、浪费财力的现象; 另一方面使馆藏数据仓库技术作为近年来刚被提出的新技术, 
跟不上当今的信息生产量, 落后于现代科技的发展在电信、金融等领域已经有了较广泛的应用, 并发
步伐, 同时又使某些学科的信息不能满足专业人员挥了重要作用, 同时, 数据仓库技术本身也获得了
的需要。为此, 我们可以通过数据仓库技术多方面快速发展。尽管目前数据仓库技术在数字图书馆的
收稿日期: 2002-02-02 


. 1994-2006 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net 


5 期           数据仓库技术在图书馆管理中的应用研究

应用研究上处于起步阶段, 但在知识发现、数据挖
掘、组织和分析等方面有着巨大的发展潜力。在数
字图书馆的研究开发中, 元数据的界定与自动抽取、
多媒体对象数据的压缩和还原、海量信息资源和超
大规模分布式数据库的快速存取、分布式资源库可
互操作性的实现、不同层次多个分布式资源库的快
速横向跨库查询以及基于并行处理的高速查询引擎
的实现等, 数据仓库技术都是必不可少的关键技术。

2 图书馆数据仓库的开发步骤

图书馆数据仓库的开发内容包括汇集各种源数
据、存储并管理数据和获取所需信息三个过程, 具

体实现包括以下步骤: 

(1) 系统分析与规划。①详细分析图书馆数据
仓库的需求说明。建立开发图书馆数据仓库工程的
目标及制定工程计划, 
计划包括数据范围、提供者、
技术设备、资源、技能、组员培训、责任、方式方
法、工程跟踪及详细工程调度等。②分析和建立技
术环境。选择实现图书馆数据仓库的软硬件资源, 包
括开发平台、DBM S 、网络通信、开发工具、终端访
问工具及建立服务水平目标(关于可用性、装载、维
护及查询性能) 等。

(2) 系统设计。①确定图书馆数据仓库主题, 进
行数据建模。根据图书馆决策需求确定主题, 选择
数据源, 并对数据仓库的数据组织进行逻辑结构设
计。②设计图书馆数据仓库中的数据库, 基于图书
馆决策的需求, 着重于某个主题, 开发图书馆数据
仓库中数据的物理存储结构, 即设计多维数据结构
的事实表和维表。③数据转换程序。数据转换在数
据仓库开发中占有很大一部分工作量。从各种途径
收集上来的源数据并不是简单的直接地加载到图书
馆数据仓库中, 源数据加载到图书馆数据仓库之前
必须经过数据转换, 数据转换的方式有, 析取、条
件、合并、删除、关系识别、扩展、校验、更新和
装载等, 数据转换程序实现从图书馆业务和行政系
统中抽取数据、清理数据、一致性格式化数据、综
合数据、装载数据等过程的设计和编码。④管理元
数据。定义元数据, 即表示、定义数据的意义及系
统各组成部件之间的关系。元数据是关于数据的数
据, 它描述了数据仓库的数据和环境, 包括关键字、
属性、数据描述、物理数据结构、源数据结构、映
射及转换规则、综合算法、代码、缺省值、安全要
求、变化及数据时限等。元数据通常可以分为两类: 
(4) 系统维护。管理图书馆数据仓库环境。数
据仓库必须像其它系统一样进行管理, 包括质量检
测、管理决策支持工具及应用程序并定期进行数据
更新, 使图书馆数据仓库正常运行。
  3 一种基于数据仓库技术的数字
图书馆管理模型

  我们把上面提到的数据仓库、数据挖掘、
OLA P 、模型库等技术结合起来, 设计了一个数字图

书馆管理模型。该系统结构如图1 所示。

 用  户 


 问题综合与交互系统 

 模型库管理系统  知识库管理系统  决策信息系统 
h       ↑      

e 

e       ↑      

h 

 数据挖掘、OLA P 等技术 


 数据仓库 

h      

e 

 数据库    数据源 

图1 

其中数据仓库从数据库和数据源中获取数据。
数据挖掘用于挖掘图书馆数据仓库中的知识, 数据
挖掘从图书馆大量的、不完全的、有噪声的、模糊
的、随机的数据中, 提取隐含在其中的, 人们事先
不知道但又是潜在有用的信息和知识。OLA P 是一

一类是管理元数据, 它对源数据及其内容、数据仓
库主题、数据转换及各种操作信息进行描述, 另一
类是用户元数据, 它帮助用户查询信息、理解结果、
了解数据仓库中的数据和组织。⑤开发图书馆决策
的数据分析工具。建立结构化的决策支持查询, 实
现和使用数据仓库的数据分析工具, 包括优化查询
工具、统计分析工具、C.S 工具、OLA P 工具及数据
开采工具等, 通过分析工具实现图书馆决策支持需
求。

(3) 系统测试。①对后台数据仓库进行测试, 以
确保数据仓库的完备性。②对前台应用程序、查询
工具、远程登录程序和分析工具等进行测试, 以确
保前台程序的健壮性。
. 1994-2006 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net 


情 报 科 学                  20 卷

组多维数据分析工具的集合, 用于实现多维数据分
析, 其结构有基于多维数据库的OLA P 和基于关系
数据库的OLA P 两种。模型库实现多个广义模型的
组合辅助决策。专家系统利用知识推理进行定性分
析。集成的图书馆综合决策系统将相互补充, 相互
依赖, 发挥各自的辅助决策优势, 实现更有效的图
书馆辅助决策功能。

现代科技的迅速发展一方面生产出大量的信息
资源, 另一方面也给科技工作者在海量的信息库中
发掘和使用资源带来困难。数据仓库技术既为我们
提供了容纳大量信息的场所, 又为我们对信息资源

进行适时分析和深层挖掘提供支持; 运用数据仓库
技术, 使我们能够从大量繁杂的数据记录中发现真
正有价值的信息和知识。可以预言, 随着数据仓库
技术的不断发展、成熟及其在图书馆中的应用, 必
将使图书馆的信息服务能力、决策支持能力和图书
情报信息整体应用效能得到进一步的改善和提高, 
同时也将为数字图书馆的建设和发展奠定基础。
参考文献
1  V idette Poe. Bu ilding a D ata W arehou se fo r D ecision 
Suppo rt. B y P ren tice PTR , P ren tice2H all. Inc. 1996 
2 Srin ivasan V. O n2line p rocessing in large2scale tran sact2 
ion system s. [Ph. D. T hesis ]. U n iversity of W iscon sin2 
M adison, 1992 
3 王 珊, 等. 数据仓库技术与联机分析处理. 科学出版社, 
1999 
4 张述林, 陈 敏. 数据仓库技术及其在图书馆决策中的应
用. 现代图书情报技术, 2000 (1): 27~30 
5 徐 仲. 数据仓库技术及其在图书馆中的应用. 事业建
设, 2001 (1) : 51~52 
6 金 岩. 数据仓库与图书馆的发展. 现代图书情报技术, 
2000 (3): 13~16 
7 徐 慧. 文献数据仓库系统设计方法. 煤矿自动化, 2000 
(1) : 29~31 
(责任编辑: 孙晓明) 
(上接第479 页
)
  (3) 实现横向联合, 建立专业特色数据库


选购先进的图书馆管理系统软件, 建立具有多
种检索功能的特色数据库, 根据资料室的资源优势
设立回溯书目数据库和各种专题数据库, 根据教学
和科研的需要编制各种专题数据库。这种专题数据
库收录范围明确, 服务针对性强。网络时代高校资
料室的情报服务如何迈上一个新台阶, 笔者认为各
高校的同类专业资料室应实现横向联合。结合本专
业的特点, 根据自身的资源优势, 开展专题文献服
务, 建立具有专业特色的数据库。全国各高校同类
专业院系资料室可根据自身的资源优势, 分别承担
相应的专业课题。通过分工协作的横向联合, 把一
校、一室独立的情报活动, 扩展为众多院校相同专
业资料室的联合情报活动。每个资料室承担一个专
题, 对此进行专业化的搜集、整理和加工, 建立专
题数据库。并根据网络信息的变化, 定期对数据库
的内容进行更新补充。这样既避免了相同专业资料
室的重复劳动, 又有利于情报的搜集加工工作向精
深方向发展。建立特色数据库后, 各资料室要做出
目录清晰、结构合理、内容独特新颖、具有本专业
特色的网页, 设立网址。通过网络发布自己的信息, 

接受其他协作单位的信息。资料室的信息资源与图
书馆的信息资源共享。对外可利用中国教育科研网
和中国高等教育文献保障体系, 发送自己的信息, 接
受其他协作单位的信息, 实现大范围的信息资源共
享, 提高情报资料的利用率。

21 世纪是信息时代, 在信息社会中, 信息被看
作一种重要的资源, 它已经成为这个时代的经济因
素和财富。图书, 情报文献, 资料是社会信息的重
要组成部分。社会的进步和科技的发展是以文献情
报为先导的, 文献情报是一切科研成果的前期劳动
和基础。因此, 强化高校专业学科资料室的情报职
能, 不断地、深层地开发和利用文献情报资源是十
分重要的。

参考文献

1 牛士英. 论新时期高校资料室的前景. 情报资料工作, 

2001 (1) 
2 江心月. 高校参考咨询工作变革与思考. 现代情报, 2001 

(2) 
3 牛士英. 网络时代高校院系资料室的情报服务. 现代情
报, 2001 (2) 
(责任编辑: 孙晓明) 


. 1994-2006 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net 



⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -