📄 中文—[4]数据仓库技术在图书馆数字化中的应用研究.txt
字号:
2003 年9 月襄樊学院学报Sept.,2003
第24 卷第5 期 Journal of Xiangfan University Vol.24 No.5
数据仓库技术在图书馆数字化中的应用研
究
袁磊1,王培凤2
(1襄樊学院电气信息工程系,湖北襄樊 441053;2襄樊学院图书馆,湖北襄樊 441053)
摘要:文章介绍了数据仓库及数据仓库系统的有关概念,探讨了数据仓库技术在图书馆的决策
支持、提高服务质量和数字图书馆建设中的应用问题,分析了建设数据仓库所需要的需求推动力、
认识基础、数据基础和人才基础,提出了图书馆实现数据仓库的策略和数据仓库系统开发的方法.
关键词:图书馆;数据仓库;决策支持
中图分类号:TP311.52 文献标识码: A 文章编号:1009-2854(2003)05-0059-05
数据仓库(Data Warehouse)技术是20 世纪90 年代新近发展起来的信息技术. 该技术目前已在企业、
政府、科技等许多领域得到了成功的应用,取得了很好的经济和社会效益. 然而,此项技术是否适合在图书
馆数字化建设和提高管理、决策和服务水平中应用呢?在此我们从数据仓库是什么,数据仓库技术能解决图
书馆的什么问题,建设数据仓库所需要的基础,图书馆实现数据仓库的策略和数据仓库系统开发的方法几个
方面来探讨图书馆应用数据仓库技术的问题.
1 数据仓库和数据仓库系统
到目前为止,数据仓库的定义并不统一,它仍在发展和变化中. 比较公认的定义是W .H . Inmon 给出的:
数据仓库是支持管理决策过程的、面向主题的、集成的、稳定的、随时间变化的数据集合[1]. 数据仓库根据
数据分析的需要,可以组织成不同等级:全局、部门级和个人级. 整个数据仓库的层次结构如图1 所示. 数
据仓库实现了操作数据与分析数据的分离. 它的主要作用是收集并集成数据,支持数据分析,将分析所得到
的信息保存,向用户提供信息.
数据仓库系统是以数据仓库为基础,通过查询工具和分析工具,完成对信息的提取,满足用户对信息需
求的系统. 在整个系统中,数据仓库居于核心地位,是整个系统的基础;数据仓库管理系统负责管理整个系
统的运行,是整个系统的引擎;而数据仓库工具则是整个系统发挥作用的关键. 这些工具主要有:联机分析
[2]
处理(OLAP)工具,数据挖掘工具,可视化工具. 基于数据仓库的决策支持系统的体系结构如图2 所示.
数据仓库应用系统一般采用C/S 或B/S 体系结构.
收稿日期:2003-02-18
作者简介:袁磊(1959-),男,江苏南京人,襄樊学院电气信息工程系副教授。
袁磊,王培凤:数据仓库技术在图书馆数字化中的应用研究
2 数据仓库技术在图书馆的应用
2.1 对图书馆管理和建设的决策支持
应用数据仓库技术,可以对图书馆的管理和建设决策给予支持,其主要体现在以下几方面:
⑴
通过对读者构成、各类读者特点等分析,帮助图书馆决策应采取什么样的措施来挽留和扩大自己的
读者队伍.
⑵
通过对图书馆所拥有资料构成情况分析,可以知道本馆资料在类型、涉及面、层次等多方面的信息,
清楚本馆馆藏特色和不足,为下一步的馆藏建设提供决策参考.
⑶
通过对读者特点、馆藏、学科建设、科研项目、经费等情况的综合分析,可以帮助我们在经费有限
的情况下,决策如何在类型、领域、层次等方面做出投资平衡,以满足教学、科研等方面的需要.
⑷
通过数据仓库系统可以模拟分析各部门之间的关系、工作量情况,为我们重新整合部门、调整人员
配置和设备配置提供决策依据.
⑸
可以使原本分散、孤立的数据源得到重新整合,使它们之间建立起联系,为读者提供综合而又快速
的查询服务. 例如,目前普遍存在的书目库、期刊库、音像资料库相互隔绝现象,这导致了读者对同一主题
内容的查询要分别去查有关的库. 如果我们在主题这一指导思想下,使得相关的图书、期刊(论文)、音像
资料等建立起联系,就可以使读者快速地查询到所需要的有关资料.
2.2 对提高服务水平的支持
提高服务水平是图书馆始终追求的,然而目前的现象离实际需要却相差甚远,究其原因是多方面的,缺
少必要的技术手段和自动化设备的支持是其中之一.
⑴
提高对读者服务水平的支持. 当今个性化服务正在兴起. 要实现个性化服务就要了解读者的需求.
可以通过对读者的职业、爱好、正在进行的科研项目、多年来读者借阅情况等诸多数据的综合分析,清楚读
者的取向和兴趣. 试设想一下,一位读者如果能够经常收到他所需要资料的清单和简介的电子邮件,他会不
常来图书馆吗?如果我们知道某一群体的兴趣取向,有针对性的准备有关宣传资料,图书馆的读者会不增加
吗?
⑵
提高对教学、科研、学科建设服务水平的支持. 通过对学校所开设课程及学习对象情况、科研项目
情况、学科建设项目情况和图书馆现有资料的综合分析,可以清楚地知道教学需要什么资料,那个科研项目
需要什么资料,有关学科建设需要什么资料,目前馆藏哪些已有,哪些没有,没有的什么地方有等重要信息,
根据这些信息,可以制定采购方案,为有关的教学课程定制参考资料套餐,为科研项目、学科建设项目准备
资料索引等,从而提高为教学、科研、学科建设服务的水平.
⑶
为学校教育学生提供信息支持. 通过对学生的阅读内容、兴趣的挖掘分析,可以了解到学生受什么
样的思潮影响较大,学生对各类问题和社会现象的关心程度等信息,为学校制定教育、引导学生方案提供信
息支持.
⑷
提高信息咨询能力和水平. 目前图书馆的信息咨询还停留在简单的“我有什么资料”的水平上. 图
书馆要想提高信息咨询能力和水平,就必须拥有高性能的信息查询和综合分析系统,解决如何从信息海洋中
提取有价值信息的问题,而这正是数据仓库技术的用武之地. 通过数据仓库可以实现对有关信息的重组,使
之更便于查询,通过信息挖掘分析,可以实现对信息的筛选、分类等,使有关信息更有针对性.
2.3 数据仓库技术是实现数字图书馆的关键技术
数字图书馆是基于Internet 的社会知识工程系统的一个组成部分. 它维护大规模、分布的、有组织的数
据库,支持信息素材的集成、管理和存储,提供Internet 用户的一致访问,实现真正意义上的资源共享,它
被公认为是信息社会的基础设施和衡量一个国家信息技术发展水平的重要指标. 自美国90 年代初率先提出
DLI(Digital Library Initiative,数字图书馆先驱计划)后,数字图书馆的研究和实践受到了各国政府和科研
[3][4]
机构的高度重视,我国从96 年开始跟踪和研究数字图书馆.
数字图书馆从技术层面上来看,主要需要解决的是“藏”和“阅”两个问题. “藏”面对的是如何把分
布在不同位置、多元的(文本、表格、声音、图像等)、海量的信息集成存入数据库,并对它们实施有效的
60
第24 卷第5 期襄樊学院学报 2003 年第5 期
管理;“阅”面对的是如何将分布在不同数据库中的信息快速、准确的提取出来,如何充分发现现有信息背
后隐含的知识、规律或潜在的价值,并用适当的形式展现给用户[5]. 由此可见,数据库技术和网络技术是实
现数字图书馆的基础. 数据仓库技术是在数据库技术和网络技术基础上发展起来的,它在多数据源信息的获
取,对所获取到的大数据量信息的组织及存储,从数据库中查询信息、挖掘信息,将所获取到的信息用适当
的形式展现给用户等多方面技术都比传统数据库技术有了实质性的突破和提高,它在支持全局应用、复杂分
析和知识发现等方面取得了巨大的成功. 数据仓库技术已被用于文献的存储和分析[6]. 从数据仓库技术的
特点和应用领域可见,数据仓库技术对实现数字图书馆是极其重要的.
3 图书馆实现数据仓库应用的策略与方法
从前文可见,数据仓库技术对图书馆提高管理和服务水平,实现数字化建设来说都是非常有用和重要的
技术. 以下本文就实现数据仓库在图书馆的应用所需基础、操作中的策略和实现的方法作一些探讨.
3.1 基础条件
⑴
需求推动力
需求是推动数据仓库技术在图书馆应用最好的推动力. 这种需求主要来源于用户对服务水平的要求提
高,管理者为提高管理和服务水平所需的决策支持需求,图书馆之间竞争的需求等. 这些都是目前图书馆建
设中需要不断解决的问题. 另外,值得提出的是需求推动力很大程度上来自决策者,作为技术人员,要通过
不断地解决领导关心的问题来获得数据仓库技术应用所需的推动力.
⑵
认识基础
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -