📄 中文—[3]高校图书馆管理的数据仓库技术研究.txt
字号:
2004 年3 月西安石油大学学报(自然科学版) M ar. 2004
第19 卷第2 期
Journal of Xi′an ShiyouUniversity (NaturalScience Edition)
Vol. 19No. 2
文章编号: 100125361 (2004)0220071203
高校图书馆管理的数据仓库技术研
究
Studyof data warehousefor librarymanagementof collegesanduniversities
张旭波1, 屈展2, 李小刚1
(11 西安石油大学计算机学院, 陕西西安 710065; 21 西安石油大学校长办公室, 陕西西安 710065)
摘要: 高校图书馆管理过程中产生了大量的数据, 应用数据仓库技术可以从中获取许多重要的决策
信息. 结合数据仓库技术的最新研究成果, 论述了高校图书管理数据仓库的系统功能、体系结构和
相应的星型数据模型, 给出了典型的MDX 查询
传统数据库系统比较, 它是面向主题的、集成的、非
, 并阐述了它的开发和设计过程.
关键词: 图书馆管理; 数据仓库; 星型模型
中图分类号:TP391, G250. 7 文献标识码:A
我国高校的图书馆管理普遍从手工操作转变到
联机事务处理, 这给师生员工的图书借阅和图书馆
工作人员的日常工作带来了极大的方便. 随着图书
管理系统功能的不断改进, 管理人员已经可以利用
它们进行一些初步的统计和分析
易逝的, 是随时间变化的数据集合, 数据仓库更注重
准确、安全、可靠的数据抽取和有用、规律性信息的
加工生成.
. 然而, 要进行更高
层次的挖掘和分析, 更充分地利用图书管理过程中
1 高校图书管理数据仓库的系统功能和体系结构
产生的海量数据, 在原来图书管理系统的基础上建111 数据仓库的系统功能
立数据仓库, 无疑是解决这一问题的有效途径. (1) 数据仓库对图书采购起决策支持作用. 图书
数据仓库(DW ,Data W arehouse) 是计算机和采购是图书馆各项业务中最重要的一项, 是各种知
数据库的应用, 特别是数据库应用发展到一定阶段识资源的主要来源, 只有获得准确的需求信息, 才能
的必然产物. 在数据库应用的早期, 计算机系统处理采购到适合读者需求的书籍[2] . 图书包括传统意义
的是从无到有的问题, 是传统手工业自动化的问题, 上的纸张类图书和电子类图书, 合理的图书采购一
适应这种需要, 当时建成了许多联机事务处理系统方面能避免重复购置和财力浪费; 另一方面可以使
(OL TP ) , 取得了巨大的经济效益和社会效益, 馆藏紧跟现代科学的发展. 传统方法获得的需求信
OL TP 也成为20 世纪80 年代到20 世纪90 年代数息往往缺乏科学论证, 带有一定的主观性和盲目性,
据库应用的主流. 然而, 人们逐渐发现仅依赖联机事而从出版社、期刊社、书店的新书书目来获取的信息
务处理系统不足以获得充足的有用信息, 必须对这并不一定符合本校的实际需求. 通过建立数据仓库,
些大量的数据进行再加工, 使它们可以用于分析和利用联机分析处理(OLA P) 和数据挖掘(DM ) 等技
统计, 才能满足企业和用户尤其是决策者的需求. 数术可以为文献采购, 特别是电子类图书的采购提供
据仓库是一个以大型数据管理信息系统为基础, 附科学、合理的各种分析及预测信息.
加在这个数据库系统之上并存储了从企业所有业务(2) 数据仓库可以为图书馆优化服务措施, 改进
数据库中获取的综合数据并能利用这些综合数据为服务质量提供决策支持. 首先, 通过对大量图书借阅
用户提供经过处理后的有用信息的应用系统[1] . 与数据的统计分析, 总结出图书借阅的规律, 可以动态、
收稿日期: 2003209207
作者简介: 张旭波(19702), 男, 陕西兴平人, 在读硕士, 主要从事管理信息系统和计算机网络的研究
.
. 1994-2006 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
—
72
—
西安石油大学学报(自然科学版)
科学地决定各类图书的最佳编排位置, 既利于读者帮助用户或开发人员更好地了解DW 中存放的数
借阅, 也方便图书馆工作人员. 其次, 分析业务量与据, 便于他们更方便地使用和管理.
时间的关系, 可以合理地安排人员和作息时间. (5) 数据应用: 可以进行较复杂的查询应用, 同
(3) 数据仓库为高校、院系和班级了解、掌握学时, 可借助一些数据分析工具, 如报表生成工具、
生的学习动态提供信息支持. 采用数据仓库的多维OLA P 和数据挖掘完成常用的数据表示和分析.
数据库存储方式, 能够包容决策分析所需的大量数
据, 并保证数据的一致性、完整性和安全性, 其分析2 关键技术
查询的高效率和交互式图形接口的高质量能满足用211 数据仓库的概念模型
户特定信息需求. 通过对学生一学期、一学年甚至两高校图书管理数据仓库在设计时采用星型模型
学年乃至整个大学期间所借图书的种类和时间
分
来表示多维概念模型, 该模型包括一个“事实表”, 而
析, 有助于了解学生的学习方向、态度及波动情况, “事实表”中的每一维都有一个“维表”. 事实表中的
对于制定和改进教育教学方法和措施很有帮助. 每个元组都包含有指向各个维表的外键和一些相应
(4) 数据仓库为图书馆的数字化提供技术支持. 的测量数据, 维表中的记录是这一维的属性.
信息化和数字化是时代发展的趋势, 作为信息重要(1) 维表的建立. 高校管理人员往往按系别、班
和发展中存在着巨大的技术困难和障碍, 主要原因问题的角度就是所谓的维, 不同的决策人员会从不
是知识更新加快, 各种图书杂志层出不穷, 如此海量
的信息资源
重重, 而利用数据仓库则可以对它们进行有效的存
储、管理, 给用户提供高效、可靠的特殊查询和服务
112 高校图书管理数据仓库的体系结构
, 运用传统的数据库模式进行管理困难的决策要求, 可以通过选取不同的维度来导航到相
载体的图书馆更不例外. 但是, 在数字图书馆的研
究
同的角度看待数据, 图书借阅数据是多维的, 对不同
级、学生、图书种类、日期等查询有关信息, 这种分析
应的目的. 对维度的描述构成了数据仓库中的维表
. 及维层次表, 不同主题的维度可能共用相同的维表.
由于维的变化将会引起数据仓库结构的变化, 因此
高校的图书借阅系统是以单一的数据资源(数在需求分析时应该考虑周全.
据库) 为中心, 进行联机事务处理. 而数据仓库技术(2) 事实表的建立. 对图书借阅事实的描述构成
则具有分析处理的特点, 是一种结构和哲理性的方了数据仓库的事实表, 往往是用户查询活动的中心
法, 也是一种技术, 而且是存储数据的一种形式. 高所在. 它包括的数据是从联机事务处理系统中获得
校图书管理数据仓库作为一个系统, 包括以下4
个
的真实信息, 是对业务行为进行定量衡量的数据, 比
主要部分, 其结构图如图1 所示
.
如借阅图书的数量、种类、日期, 借阅人的姓名、系
别、班级, 库存图书的数量、种类, 预约图书的数量、
种类. 面向不同的主题需建立不同的事实表, 在事实
表中, 除详细数据外还可进行聚合.汇总数据存储.
(3)“维表—事实表”构成的星型模型. 维表和事
实表关联起来可使数据仓库的复杂查询直接通过各
图1 图书管理数据仓库的体系结构维的层次比较、上钻及下钻等操作完成[3] . 维表和事
(1) 数据定义: 完成数据仓库的结构和环境的定实表的关联是通过维度的键值来实现的, 事实表是
义, 主要包括定义DW 中数据库的模式、DW 的数星的中心, 维度则是星的角, 星型图建模技术可以为数
据源和从数据源提取数据时的规则和模型. 据仓库建立完善的模型. 图2 描述了以读者编号、图书
(2) 数据提取: 从图书管理数据库中提取数据, 编号、日期标识为借阅事实表的列的星型模型.
包括图书借阅数据、网上图书预约信息、电子图书的212 典型MDX 查询
访问信息等, 并对获得的源数据(source data) 进行数据仓库中的数据有多个维度, 对它们的访问
加工处理, 使其成为DW 可以管理的数据格式
.
采用多维表达式(MDX),MDX 是一种语法, 支持多
(3) 数据管理: 负责数据的分配和维护, 完成数维对象与数据的定义与操作. 基本MDX 查询模式
据的转储和恢复、安全性定义和检测等, 并支持数据如下:
应用
.
SELECT [< axis specification>
(4) 数据目录: 描述DW 中数据的定义和组织
,
[, < axis specification> .
.
]]
. 1994-2006 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
张旭波等: 高校图书管理的数据仓库技术研究
—
73
—
图2 星型模型
FROM [< cube specification> ]
[WHERE [< slicer specification> ]]
在MDX 中, SEL ECT 子句用来选择要返回的
维度和成员; FROM 子句为查询指定数据源, 仅被
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -