📄 中文—[1]数据仓库及其在医学图书馆中的应用探讨.txt
字号:
医院管理版
GUOJIYIYAOWEISHENGDAOBAO
医院信息化
数据仓库及其在医学图书馆中的应用探
讨
◆张书河 广州中医药大学
摘 要 本文简单介绍了数据仓库技术的概念、特点,并就数据仓库技术对提升医学图
书馆采购工作科学性、增加检索、查新工作科技含量进行了论述,并就医学图书馆如何应用、
开发数据仓库技术以及实际存在的问题进行了探讨。
关键词 数据仓库 医学图书馆
1 数据仓库技术简介
数据仓库(Data warehouse)思想形成于20
世纪80年代中后期,直至近期,也还只有数据库
专家才能访问数据仓库,这些专家可以创建检索、
汇总和格式化信息所需的复杂查询,供分析人员和
高级决策者使用。但随着决策管理的需要,越来
越多的领域需要应用该技术。它与人们所熟悉的数
据库的区别在于,数据库是获取数据,而数据仓
库则是分析数据,使研究者可最大限度地从数据中
获取价值。
数据仓库通常包含历史数据,这些数据经常是
从各种完全不同的来源收集的(如联机事务处理系
统、传统系统、文本文件或电子表格)。数据仓
库组合这些数据,对其进行清理使其准确一致,并
进行组织使其便于轻松高效地查询。
数据仓库的特点主要有:规模大,通常是普
通数据库的100倍,一般为10GB左右;数据仓库
面向主题,在逻辑意义上讲,它是对应某一宏观
分析领域所涉及的分析对象,能实现在较高层次上
对分析对象的数据进行完整、一致地描述,能完
整、统一地刻画出各个分析对象所涉及的各项数
据,以及数据之间的联系;此外数据仓库还具有集
成性、稳定性、数据随时间变化等特点。
2 数据仓库技术在医学图书馆中的应用设想
2.1 数据仓库技术提升医学图书馆采购科学水
平
图书馆的采购工作是图书馆信息资源的重要保
障,其质量的优劣直接关系到图书馆的信息服务质
量。长期以来,图书馆的图书采购工作主要采取
书目征订的工作方式,通过出版杜、书店(书商)
的新书目征订图书。但是随着出版物的数量日益增
多,载体日益丰富,图书馆信息结构、读者需求
与资金利用的平衡问题越来越不易把握,也令采购
工作的决策变得相当复杂。如我们想知道哪些类型
的书刊是读者需求率最高的、哪些是需求率高且资
金消耗量最小的、目前有哪些书商可提供相应的图
书、哪些图书借阅率低且资金消耗量最大,以及
部分边缘学科或非本校专业所涉及的书刊,周边馆
是否有收藏,如果有可不订或少量订购等。解决
这些问题,通过现有的系统则需要访问不同的模块
或子系统,通过编写专门的应用程序来访问,这
就使得从现有系统中获取信息变得非常困难与耗
时。
应用数据仓库技术可轻松地解决上述问题。我
们可以根据图书馆采购工作的信息需求,从多方
面、多渠道收集数据,例如图书馆的历史采购数
据、读者数据、流通数据、读者推荐数据、书
商提供的数据库、网上书店,甚至是各个图书馆
自动化系统的流通数据等,利用数据仓库中的分析
服务工具(以前称为OLAP服务)等分析处理技术
对采购信息进行统计分析和预测,帮助采购人员确
定采购重点与合理利用资金,从而为采购工作提供
决策支持,使得采购人员能够时时刻刻地了解读者
的需求并尽可能满足读者需求,也可极大地缩短文
献从采购到被读者利用的时间周期,并保障图书馆
信息资源体系的科学性和合理性。
97
IMHGN
INTERNATIONAL MEDICINE & HEALTH GUIDANCE NEWS
2.2 数据仓库技术增加医学检索、医学科技查
新工作的科技含量
随着计算机检索技能的普及,简单的检索与索
取全文操作已能为广大科技工作者所掌握。但是由
于工作时间的紧张以及压力的增大,他们不再仅仅
满足对相关信息、文献书目数据的索取,而是要求信
息咨询人员能够提供综合度高、附加值大的信息产
品,要求进行深层次的分析。这在综合性、复杂性、
有序性等方面对信息咨询人员都提出了更高的要求。
要适应这一变化,应用当前普遍采用的普通数
据库是难以胜任的,普通数据库的检索能且只能进
行简单的逻辑组配检索。而数据仓库则不同,它可以
借助其OLAP及数字挖掘等工具,分析、挖掘出隐藏
在大量数据中的倾向与趋势,从而达到甚至高于这
一要求。
医学科技查新工作也是如此,也应适时转变工
作模式,以适应新技术的发展。当前,查新工作只是
通过普通数据库进行简单逻辑组配检索,将检索到
的相关文章再由查新人员进行分析。在现实工作中,
要求查新人员对所有相关文献的原文进行查阅是极
不现实的,甚至是数据库中的相关数据,因而多数情
况下只能回答该课题新不新,有没有人做过,别人做
过的话他是应用在哪一方面。长期以来,这似乎已成
定式,这也正是广大科技工作者要求取消查新程序
的一个不可忽视的原因。
医学科技查新工作应该充分利用当前的数据仓
库技术,提升查新水平。利用数据仓库技术,通过其
OLAP、数字挖掘等工具,可以提供比当前查新更深
层次的问题分析。如该课题已有的应用相关技术的
研究情况,可从哪些方面进行突破,及相关技术在各
自领域中的先进程度,与该课题相近领域的研究情
况,该课题研究在同领域中是否显得落后,或者从中
能获得什么启示,或能够提供什么建议。对于开题者
而言,数字挖掘技术还可为其提供意想不到的新思
路,甚至对于学科融合,形成边缘学科或新交叉学科
都能提供一定的启示。
3 医学图书馆如何利用数据仓库技术及其存在
问题
3.1 开发数据仓库
要想提升本馆采购的科学水平,必需自行开发
数据仓库。目前数据仓库的开发方案有BusinessObjects和Sybase、Platinum technology、
Microsoft SQL Server 2000等,其中前三个方
案耗资巨大,唯有Microsoft SQL Server 2000
对于专业图书馆而言最为适宜。
3.2 购买数据仓库成品
目前用于商业目的的数据仓库成品开发相对较
少,大多数仍处于开发状态。如中国中医研究院信息
研究所正在开发的中药药理数据仓库、中药基础数
据仓库、中药化学实验数据仓库等。
3.3 当前存在的问题
由于数据仓库所需要收集的数据量是非常庞大
的,如果没有现成的数据资源,需要单独组织人力、
物力从头开始进行数据仓库的建设,则是任何专业
图书馆所不能承受的。购买数据仓库成品也存在实
际困难,一是该方面的成品较少;二是即使有,由于
其制作成本较高,其售价也会较高。此外,据计算机
世界网的报道,数据仓库每年的维护成本高达100万
美元。这些均制约着数据仓库在专业图书馆中的应
用。
当然,数据仓库凭借其先进技术,必然会渗透
到医学图书馆业务的各个方面,也必然会成为数字
化图书馆建设的关键技术。
参考文献
1 罗运模,等.SQL Server 2000 数据仓库应用与
开发.北京:人民邮电出版社,2001,1
2 Microsoft Corporation 著.数据库创建、数
据仓库与优化.北京:清华大学出版社,2001,209
3 胡岷.数据仓库和图书馆决策支持系统.图书情
报工作,2002,(1):724 张雪兰,郭永梅.浅议情报分析领域未来研究方
向.2002,(1):70(责任编辑:杨德胜
)
98国际医药卫生导报
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -