📄 2.txt
字号:
发信人: ashun (阿顺), 信区: DataMining
标 题: [转载]中医药学与数据挖掘
发信站: 南京大学小百合站 (Sat Sep 15 16:47:53 2001), 站内信件
URL: http://www.bcmir.com/right2.htm
项目的沿革与资源储备
中医药资源开发项目从1985年6月开始规划,开发工程从方剂库开始,1986-1992年,历
时六年,收集整理中医方剂40万张,覆盖从汉朝到清朝的全部主要方书,涉及350多种中
医古籍,并对其全文进行解析。1995年将公元960以前的在中国大陆的全部方剂信息进行
实验建库,并通过中医管理局的技术鉴定,评价为“国内领先水平”。1997年,以“We
b + DB + Internet”的技术捆绑将方剂库移植到ORACLE FOR UNIX平台上,实现了国际
范围的网上查询和分析处理。目前正在进行方剂库、中医理论库、中药库、针灸库、各
家医案库、现代文献提要库、专题研究库、中医药翻译资源库和中医书籍库的全面建设
。
由于资源媒体和内容的不同,有相当一部分资源涉及多媒体技术,为了资源的合理管理
和利用的效率,我们在SQL Server For NT平台上进行开发,目前我们正在进行中医药各
学科资源库、中医辨证施治模拟系统、特色医疗技术资源库、远程中医处方分析处理及
反馈系统、专家经验资源库和中医VOD资源库的开发。
以上15种资源库预计在一年之内有60%的资源库可以进入正常的扩建维护之中,在此期间
将逐步地和用户实现资源共享。
科学性回顾与技术跟踪
1.中医方剂信息解析方案的提出和数据仓库技术
1985年,北京中医药大学和中国中医研究院部分专家,共同讨论提出了“中医方剂信息
解析方案”,设计出“中医方剂解析整理工作单”,并逐步完善了两万多字的工作单制
作细则,同时要求数据库的设计要适应工作单的目标。该方案体现的思想与今数据仓库
技术设计思想相和,而该方案的实践距今已有十余年的历史。
90年代后期,数据仓库技术作为第二代业务信息系统(第一代为基于主机的查询和报告
)被提出,它在信息处理的能力上有了巨大的飞跃,它最大的优势是能提供历史数据和
汇总信息,它以用户可以理解的形式提供信息支持。数据仓库技术的具体职能,就是将
数据库的数据转变成信息,提供多维分析和智能处理的基础,于是数据库与数据仓库就
有了明显的区别。
今天呈现在用户面前的中医药信息是按照数据仓库对信息处理的方案进行的,由于中医
文献的特点,目前还没有能将如此复杂的文献自动解析的软件工具。就方剂库而言,我
们花费了6年的时间,对40万张方剂进行了解析,获得约计800余万条信息,如果将这些
信息进行综合处理和调用,其信息量将难以想见。方剂如此何况其它。
2.统计分析功能的实现和OLAP技术
在资源库中由于对数据实现了主题解析与合理存放,加上各种信息标引的实现,使系统
具有了统计分析的功能,而且这种统计分析功能是面对某一主题的多维分析。
OLAP(On-line Analytical Processing)是应用户面对反馈信息需迅速做出决策而出现
的一种多维的分析技术,我们使用的分析方法接近OLAP的分析模式,大体分作两个阶段
:1995年以前,系统中的多维分析还没有作到“维”项之间的逻辑关系,多维分析是平
面的结构;之后系统将接受OLAP技术立体的分析技术,逐渐在维象之间建立起相关性的
分析,而且可以作切片并能旋转。
3.分析结果与数据挖掘
数据挖掘是个过程,是从大型数据库中抽取以前没有发现的、可理解的、可操作的信息
来支持人们的决策。简单地说数据挖掘能帮助最终用户回答“为什么”的问题,而使用
户知道该“怎样做”,这就是数据挖掘的意义,无疑这种技术在中医药信息系统中尤为
重要,我们所做的一切努力,都是为了取得这样的一个效果。
从现有的分析结果显示出:有些是以前我们没有认识到的信息,这些信息和某些专家的
临床经验吻合,有的则能有效的指导临床实践。现用到的分析技术有分组、分类、数值
预测、关联发现、顺序规律发现等。
未来的规划与发展趋势
建立在基础数据仓库之上的专题分析模型将是资源发掘工程的主要任务,也是数据库智
能化的高层表现形式,它是数据在数据仓库技术的帮助下转化为信息后,再由分析技术
进行信息挖掘,形成对某一个层面(专题)的综合的分析,产生知识性的认识,也称为
第二性的信息,并就这些信息之间的关联进行深层的推理后,建立起知识化和宏观量化
相结合的分析模型,用以完成一个中医智能解决方案,使系统发挥出前所未有的信息穿
透力,有力地推动中医事业现代化的步伐。
结语
中医药信息资源开发工程对中医药信息的收集、整理、综合、分析提出了全新的概念和
方法。对古文献采取全文收录,现代文献给出结构式摘要的文献整理方法;首次提出了
中医药文献的解析规则与实施方案;率先提出了适用于中医药古文献的标引原则与标引
方法,并付诸实施;首次将数据仓库的概念与技术引入中医药信息的分析处理中,逐步
实现对中医药信息的统计分析及知识挖掘;对于信息的发布,通过INTERNET进行,支持
目前最流行的WEB浏览器对数据库的访问。
中医药信息资源开发工程以综合地继承创新地发扬中医药学术为宗旨,建立在系统工程
设计的基础上,有逐步增容和功能拓展的远期规划,并将与数据库等信息科学的前沿技
术同步发展。
鉴于中医药信息资源开发是一个庞大的工程,我们希望能有更多的合作者介入,以共同
完成此业,为国家、民族,以及全人类献上一份厚礼。
--
业精于勤荒于嬉,行成于思毁于随。 —— 韩愈
临渊羡鱼不如退而结网。 —— 班固
勿以恶小而为之,勿以善小而不为。 —— 刘备
※ 来源:.南京大学小百合站 bbs.nju.edu.cn.[FROM: 202.119.94.53]
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -