📄 6.txt
字号:
发信人: jiyun512 (allen), 信区: DataMining
标 题: 原创-文档数据库可实现性分析报告
发信站: 南京大学小百合站 (Wed May 21 18:27:44 2003)
文档数据库可实现性分析报告
一、背景分析:
传统的关系型数据软件有着有限的数据类型,对多媒体数据的支持不够,现有的,像
InterBase,SQL Server,DB2大型数据库软件,对图像的处理也仅限于二进制的处理,在用
户终端的处理中,要用到像PHP,ASP,JSP等这样的脚本语言的支持,对终端数据的处理带
来一定的不便,假设说你把整个页面做为一个文档而处理进数据库,查讯的结果就是一个
即有文字,又有图像的一个集合,由于它的基本单位为文档类型的,所以称之为文档数据
库。
二、文档数据库的现有产品
己经市场化的产品是Lotus Notes的文档数据库,作为一种新型的数据库,其的应用正
在扩大。
三、可行性分析:
(一)、算法问题:
搜索算法:可以借用GOOGLE的算法,它在互联网上的文档搜索己经相当的成熟,
可以直接借用过来(关键字和PageRanker的结合)。
储存算法:可以用B-Tree,如果有更好的算法也可。
(二)、底层的设计:
我们现在有的代码是InterBase的FireBird(区别于Unix下的FireBird BBS)项目组
,它是一个小型的数据库软件,支持并发性操作,用的是C++,代码也并是很庞大,大约
有2M多的源码,我们可以借来它的一些底层的设计思想和方法,至于MYSQL源码太大,有5
0M,所以分析起来也有一定的不便性。
我们要用它的设计思想设计出我们这个数据库和传统数据库相兼容的一部分。
(三)、用户界面的设计:
用户界面的设计可以用QT来设计,一个跨平台的C++设计器,用来作Windows和Li
nux下的C++程序设计,界面风格可以参考Accecc的设计风格,尽量使界面容易使用。
(四)、和其它数据库的数据转换:
内部存储用到的格式是XML,可以按一定的格式向外输出,增强其对现有数据兼容性
,同时也提供一些数据文件格式的转换工具,简化我们的操作。
(五)、别外的一种设计思想:
这种设计思想就是把文档作为一种数据库的数据类型而存在,这样设计的话,会更
多的加强数据库的兼容性,和满足DBA的使用习惯。
(六)、法律问题的解决:
这个数据库的设计中大多地参考了别人的设计技术,所以在这个过程中,其也是应
该注意的。
(七)、政府的强有力支持。
更多细节见:http://jiyun512.51.net/showinfo.php?type=1&id=169
设计人:王纪云(jiyun512@bbs.nju.edu.cn/0371-8336405/网络一班)
--
jiyun512 vias
※ 来源:.南京大学小百合站 http://bbs.nju.edu.cn [FROM: 61.163.245.221]
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -