⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 11.txt

📁 This complete matlab for neural network
💻 TXT
📖 第 1 页 / 共 5 页
字号:
庞大的事实表中,所以只要扫描事实就可以进行查询,而不必把多个庞大的表联接起来;同
时由于维表一般都很小,甚至可以放在高速缓存中,与事实表作联接时其速度较快.另一方
面,对于非计算机专业的用户而言,星形模型比较直观,通过分析星形模型,很容易组合出
各种查询。如通过网点和业务类别两个维,可分析网点在相同业务类别上的情况,便于各网
点发现各自的优势,取长补短;又如通过交易方式、客户和时间三维,可分析不同时间的不
同需求。相应地,可以对不同的客户提供不同的服务,在不同的时间采取不同的方式。
3.2.2雪花模型
雪花模型是星形模型的扩展,它比星形模型增加了层次结构,体现了维的不同粒度的划分。
使用雪花模型进一步增加了查询的范围,以帮助决定市场开发的策略;也能回答如"某一网
点某个业务类别去年共完成多少,人均完成如何"的问题,以预计下一年不同网点的完成量
,为制订业务计划提供依据。以上的例子只有一个事实表,而在实际应用中,往往有若干事
实表,它们分别和各维表相关联,构成扩展的雪花模型。在有些查询中可能会用到若干个同
时联接了相同维表的事实表。
整个数据仓库是依据模型方法建立的,在创建数据仓库时需建立下列几类表:
    (1) 系统信息表:用于维护运行及编程所需,如记录系统时间、数据备份、数据转储和
系统数据字典;
    (2) 档案数据表:系统中各对象数据,资金信息、客户地区、网点信息、系统凭证等;

    (3) 原始单据表:记录原始单据备查;
    (4) 数据仓库数据表:数据仓库的主题表与维表,如多维数据:包括储蓄帐户余额、含
金量、应付利息、现金流入量、现金流出量、现金转入量、现金转出量等;
(5) 转换对照表:用于数据源至数据仓库转换中的客户对照、资金对照等。

    3.3环境设计
建立数据仓库时,需要综合考虑软硬件环境,如数据加载性能、查询性能、建仓规模和用户
规模。通过数据采集、转换、综合和迁移,形成与原有数据库相分离的、完全独立的数据仓
库。数据仓库需要高性能数据库管理系统和并行数据库技术的支持.由于大容量的数据存储
和迅速查询的要求,作为数据仓库的主机系统应有高性能的CPU。良好的I/O接口和大容量的
联机硬盘及内存,作为快速查询与分析使用。同时也应配一部分海量外存设备,如光盘阵列
和磁带机等,作数据转储使用。

3.4数据采集、整理与存储
数据仓库的数据源来自OLTP中的操作数据,这些数据源都可能有不同的格式,如平台、标准
和含义。在不同数据源中,甚至同一个源中,有可能出现同一对象的多个实例(如客户)。
物理点上,他们分布于各地的数十个局域网或几十台PC上,且又分属于不同的操作系统与数
据库管理系统上。这对数据源的采集带来了困难,需对各个物理点(各局域网)和逻辑点(
路径或同一网中异构环境)上抽取,数据按一定的模式进行整理与过滤(同一对象多个实例
),最后转换成一个数据仓库接口需要的标准数据源。这些工作在整个数据仓库建设中占据
相当长的时间。对于数据采集与导入,如果在同构环境下(如同一操作,同一数据库系统)
,问题就易解决;异构环境下,就需要相应工具进行数据处理。研制开发一套异构操作系统
异构数据库系统的数据转换工具,用于数据仓库的数据导入。这些工具利用了ODBC的技术及
各数据库系统的结构,实际使用效果较好,解决了数据库互操作的问题。
在系统的数据传送与采集方面进行一些专用软件开发工作,如:
    (1) 远程数据采集模块:如点对点通信(用于连锁店)数据传送程序;外地网点拨号上
网数据传送程序;外地网点间互联路由器方式数据传送程序。
    (2) 未转换数据缓冲表生存模块:如从远程或本地采集来的数据,转入一定格式的未转
换数据缓冲表。
    (3) 完整性检测模块:未转换数据缓冲表对数据进行一定的检测与整理,如代码统一化
,过滤同一对象多个实例,使之形成一个数据仓库所需标准接口数据,模块涉及的代码设对
照关系表,最后形成待载入数据仓库的标准数据表。
    (4) 数据载入模块:主要用于异构环境下数据转移和数据仓库的数据载入.具体是从标
准数据表将数据载入数据仓库中的数据表。
数据源确定与数据载入完成后,下一步就是数据仓库的数据存储问题.存储包含了数据不同
视图的存放形式,其存储管理系统,正如前面环境设计所讨论的,主要有关系数据库管理系
统(RDBMS)或多维数据库管理系统(MDDBMS),目前用RDBMS的较多,MDDBMS表示的数据形
式,易于为数据仓库用户理解与使用。
    
    3.5方案
DW、OLAP和DM是作为三种独立的信息处理技术出现的。DW用于数据的存储和组织;OLAP集中
于数据的分析;DM则致力于知识的自动发现。它们可以分别应用到信息系统的设计和实现中
,将它们结合起来,利用它们的内在联系和互补性,充分发挥各自特长,形成银行决策支持
系统方案:DW+OLAP+DM+WWW=BANK-DSS。

3.6原则及目标
(1) 充分利用现有的信息基础,包括办公自动化系统、对公业务处理系统、人事档案系统等
,特别是"综合网"的软、硬件平台及其产生的大量数据信息。
(2) 采用成熟、先进的技术。当今信息技术发展迅速,新技术、新设备层出不穷,采用先进
可靠的技术,既能保证系统的发展需求,又能保证系统的可靠运行。
(3) 质量高,符合国际、国内有关标准,具有可扩充性。
(4) 方便性,界面友好,便于操作。
(5) 安全性。

3.7逻辑结构
采用客户/服务器结构。服务器部分是整个系统的数据仓库,包括事务处理服务器和应用服
务器两部分,负责整个系统所需信息的收集、汇总、整理、存储、分析和传输。整个OLTP的
CLIENT/SERVER也包含在DSS的服务器部分。工作站部分是DSS的主要部分,供决策者和管理
者使用,它以服务器传递的数据为基础,以中文图形窗口为界面,以模型、知识为核心和驱
动,提供信息咨询和决策支持。

3.8系统组成
数据仓库一般由五个功能部分组成:①数据源的确定与采集;②数据的转换;③数据的载入
与存储;④数据的查询分析;⑤元数据。处理面向决策的数据调取与分析,涉及一些OLAP的
工具的使用,如查询各类视图的产生、报表的形成、对有价值的数据挖掘等。元数据(Meta
 Dada)是其他四个部分的基础,是管理数据仓库的控制参数.元数据和数据仓库数据一样
,对数据仓库开发者非常重要.数据仓库环境需要在一些元素基础上的原数据.这些元素数
据从OLTP中选取出来,包括他们的域、有效性、采集规则以及将这些元素数据转换成数据仓
库集成视图的规则.元数据也描述数据仓库的数据库,包括控制中央数据库的数据迁移到相
关数据集市分配规则.有关数据结构、执行和监控数据也可成为元数据.监控数据仓库过程
(例如选取、加载、使用)的各过程能产生元数据,被用作决定整个环境运行的良好程度.
同样,用来识别在选取和加载过程中数据质量问题的元数据必须被数据仓库用户获得,从而
他们能够将这类知识作为决定他们分析精确程序的一项因素.数据仓库管理者能通过元数据
对数据仓库进行管理。
系统工作步骤为:①对原始数据进行规范化处理,得到规范数据,建立数据仓库;②在数据
仓库的基础上运行专家系统,得到规则结果;③调用分析模型和知识管理系统,得到分析结
果;④调用市场预测模型和知识系统,得到预测结果;⑤根据原始数据、专家系统、分析预
测结果,生成分析预测报告,并以文字、图形、报表、图画、语音等方式输出。

3.9实现构架
根据数据库技术的发展和激烈的市场竞争的需求,我们提出以数据仓库为基础、以OLAP和
DM工具为手段的一整套可操作、可实施的DSS解决方案。数据仓库用于数据的存储和组织;
OLAP集中于数据的分析数据挖掘和致力于信息的自动发现。将它们结合起来,设计出一种新
的DSS构架,如图1所示。这种构架有两个主要特点:
  (1) 以MIS系统和数据库中的大量数据为基础,系统由数据驱动
  * 在底层的数据库中保存大量的事务级数据。这些数据是整个DSS系统的数据源。
  * 数据仓库对底层数据库中的事务级数据进行集成、转换和综合,重新组织成面向全局
的数据视图,为DSS提供数据存储和组织的基础。
  * 在线分析从数据仓库中的集成数据出发,构建面向分析的多维数据模型,再使用多维
分析方法从多个不同的视角对多维数据进行分析、比较。分析活动从方法驱动转向数据驱动
,把分析方法和数据结构分离以适应数据多变的需求。
  * 数据挖掘以数据仓库和多维数据库中的大量数据为基础,自动地发现数据中的潜在模
式,并以这些模式为基础自动做出预测。数据挖掘表明,知识就隐藏在日常积累下来的大量
数据之中,而仅靠复杂的算法和推理并不能发现知识,数据才是知识的真正源泉。

图1 基于数据仓库的BANK-DSS构架

  (2) 完整统一的DSS解决方案
  在传统的DSS中,数据库、模型库和知识库往往被独立地设计和实现,因而缺乏内在的
统一性。而数据仓库、联机分析和数据挖掘组成的新的DSS构架对这种不统一问题给出了令
人满意的回答。
  * 数据仓库解决了DSS数据库内数据的不一致问题。建立在数据仓库上的DSS数据库可以
为用户的数据访问提供统一的全局数据视图。
  * 多维数据模型和OLAP为用户提供了一个带有普遍性的数据分析模型。各种分析方法和
工具可以有效地互操作。
  * 以数据仓库和多维数据库为基础的数据挖掘可为决策提供全局性的知识,这些知识可
以为所有的应用共享。
    * 由于内存的统一性,这种新结构能很好地解决相互间的衔接问题。
数据仓库为OLAP提供了充分可靠的数据基础,数据挖掘可以从数据仓库和多维数据库中找到
所需的数据,数据挖掘中发现的知识可以直接用于指导OLAP的分析处理,而OLAP分析得出的
新知识也可以补充到系统的知识库中。

    3.10利用Internet/Intranet进行决策支持
  作为信息传播的载体Internet,随着能够联入Internet的人数逐渐增多,日益变成人们
熟知的全球范围网(WWW),大大丰富了Internet的信息资源。九十年代,企业网已经成为连
接企、事业内部各部门与外界交流信息的重要基础设施。在市场经济和信息社会中,企业网
对增强企业的综合竞争能力有着重要的作用。
  Internet特别是Intranet的出现,对决策支持系统的研究与开发提出了许多极富挑战性
的问题。新的基于Internet的决策支持扩大了可利用信息的范围。当一个企业网是建立在
Intranet上时,就分析与决策而言,至少在以下两点上会发生很大变化;
  (1) 分析、决策用的数据不再集中于某一场地,而是分散到网络上的不同地区、部门。

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -