数据库与数据仓库 (数据仓库 设计规范)

时间:2024-09-20 20:25:35 来源:风铃百科 作者:管理员
数据库与数据仓库 (数据仓库 设计规范)

数据库房与数据库的主要差异有
首要咱们来了解数据库房和数据库别离是什么:
1、数据库:是一种逻辑概念,用来寄存数据的库房,经过数据库软件来完成。数据库由许多表组成,表是二维的,一张表里边有许多字段。字段一字排开,对数据就一行一行的写入表中。数据库的表,在于能够用二维体现多维的联系。如:oracle、DB2、MySQL、Sybase、MSSQL Server等。
2、数据库房:是数据库概念的晋级。从逻辑上了解,数据库和数据库房没有差异,都是经过数据库软件完成寄存数据的当地,只不过从数据量来说,数据库房要比数据库更庞大德多。数据库房主要用于数据发掘和数据剖析,辅佐领导做决议计划;
差异主要总结为以下几点:
1.数据库只寄存在当时值,数据库房寄存前史值;
2.数据库内数据是动态改变的,只需有业务发作,数据就会被更新,而数据库房则是静态的前史数据,只能定时增加、改写;
3.数据库中的数据结构比较杂乱,有各种结构以合适业务处理体系的需求,而数据库房中的数据结构则相对简略;
4.数据库中数据拜访频率较高,但拜访量较少,而数据库房的拜访频率低但拜访量却很高;
5.数据库中数据的方针是面向业务处理人员的,为业务处理人员供给信息处理的支撑,而数据库房则是面向高层办理人员的,为其供给决议计划支撑;
6.数据库在拜访数据时要求呼应速度快,其呼应时刻一般在几秒内,而数据库房的呼应时刻则可长达数几小时
数据库与数据库房的实质不同是什么?
数据库与数据库房的实质不同如下:
1、逻辑层面/概念层面:数据库和数据库房其实是相同的或许及其类似的,都是经过某个数据库软件,根据某种数据模型来安排、办理数据。可是,数据库一般更重视业务买卖处理(OLTP),而数据库房更重视数据剖析层面(OLAP),由此发作的数据库模型上也会有很大的差异。
2、数据库一般寻求买卖的速度,买卖完整性,数据的一致性等,在数据库模型上主要遵照范式模型(1NF,2NF,3NF等),然后尽可能削减数据冗余,确保引证完整性;而数据库房着重数据剖析的功率,杂乱查询的速度,数据之间的相关性剖析,所以在数据库模型上,数据库房喜爱运用多维模型,然后进步数据剖析的功率。
3、产品完成层面:数据库和数据库房软件是有些不同的,数据库一般运用行式存储,如SAP ASE,Oracle, Microsoft SQL Server,而数据库房倾向运用列式存储,如SAP IQ,SAP HANA。

colbeh restaurant nyc

传统数据库和数据库房的差异
简而言之,数据库是面向业务的规划,数据库房是面向主题规划的。
数据库一般存储在线买卖数据,数据库房存储的一般是前史数据。
数据库规划是尽量防止冗余,一般选用契合范式的规矩来规划,数据库房在规划是有意引进冗余,选用反范式的方法来规划。
数据库是为捕获数据而规划,数据库房是为剖析数据而规划,它的两个底子的元素是维表和现实表。维是看问题的视点,比方时刻,部分,维表放的便是这些东西的界说,现实表里放着要查询的数据,一起有维的ID。
单从概念上讲,有些不流畅。任何技能都是为使用服务的,结合使用能够很简略地了解。以银行业务为例。数据库是业务体系的数据渠道,客户在银行做的每笔买卖都会写入数据库,被记录下来,这儿,能够简略地了解为用数据库记帐。数据库房是剖析体系的数据渠道,它从业务体系获取数据,并做汇总、加工,为决议计划者供给决议计划的根据。比方,某银行某分行一个月发作多少买卖,该分行当时存款余额是多少。假如存款又多,消费买卖又多,那么该区域就有必要建立ATM了。
明显,银行的买卖量是巨大的,一般以百万乃至千万次来核算。业务体系是实时的,这就要求时效性,客户存一笔钱需求几十秒是无法忍受的,这就要求数据库只能存储很短一段时刻的数据。而剖析体系是过后的,它要供给重视时刻段内一切的有用数据。这些数据是海量的,汇总核算起来也要慢一些,可是,只需能够供给有用的剖析数据就到达意图了。
数据库房,是在数据库现已许多存在的情况下,为了进一步发掘数据资源、为了决议计划需求而发作的,它决不是所谓的“大型数据库”。那么,数据库房与传统数据库比较,有哪些不同呢?让咱们先看看W.H.Inmon关于数据库房的界说:面向主题的、集成的、与时刻相关且不可修正的数据调集。
“面向主题的”:传统数据库主要是为使用程序进行数据处理,未必依照同一主题存储数据;数据库房侧重于数据剖析作业,是依照主题存储的。这一点,类似于传统农贸商场与超市的差异—商场里边,白菜、萝卜、香菜会在一个货摊上,假如它们是一个小贩卖的;而超市里,白菜、萝卜、香菜则各自一块。也便是说,商场里的菜(数据)是依照小贩(使用程序)归堆(存储)的,超市里边则是依照菜的类型(同主题)归堆的。
“与时刻相关”:数据库保存信息的时分,并不着重必定有时刻信息。数据库房则不同,出于决议计划的需求,数据库房中的数据都要标明时刻特点。决议计划中,时刻特点很重要。相同都是累计购买过九车产品的顾客,一位是最近三个月购买九车,一位是最近一年从未买过,这关于决议计划者含义是不同的。
“不可修正”:数据库房中的数据并不是最新的,而是来源于其它数据源。数据库房反映的是前史信息,并不是许多数据库处理的那种日常业务数据(有的数据库例如电信计费数据库乃至处理实时信息)。因而,数据库房中的数据是很少或底子不修正的;当然,向数据库房增加数据是答应的。
数据库房的呈现,并不是要替代数据库。现在,大部分数据库房仍是用联系数据库办理体系来办理的。能够说,数据库、数据库房相得益彰、各有千秋。
弥补一下,数据库房的计划建造的意图,是为前端查询和剖析作为基础,因为有较大的冗余,所以需求的存储也较大。为了更好地为前端使用服务,数据库房必须有如下几点长处,否则是失利的数据库房计划。
1.功率满足高。客户要求的剖析数据一般分为日、周、月、季、年等,能够看出,日为周期的数据要求的功率最高,要求24小时乃至12小时内,客户能看到昨日的数据剖析。因为有的企业每日的数据量很大,规划欠好的数据库房常常会出问题,推迟1-3日才干给出数据,明显不可的。
2.数据质量。客户要看各种信息,肯定要精确的数据,但因为数据库房流程至少分为3步,2次ETL,杂乱的架构会更多层次,那么因为数据源有脏数据或许代码不谨慎,都能够导致数据失真,客户看到过错的信息就可能导致剖析出过错的决议计划,形成丢失,而不是效益。
3.扩展性。之所以有的大型数据库房体系架构规划杂乱,是因为考虑到了未来3-5年的扩展性,这样的话,客户不必太快花钱去重建数据库房体系,就能很安稳运转。主要体现在数据建模的合理性,数据库房计划中多出一些中间层,使海量数据流有满足的缓冲,不至于数据量大许多,就运转不起来了。
同级分类