对数据库系统的疑问。比如银行atm,我要取钱,得连接数据库吧,但是不同用户的信息是放在同一个数据库

对数据库系统的疑问。比如银行atm,我要取钱,得连接数据库吧,但是不同用户的信息是放在同一个数据库,第1张

连接数据库的密码和用户的密码是不同的,前者是数据库的密码,后者只是ATM取款系统的个人密码。

连接数据库的密码,用户是不可能知道的,这个密码是保存在ATM机系统里面的。

用户的密码,与数据库的连接无关,只是用来验证你的身份的。

用户去取钱,ATM机先通过ATM机里面的密码连接到银行数据库系统(当然有可能是一直连接点的,具体的我就不知道),然后你输入密码,密码正确就通过了ATM的用户验证,可以取钱。

类比一个,例如QQ

我们登录QQ之前,QQ会先和QQ的服务器进行连接,这个密码是写在QQ程序里面的。

我们所输入的密码实际只是你的QQ的密码,这个密码只与你的QQ号是关联的,与QQ这个程序配套的。

什么是ATM

ATM,或者说异步传输模式,最初被设计用来为数字通讯传输宽带综合业务数字网,但也

提供了一种将所有数据传输集成到相同构架的途径。ATM支持:

广域网并不固定于特定的物理实现,它有灵活的速度,独立于它所传输的数据类型。

就像可改善的物理资源一样,可升级的数据传送构架的规定已成为可能。

决定于应用和使用的物理连接的不同为速率的链接。

使用同一普遍技术的广域和局域网的集成。

在商业领域,解释每一被发送的认证和票据的数据单元的能力。

对于终极用户担保的服务质量的规定。

ATM协议是基于标准的,与由ATM论坛实现的ATM标准同等。ATM论坛是‘一非盈利性的国

际组织,目的是通过协同性规定的快速汇聚来加速ATM产品和服务的使用。由许多涉及ATM论

坛的公司,包括摩托罗拉、微软、诺基亚、AT&T、Mitsubishi、Ericsson、Sun微系统等等。

在网页Http://www.atmforum.com/atmforum有成员的完整的列表。

ATM是一面向连接的技术,使用53字节的小的、固定的长度单元,允许网上的非常快速的

交换。一ATM网络,在数据能够在两节点之间传输之前,它们之间建立了一条虚拟路径。虚拟

路径,如图3所示,很像网上转换之间的管道。每一管道包含了一个或多个虚拟信道,每一

信道仅单向的传输一独立的数据流。例如,为建立一电话通话,一条虚拟路径需两条各是

64bps且反向的虚拟信道。每一虚拟信道有其自身的带宽和服务需求。

使用虚拟路径是因为ATM非常快,因此需要非常快的交换,而传统的路由器并不足够快速。

没有时间来把包读入缓冲区,检查它的目的地址,查查询表以找到发送包的下一个地址,然后

把包发送出去。ATM在数据传输开始之前将包按虚拟路径(VPI)和虚拟信道(VCI)编成独立

的号码。数据单元仅包含简短的VPI和VCI(总共28位),不是整个目的地址,并且当数据单元

还正在进入交换时VPI和VCI已被非常快的读和处理了,因此数据单元在交换本身花费很少的时

间。

使用虚拟路径和虚拟信道的另一优点是一旦建立,路径是固定的,除非设备问题;因此没

有数据单元混乱无序的风险。这是同步(时间依赖)通讯更易于处理。在路径建立期间,服务

质量也同时认定。这包括有带宽、传输时间、被传输的通信量的需要的抖动、允许ATM网络处理

通讯的不同类型和保证对于终极用户所期望的连接质量。

ATM和开放系统互连参考模型

ATM位于数据链路层内。ATM软件是由实现了一运输协议家族的的网络软件系统建立的,例

如TCP/IP,IPX/SPX。软件负责实现与网络处理相关的高层函数。许多函数通常与网络层相关,

例如,地址编码(addressing)、路由、中继都是由ATM层实现的。最终节点使用整个ATM模型,

同时交换仅使用物理和ATM层。

ATM信元结构

图4是一ATM信元的图表。与具有可变长度的局域网包相比,ATM的信元有固定的长度。每

一信元由53字节:前5个字节组成信头,剩下的48字节留给用户数据或附加的控制数据,例如

ATM适配层(AAL)服务。短的、固定长度的信元比长的、可变长度的信元会产生更短的延时和

更少的抖动(延时的偏差),使其更适应于声音和视频服务。信元的大小被固定,使得通过最

小化处理每一信元所需的总开销而使交换设计简单化。

信元也有可能丢失。转换器仅有很小的缓冲区并且如果在一个转换器中有一个信元空间,

缓冲区会很快溢出,信元会被丢弃。在数据链路层没有对用户数据的错误检查机制。检查毁坏

或丢失的信元是属于上层协议的任务。遗憾的是,上层协议检查包含好几个信元的帧,因此如

果服务的质量要求重发,即使仅有一个单信元丢失或毁坏整个帧都将被重发。

信头

有两种类型的信元头:用户节点接口(UNI)和网络节点接口(NNI)。这一图示在图5中

有详细的描述。用户节点接口建立呼叫和将应用程序连到网络上,网络节点接口处理两个分离

的能互相间通信的ATM网络。私人的网络节点接口对于接口不同厂家的ATM交换器是标准的。信

头的结构如下:

一般流量控制(GFC),4位

这个域仅被用在用户节点界面上。它被用来定义一简单的多路复用方案。

虚拟路径标识(VPI),8或12位

这个域在用户节点接口中是8位,网络节点接口中是12位。它被用来把虚拟信道分组到为了

路由的目的的路径上。

虚拟信道标识(VCI),16位

这个域在一个虚拟路径内标识一详细的信道。

净荷类型(PT),1位

这个域标识了用户数据域的信息类型。

信元丢失优先级(CLP),1位

这个域被用来决定当拥塞发生时什么信元最先被丢弃。

信头差错控制(HEC),8位

这个域包含了一错误监测和纠正的代码,被用来在信头纠正单个错误和检测双个错误。这

防止了信元被发送给错误的终端用户。

一个ATM信元的净荷可以使任何类型,只要它能被数字编码。发送机制独立预备发送的数

据的类型。电路本身并不需要知道信元中有些什么,只要明白从那里得到他们并将它们放到何

处。

服务质量

ATM网络定义了服务质量的参数,它们基于速度、准确性和被发送信元所要求的可靠性。有

不同的服务参数,因为不同类型的信息有不同的标准,例如在传送过程中某些数据可以容忍时

延却不允许信元的丢失,然而有些信息,例如实时的视频不能容忍迟延的信元却可接受一定量

的错误或丢失的信元。

在连接建立之前服务的质量被网络协商。一旦配置好,网络将保证给终端用户以确认的服

务质量。在建立一个ATM连接期间三个最重要的被协商的参数是:

峰值信元率(PCR)

这个参数决定了在信元穿过电路被发送的任何时刻的最小速率。如果速率增长的超过了峰

值信元率,信元很可能在途中搁置。

可维持信元率(SCR)

这个参数定义了信元有效通过一电路的持续平均速率。

n最小位率(MBR)

这个参数意味着为电路所保留的最小量的带宽。如果源址没有什么可发送给目的地址,空

的信元将会被发送以维持带宽。

参数被用来定义下列ATM类:

固定的位率(CBR)

这个类提供一持续的广播质量的视频和声音的数据通讯传输的异步位流。这能给予相当于

可比的专线的性能。它是一昂贵的选项,因即使线是空闲的也要在两点之间保证带宽。当没有

数据发送时,链接将以同样的速率发送空闲或空的信元,以便仍有效的使用带宽。

实时可变的位率(rt-VBR)和非实时的可变位率(nrt-VBR)

这些服务允许数据突发的被传输。电视会议即是一个使用实时可变位率的应用例子视频

信号中相当大的冗余度可使一帧的丢失并不明显的影响输出。实时可变位率比非实时可变位

率更集中于控制收发方的传输延时。

不确定位率(UBR)

互联网的访问使用不确定位率。这项服务并不指定传输延时,也不关心信元是否成功的

被接收。它将这些工作留给上层的协议来完成,如Internet协议(IP)。

有效位率(ABR)

在能使信元的传输速率变化上来说它与不确定位率相似,但它提供更好的服务质量的保证。

ATM适配层

ATM适配层(AAL)是把一特定的数据源转换成ATM通讯量的特定类型的服务,也就是说它

处理建立用户所要求的服务质量的机制。有四个被定义的类:

AAL1:与时间相关的固定位率数据

AAL2:与时间相关的可变位率数据

AAL3:具有时间独立性的可变位率数据

确保 *** 作错误恢复

非确保 *** 作留给上层处理的错误恢复,可选的流控制

AAL4:无连接的服务。

在AAL内有两层:

汇聚子层

这一层在用户数据的前后插入一头和尾,以定义所需的服务。

分段与重装子层

这一层接收从汇聚子层来的数据单元并将它们分成用于传输的片段。它加上了重装信息的

头。

交换

ATM中一关键的过程是以极高位率处理信元的交换设备。简单的交换机也必需能达到ATM所

要求的高速。小的、长度固定(53字节)信元可优化交换结构。ATM的面向连接的特性使得交

换模块需有预定义的路由表,此路由表可以最小化单交换路由的复杂性。一个ATM交换一般每

秒在每一交换端口处理几十万个信元。在最简单的交换设计中,有许多链接来发送和接收信元。

信元被交换所接收并根据交换内的路由表转发到相应的出口。

交换处理的核心如下:

信元在输入端被接收,它的信头被检查以决定发向的出口。

VPI/VCI域被改为正确的出口的值,并且计算HEC(信元头差错控制)的值。

在输出端信元被转发向它的目的地址。

在此处理期间,信元的顺序在交换中被保留。

有许多其他的任务交换节点也必须得做到:

HEC域必须在所有进入的信元中检查。如果发现错误,将丢弃信元以防止信元的错误路径

选择。当信元以新的VPI和VCI值发送时,HEC域必须重新计算并插入信元中。

在交换内必须有处理拥塞的机制。当拥塞发生时,经常采取丢弃信元的形式。

在交换内必须有一更新VPI/VCI路由表的控制机制。

必须有一 *** 作管理和维护(OA&M)系统,以利于组织结构的 *** 作,网络的控制和错误诊

断和报告。

必须有一收集帐表信息的系统。

交叉交换

交叉交换是由一种电路交换技术所实施的。输入端和输出端均连在大量的分离的平行数据

路径上。相对于输出路径输入路径在右边,形成一矩阵。在输入和输出路径的每一交汇处(交

叉点)有一开关。仅需简单的转向正确的开关,任一输入均能连向任一输出。每次只有一个输

入可以连上任一个输出,但(潜在的)单个的输出能被连在多个输出上。对于这种工作在ATM

网络下的交换类型,允许仅一个信元从输入端被传到输出端的连接需要很短的时间。

这种交换类型的优点是:

交换非常简单。

在交换内没有冲突,尽管当量个输入要求同样的输出端口时可能会产生阻塞。

缺点是:

要求的交叉点的数目是交换终端口数的平方。随着交换规模的增长,消耗会成指数增长。

连结输入与输出可通过一中间数据路径的集合,这样交换的规模能减小。这样的问题是阻

塞现在在交换内产生了,因为与输入输出端相比中间数据路径太少了。

交换被一中央逻辑函数所控制。随着交换规模的增大,对控制模块所要求的速率也在增

加。这会引起队列延时控制模块内的争用。

总线/底板型交换

在总线型交换中,外部链接通过一适配卡连到交换上。这个适配卡本身就是一小型的交换,

因为它有所有的交换和路由的功能。数据在总线上的适配卡之间传送。

总线型交换的优点是:

由于总线大的吞吐量,它的平行传输数据位是快速的。

这种交换类型的缺点是:

每次只有一个适配卡能传送数据,因此整个系统的吞吐量也就相当于总线的吞吐量了。

有一决定哪一适配卡能使用总线的仲裁的系统开销。

随着总线长度的增加,它会变得越来越慢且效率也越来越低。这就限制了总线上适配卡

的数量。

多级交换

串行逐级的交换的最简单的形式是‘Banyan’交换网络。它的概念非常简单:

交换矩阵中的每一方块代表一单个的交换模块,他们中的每一个都有两个输入端和两个

输出端。

交换模块通过串行(每次一位)链路连接起来。

尽管在实际的交换中输入端和输出端成对的形成全双工连接,输入和输出链接仍被认为

是分离的。

当一串位流(被交换的数据块)到达输入端时,交换模块使用接收到的第一个位决定它

的两个输出端的哪一个将被用来转发数据。用来决定路由的位被丢弃,剩下的部分被向前送

到下一级交换上,在那里也进行着同样的处理。在每一级交换中有最小的数据缓冲,导致了

终端之间的同步交换 *** 作。在信元的尾部被接收之前,它的头部已正从交换输出。

Banyan交换的优点是:Banyan交换简单、模块化、可扩充并且具有最小的时延;然而它

的缺点是如果两个经过交换的数据块在任何时候使用一条普通链接时(交换输出端),将会

发生冲突。通过在每一交换模块方缓冲数据即可解决这一问题,但会引起交换内的时延,增

加网络的传输延时。

PNNI协议

网际专用接口(PNNI)协议用来建立、保持和删除连接。ATM交换通过一适当的路由表将

VPI和VCI的输入转换成输出端的VPI/VCI对。ATM交换根据路由表的内容来就定它们的路由选

择。

PNNI层次结构

ATM网络中的交换是作为一些同位体组的层次结构来排列的。组中的每一交换都有一相同

的同位体组的标识,它在配置时即被赋值。同位体组中的每一交换都一相同的组的视图,它

存储在各自的拓扑数据库或路由表中。每一同位体组分配了一同位体组引导段,它在结构系

统中的下一层代表着同位组。在结构系统中的下一层次,同位组引导段被置成同位组。同位

组引导段给更高层次的同位组的其他成员以自己同位组的一个概要,并且它们为自己的同位

组过滤出其他组的概要的图片。这样,每一交换都由它自己的同位组的详细的拓扑视图和网

络上其余各组的概要的视图。交换就利用这个数据库和路由表在信元离开交换之前来更新它

的VPI和VCI的域值。

Hello协议

当一交换打开时,它会立即交换一个描述自身的‘hello’包给其相邻者。如果相邻者有

相同的同位组标识,那么它们就属于同一同位组并且他们互相之间拥有各自的拓扑信息,必要

的话即可省级它们的数据库,以便每一交换有同位组的相同的视图。这被称为扩散。如果它们

有不同的同位组标识,它们则是同位组之间的边界节点。

PNNI信令

信令协议被用来建立连接。这些协议交换能够使呼叫建立和控制的信息。这个复杂的路由

问题可被经由独立的同位组来划分成更小的问题。

局域网模拟

我们现在了解了ATM工作的基本原理。然而,ATM从头按装是很昂贵的,许多用户希望继续

使用它们的以太局域网,随着通讯量的增加再逐步过渡到ATM上来。ATM可以用在局域网上,有

一LAN模拟可以解决此问题。

局域网在无连接环境下工作,也就是说,用户发送了一头上有目的地址的包,包利用了它

所能找到的最好的路由到达目的地。包也能被标识为广播类型使所有节点都能收到。广播类型

的包被用来在网上发布。

相反的,ATM工作在面向连接的环境中,这也对于广播型的包提出了一个难题。在ATM中没

有发送单一信元到所有节点的机制,并且既然单一的ATM包括了局域网和广域网连接,广播的

消息将不知道到哪儿停止。为了解决这些问题能使ATM用于局域网环境中,便开发了ATM模拟。

在局域网环境中将有两种类型的用户那些安装有ATM卡且直接工作在ATM网络中的用户和那

些形成了已存在的以太网或令牌环网的通过路由器到ATM网上的用户。

如果有两个被ATM网络所连的以太网段,ATM被看作是广域链接,它能在每一终端经由一网

桥链接起来。网桥在它们之间建立了点到点的连接。网桥着重形成ATM信元,数据来自以太网

包,并且在另一终端处重组它们。在有两个以上被ATM网络所连的以太网段的情况下,同样原

理:一特定的网桥将和其他特定的网桥建立点到点的连接来传送数据。

如果ATM用户想要与以太网用户通讯,那就变得复杂了。首先,ATM机器需要知道怎样分割

以太网包成信元。其次,需要由某种机制将以太网地址翻译成能被ATM网络所理解的形式。第

三,需要有某种形式的双向广播的能力,因为更高层的协议希望在低层有一类以太网的网络。

为了解决这些问题,以下步骤将被采用:

在ATM机上运行LAN模拟客户端软件以处理分割和重组以太网包。

在ATM机上的高层网络协议假定它们是在一以太网之上的,尽管直接访问ATM是可以的。

以下服务将被执行:

LAN模拟服务器(LES):此服务处理虚拟信道以及在以太网地址和ATM地址之间解释的建立。

LAN模拟设置服务器(LECS):这项服务提供设置信息,如在哪儿找到LAN模拟服务器。

广播和无名服务器(BUS):此服务提供广播模拟。不管是来自以太网和ATM网之间的网桥还

是来自内部ATM机的广播包,都将被送至这个服务器。BUS而后将通过简单的初始化一连接和拷

贝包来重发广播包至所有的LAN模拟节点。BUS也能处理组播(用一有限的接收者子集来广播发

送包)和作为任何ATM地址还没有确定的包的接收者。

总结

ATM已经发展成为能够便利所有类型的或远或近的高速通讯。它旨在建立一简单的能够连接

局域和广域网的网络。开放系统互连参考模型的开发是为了能够使子网互连工作。它包含七个

层次,从物理连接器到网络应用软件。每一层都完成一不同的任务并且对其上层提供服务。

ATM是位于第二层数据链路层。

ATM使用电路交换技术来在终端之间发送小的、53字节的信元。信元并不包含完整的地址,

因为信元在发送之前路由被预先设置,虚拟路径也被建立。每一信元包含5字节的信头信息,包

括一虚拟路径和虚拟信道标识以及48字节的用户数据或其他控制数据。

当路由建立是服务质量也同时被确认,因此终端用户知道连接所能够提供的服务。当有声

音、食品、数据等的混合体在同一网络上时,服务质量就显得很重要了,因为每一通讯类型要

求网络一不同方式传输。服务质量定义了如峰值信元率、可维持信元率和最小位率的参数。服

务质量是由ATM适配层所建立的(AAL)。

ATM交换必须能够处理非常快的ATM位率。交换从进来的信元读如虚拟路径和虚拟信道表示,

并根据预先决定的路由把它们连到交换的正确的输出口。交换的类型包括交叉交换、底板型和

Banyan交换。PNNI协议被用来建立、维持和删除连接。为了能够使ATM与一已存在的LAN结构结

合起来,有一LAN模拟模型能使网络的ATM部分处理LAN类型的包和广播包。

未来需要更好、更快、更可靠的通讯。目前的网络不能处理日益增长的通讯量。对于服务

提供上来说,提供可靠的网络连接和服务质量将变得非常重要。ATM能够提高网络性能,也能保

证网络终端用户的服务。尽管还没有被普遍使用,ATM仍是下一代网络的具有潜力的解决方案。

(全文完)

--------------------------------------------------------------------------------

简而言之,数据库是面向事务的设计,数据仓库是面向主题设计的。

数据库一般存储在线交易数据,数据仓库存储的一般是历史数据。

数据库设计是尽量避免冗余,一般采用符合范式的规则来设计,数据仓库在设计是有意引入冗余,采用反范式的方式来设计。

数据库是为捕获数据而设计,数据仓库是为分析数据而设计,它的两个基本的元素是维表和事实表。维是看问题的角度,比如时间,部门,维表放的就是这些东西的定义,事实表里放着要查询的数据,同时有维的ID。

单从概念上讲,有些晦涩。任何技术都是为应用服务的,结合应用可以很容易地理解。以银行业务为例。数据库是事务系统的数据平台,客户在银行做的每笔交易都会写入数据库,被记录下来,这里,可以简单地理解为用数据库记帐。数据仓库是分析系统的数据平台,它从事务系统获取数据,并做汇总、加工,为决策者提供决策的依据。比如,某银行某分行一个月发生多少交易,该分行当前存款余额是多少。如果存款又多,消费交易又多,那么该地区就有必要设立ATM了。

显然,银行的交易量是巨大的,通常以百万甚至千万次来计算。事务系统是实时的,这就要求时效性,客户存一笔钱需要几十秒是无法忍受的,这就要求数据库只能存储很短一段时间的数据。而分析系统是事后的,它要提供关注时间段内所有的有效数据。这些数据是海量的,汇总计算起来也要慢一些,但是,只要能够提供有效的分析数据就达到目的了。

数据仓库,是在数据库已经大量存在的情况下,为了进一步挖掘数据资源、为了决策需要而产生的,它决不是所谓的“大型数据库”。那么,数据仓库与传统数据库比较,有哪些不同呢?让我们先看看W.H.Inmon关于数据仓库的定义:面向主题的、集成的、与时间相关且不可修改的数据集合。

“面向主题的”:传统数据库主要是为应用程序进行数据处理,未必按照同一主题存储数据数据仓库侧重于数据分析工作,是按照主题存储的。这一点,类似于传统农贸市场与超市的区别—市场里面,白菜、萝卜、香菜会在一个摊位上,如果它们是一个小贩卖的而超市里,白菜、萝卜、香菜则各自一块。也就是说,市场里的菜(数据)是按照小贩(应用程序)归堆(存储)的,超市里面则是按照菜的类型(同主题)归堆的。

“与时间相关”:数据库保存信息的时候,并不强调一定有时间信息。数据仓库则不同,出于决策的需要,数据仓库中的数据都要标明时间属性。决策中,时间属性很重要。同样都是累计购买过九车产品的顾客,一位是最近三个月购买九车,一位是最近一年从未买过,这对于决策者意义是不同的。

“不可修改”:数据仓库中的数据并不是最新的,而是来源于其它数据源。数据仓库反映的是历史信息,并不是很多数据库处理的那种日常事务数据(有的数据库例如电信计费数据库甚至处理实时信息)。因此,数据仓库中的数据是极少或根本不修改的当然,向数据仓库添加数据是允许的。

数据仓库的出现,并不是要取代数据库。目前,大部分数据仓库还是用关系数据库管理系统来管理的。可以说,数据库、数据仓库相辅相成、各有千秋。

补充一下,数据仓库的方案建设的目的,是为前端查询和分析作为基础,由于有较大的冗余,所以需要的存储也较大。为了更好地为前端应用服务,数据仓库必须有如下几点优点,否则是失败的数据仓库方案。

1.效率足够高。客户要求的分析数据一般分为日、周、月、季、年等,可以看出,日为周期的数据要求的效率最高,要求24小时甚至12小时内,客户能看到昨天的数据分析。由于有的企业每日的数据量很大,设计不好的数据仓库经常会出问题,延迟1-3日才能给出数据,显然不行的。

2.数据质量。客户要看各种信息,肯定要准确的数据,但由于数据仓库流程至少分为3步,2次ETL,复杂的架构会更多层次,那么由于数据源有脏数据或者代码不严谨,都可以导致数据失真,客户看到错误的信息就可能导致分析出错误的决策,造成损失,而不是效益。

3.扩展性。之所以有的大型数据仓库系统架构设计复杂,是因为考虑到了未来3-5年的扩展性,这样的话,客户不用太快花钱去重建数据仓库系统,就能很稳定运行。主要体现在数据建模的合理性,数据仓库方案中多出一些中间层,使海量数据流有足够的缓冲,不至于数据量大很多,就运行不起来了。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9631028.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-30
下一篇 2023-04-30

发表评论

登录后才能评论

评论列表(0条)

保存