两者主要在是否会记录每一个修改、用途以及是否可以很快的还原客户记录等三方面存在区别。
一、是否会记录每一个修改
拉链表:拉链表根据拉链粒度的不同,实际上相当于快照,只不过做了优化,去除了一部分不变的记录而已。
流水表:流水表对于表的每一个修改都会记录,可以用于反映实际记录的变更。
二、用途
拉链表:拉链表常用于统计账户及客户的情况。
流水表:流水表常用于统计业务相关情况。
三、是否可以很快还原客户记录
拉链表:通过拉链表可以很方便的还原出拉链时点的客户记录。
流水表:流水表虽然也可能做得到,但是效率不行,或者需要人工参与。
扩展资料
拉链表是针对数据仓库设计中表存储数据的方式而定义的,顾名思义,所谓拉链,就是记录历史。记录一个事物从开始,一直到当前状态的所有变化的信息。
拉链表的作用:
1、数据量比较大。
2、表中的部分字段会被更新,比如用户的地址,银行利率,订单的状态等。
3、 需要查看某一个时间点或者时间段的历史快照信息,比如,查看利率在历史某一个时间点的状态。
4、变化的比例和频率不是很大,比如,总共有1000万的会员,每天新增和发生变化的有10万左右。
5、如果对这边表每天都保留一份全量,那么每次全量中会保存很多不变的信息,对存储是极大的浪费
拉链历史表,既能满足反应数据的历史状态,又可以最大程度的节省存储。
参考资料来源:百度百科-拉链表
一般来说,银行的数据都是结构化的、持久性存储的(非结构化的数据一般指电子影像,如客户办理业务的回单扫描图片等),以数据库以及文件方式存储为主。按照交易数据性质,我们可以分为“原始流水数据”和“加工后数据”两种。“原始流水数据”一般最开始生成于交易处理的应用程序(这些应用可以理解为前线部队)处理交易的过程,几乎记录了交易的所有内容:交易日期、交易时间、卡号、账号、地区号、网点号、地点、终端号、柜员编号、交易凭证(如Transaction Certification)、交易渠道等等等等乱七八糟你想得到想不到的字段。曾经见过一张表,多达数百个字段,一条记录长度多达数千字节。这类数据的特点是,信息全面,占用空间大。“加工后数据”产生于“原始流水数据”,一般情况下,“前线部队”会把“原始流水数据”提供给其他应用程序(可以理解为后勤部队),“后勤部队”会根据自身应用的需求将数据进行裁剪而不是照单全收。简单举个例子,假设用户拿到的xyk对账单是由一个叫做“客户账单”(Customer Statement,下面简称CS)的应用生成。CS会根据业界的标准从交易流水中获取仅需的数据,比如交易日期,商户名称、卡号、交易币种、交易金额等。其他并不需要的数据就会被舍弃,这样也就保证了数据存储的经济性。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)