数据湖:
1.数据存储能力
2.海量任意类型的数据
3.原始数据(业务数据的副本)
4.数据管理能力(元数据管理)
5.具备多样化的分析能力
6.具备数据生命周期管理能力
7.具备完善的数据获取和数据发布能力
综上,数据湖应该是一种不断演进中、可扩展的大数据存储、处理、分析的基础设施;以数据为导向,实现任意来源、任意速度、任意规模、任意类型数据的全量获取、全量存储、多模式处理与全生命周期管理;并通过与各类外部异构数据源的交互集成,支持各类企业级应用。
图1. 数据湖基本能力示意
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)