数据开发中,从某种角度而言,主要是对数据的接、管、用。即数据接入,数据管理,数据应用。
在这里主要是先记录一下今天在查询资料时看到的一些理论。
在接入数据时,一般会对数据分为两层来接入。
一、源数据接入,不对数据进行任何方式的加工(以方便溯源,为数据溯源提供可能)
二、数据清洗加工后接入(提升数据质量)
在数据运营过程中,我们其实对于数据的管理会需要花费更多的精力。因为就当前的形势下,数据已被做为一种资产而存在。
在这里其实还有许多问题需要去思考,数据可溯源,对于数据安全有极大的好处,但是对于企业来说,他需要占用一定的资源,这些资源其实就是成本。这是一个需要取舍的业务场景。
在查阅许多资料的过程中,看到几乎所有的资料中都会提及到一个点,就是数据分层。然后想到了一点:在解决问题时,通常会对数据进行分类,一般而言,分类是指以某种类群所具有的共性来进行区分,所以我们在分类的时候其实就是在把事情本身所具有的特征进行抽象处理。
这个是在数据整体运营中所抽象出来的一个结论,其实分类这样的方法,我们一直都有在用的。尤其是在当前提倡理性决策的时代。在当前的大环境下去做实践,尤其是有计算机帮忙的情况下,很多时候,我们可以在很短的时间内做许多的模拟尝试。而且我们可以通过计算机来加速我们想要验证的事情发展,再通过一系列的指标设计等方式来验证结论。从而对整个过程进行评价及推广。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)