1.外部数据库导入
外部数据库是一个重要的数据来源。尤其电商平台对这种数据来源渠道非常常用。用于 HDFS 和外部数据库中导入导出数据的工具比较常用的是 Sqoop。
2.日志文件
日志文件也是一个非常常用的数据来源。而用于自动化迁移日志文件到 HDFS 上的工具是 Flume。
3.前端埋点
前端埋点是指在前端系统中将用户的一些动作行为部分或者全部上传到后台以供分析使用的。用户在前端的某些 *** 作是不会被记录到传统日志中,更不会被保存到后台数据库中的。但这些动作行为往往又代表着用户的心理状态,对于分析用户行为与刻画用户画像而言还是非常有参考价值的。为了得到这些数据,就有了前端埋点的 *** 作。
4.爬虫
爬虫获取数据的方式通常只会出现在某些特定性质的企业里。
次级资料由于其种类繁多、数量巨大,对其分类的方式也有多种多样。从方便资料收集和企业的角度来看,一种最有效的方式是按其来源来分。根据次级资料的来源,可将其分为内部资料和外部资料。
1.内部次级资料
内部资料是指来自于我们正为之进行市场研究的企业或公司内部的资料。如果它们是以其它一些目的而收集的,就是内部次级资料。内部次级资料可分为会计帐目、销售记录和其他各类报告三部分。例如,销售记录、采购要求、财务报告、产品设计与技术资料、市场环境资料等。在正常的会计核算中所编制的销售与成本资料,是能为许多市场研究提供帮助的内部次级资料,尤其在评价过去的营销战略或评价本公司在同行业竞争中所处的地位方面更是如此。产品设计与技术信息等资料能为企业评价某一新产品或一次新的广告活动等,提供有用帮助。现在,内部资料的一个主要来源来自于那些包含着有关顾客、销售、供应商和其它公司想跟踪事项的数据库。所有企业的内部资料,都可为市场研究计划的设定提供指导与基础。
不仅如此,内部次级资料还有两个最突出的优点,那就是它的可获得性与低成本性。因此,我们必须注意充分利用内部次级资料。
2.外部次级资料
外部次级资料指的是从公司外部获得的次级资料。我们把外部次级资料分成三个来源;出版物、辛迪加和数据库。
(1)出版物
出版资料指的是那些可从图书馆或其它实体如贸易协会等获得的资料。出版资料有许许多多,正因为如此,市场营销研究人员要想使自己熟悉市场信息的来源,首先必须知道可从哪些公开出版物中能了解到。
(2)辛迪加数据
辛迪加数据指的是一种具有高度专业化,从一般数据库中所获得的外部次级资料。信息供应商把信息卖给多个信息需要者,这样使得每一个需要者获得信息的成本更为合理,这种例子包括:美国全国家庭观点盘努数据,尼尔森电视监听数据和Arbitron的广播听众关系研究结果。
辛迪加数据的一个优点就是可以分摊信息的成本。另一个优点就是信息需要者可以非常快地获得所需的信息,原因在于信息供应商总在不间断地收集有关的营销信息。
辛迪加数据的主要应用在于:测量消费者态度以及进行民意调查,确定不同的细分市场,进行长期的市场跟踪。
(3)数据库
数据库的指的是按照一定要求收集且具有内部相关性的数据的集合体。外部数据库指的是公司外部的组织所提供的简单的数据库。它们可以作为次级资料的来源。典型地,商业信息机构向信息需要者提供这些数据库并收取一定的费用。我们把外部数据库放在外部次级资料来源的第三类中是因为它不符合外部次级资料另两类中的任一类(出版资料或辛迪加)的定义。
党员转接的外部的数据库。外部库是公司外部的组织所提供的简单的数据库。它们可以作为次级资料的来源。典型地,商业信息机构向信息需要者提供这些数据库并收取一定的费用。数据库系统的一个重要特性是数据的独立性,用户对数据的任何 *** 纵都是通过向数据库管理系统发送请求实现的。党员转接外部库是党员转接的外部的数据库。欢迎分享,转载请注明来源:内存溢出
评论列表(0条)