数据挖掘是什么样的工作啊?和java编程有关系吗?跪求

数据挖掘是什么样的工作啊?和java编程有关系吗?跪求,第1张

两个工作内容联系不大,你是学习java的,我就主要介绍数据挖掘

数据挖掘是提取数据、建立模型分析数据、得出结果后与需求部门进行沟通的一个职业。

举个例子:银行的事业部有很多潜在的贷款申请者,事业部向数据挖掘人员提出需求,希望能够分析哪些申请者是优质放贷对象?

数据挖掘人员首先要充分理解事业部的需求,其次要从数据库提取相关数据,提取数据的工作有些时候是由DBA来完成,好了,现在你得到了历史数据,你的任务就是通过历史数据来建立模型,分析具备什么特征的申请者是有能力还贷、不拖欠的,然后用建立好的模型来预测我们刚刚得到的新的一批申请者。

再具体一点:例如,我们通过历史数据发现,年龄大于35岁,的男性,已婚,家庭人口大于3,收入在12000元以上的申请者是理想的放贷对象,那么我们用这个标准来限定新的申请者。

当然我举的例子,为了浅显易懂,是非常简单的示意例子,实际情况要复杂得多,会涉及到个人的贷款历史、信用评估、自然属性、社会属性、资产评估等情况——就是说,数据挖掘人员是要通过数据库中的海量数据,整理出哪些是有用数据,再用这些有用的数据来分析其它部门的问题,帮助他们解决问题,或者为公司的发展提供数据依据

数据挖掘的上升方向是:数据挖掘——产品层——决策层

java是属于开发,比如开发软件、接口、应用程序等,如果一个公司需要开发数据挖掘软件,那么则需要数据挖掘知识+java开发能力,只有在这种时候,才需要两个都具备

但是一般自主开发数据挖掘软件的公司很少,第一需要消耗大量人力物力,第二市场有很多现成的软件,没必要开发。

如果你想从事数据挖掘,你必须具备:

数据挖掘模型、算法的数学知识以及一些数据分析软件(SPSS、SAS、matlab、clementine)

一些数据库相关的知识(oracle、mySQL)

了解市场、其它部门需求

当然这些都是一点一滴积累起来的,没必要一蹴而就,特别是对市场、行业的了解以及对公司其它部门的需求的理解非常重要,这决定了你能否从基础的分析人员上升到产品层、决策层,都是要在实际的工作中积累起来的

至于放弃java什么的,我觉得真的不是放弃,因为你具备了java的基础,一定能派上用场,比如技术型产品经理(face book的扎克伯格和腾讯的马化腾都是技术型产品经理),这种产品经理能够清晰的把握产品的开发过程,还有市场知识。总结起来就是没有什么东西会浪费掉,你学的所有的东西都将在工作中派上用场,只是你遇到的情况不够多不够复杂而已

数据挖掘又译为资料探勘、数据采矿。是一种透过数理模式来分析企业内储存的大量资料,以找出不同的客户或市场划分,分析出消费者喜好和行为的方法,它是数据库知识发现中的一个步骤。

数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息的过程。主要有数据准备、规律寻找和规律表示3个步骤。数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。

真正从数据挖掘项目实践的角度讲,沟通能力对挖掘的兴趣爱好是最重要的,有了爱好才可以愿意钻研,有了不错的沟通能力,才可以正确理解业务问题,才能正确把业务问题转化成挖掘问题,才可以在相关不同专业人才之间清楚表达你的意图和想法,取得他们的理解和支持。所以我认为沟通能力和兴趣爱好是个人的数据挖掘的核心竞争力,是很难学到的;而其他的相关专业知识谁都可以学,算不上个人发展的核心竞争力。说到这里可能很多数据仓库专家、程序员、统计师等等都要扔砖头了,对不起,我没有别的意思,你们的专业对于数据挖掘都很重要,大家本来就是一个整体的,但是作为单独一个个体的人来说,精力有限,时间有限,不可能这些领域都能掌握,在这种情况下,选择最重要的核心,我想应该是数据挖掘技能和相关业务能力吧(从另外的一个极端的例子,我们可以看, 比如一个迷你型的挖掘项目,一个懂得市场营销和数据挖掘技能的人应该可以胜任。这其中他虽然不懂数据仓库,但是简单的Excel就足以胜任高达6万个样本的数据处理;他虽然不懂专业的展示展现技能,但是只要他自己看的懂就行了,这就无需什么展示展现;前面说过,统计技能是应该掌握的,这对一个人的迷你项目很重要;他虽然不懂编程,但是专业挖掘工具和挖掘技能足够让他 *** 练的;这样在迷你项目中,一个懂得挖掘技能和市场营销业务能力的人就可以圆满完成了,甚至在一个数据源中根据业务需求可以无穷无尽的挖掘不同的项目思路,试问就是这个迷你项目,单纯的一个数据仓库专家、单纯的一个程序员、单纯的一个展示展现技师、甚至单纯的一个挖掘技术专家,都是无法胜任的)。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/11182260.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-14
下一篇 2023-05-14

发表评论

登录后才能评论

评论列表(0条)

保存