就题论题,还包括:
1 Python 数据库连接库,例如MySQL 连接库的应用,这决定你的数据从哪里来。这里面涉及到sql语法和数据库基本知识,是你在学习的时候必须一起学会的。
2 Python 做基本数据计算和预处理的库,包括numpy ,scipy,pandas 这三个用得最多。
3 数据分析和挖掘库,主要是sklearn,Statsmodels。前者是最广泛的机器学习库,后者是侧重于统计分析的库。(要知道统计分析大多时候和数据挖掘都错不能分开使用)
4 图形展示库。matpotlib,这是用的最多的了。
说完题主本身 要求,楼上几位说的对,你还需要一些关于数据挖掘算法的基本知识和认知,否则即使你调用相关库得到结果,很可能你都不知道怎么解读,如何优化,甚至在什么场景下还如何选择算法等。因此基本知识你得了解。主要包括:
1统计学相关,看看深入浅出数据分析和漫画统计学吧,虽然是入门的书籍,但很容易懂。
2数据挖掘相关,看看数据挖掘导论吧,这是讲算法本身得书。
剩下的就是去实践了。有项目就多参与下项目,看看真正的数据挖掘项目是怎么开展的,流程怎样等。没有项目可以去参加一些数据挖掘或机器学习方面的大赛,也是增加经验得好方法。
我只能说个大概:
1,数据库,当然是放数据的地方啦,这个数据是用来被调用的,如:你注册个会员啥的,你提交的信息需要处理吧,这个处理是需要程序处理的,先不管,你注册好了之后,你的个人信息就保存在数据库里啦。所以你才可以登录啦。这个登录就是调用你个人信息(数据)啦。
2,关于数据库大小,看过电子书吧,1M的电子书有多少字,几万字吧,有印象没?以我的速度,我可以看半个月(我看书很慢,但这也不少啦),的占用的空间就大些啦,小图几K、几十K,中图几百K,大图,上兆啦。鉴于你弄图文站,所以数据库稍微大点就行啦。具体多大,不好说,整个10G的吧,现在服务器也便宜。嘿嘿,参考,仅供参考。
3,这方面的知识,自己要多看。我也好多不会。
什么样的数据库都行。
因为实际上是根据不同的数据情况要因地制宜地变换数据挖掘的算法的。并不是因为数据挖掘算法而选择数据库。现实中业务数据库,乃至数据仓库往往都是海量数据沉淀先有了,才可以进行数据挖掘,而这时候是没法选择数据库或者数据仓库的。数据挖掘算法是因为有一定的挖掘目的而才产生的。而这个是有业务需要的。所以,
那种先建空数据仓库,一并在其上建立数据挖掘系统的,建成的差不多了导入业务数据的,到头来多数都会推翻原来建的数据挖掘,进行重建。因为原来一厢情愿建的数据挖掘玩意儿很多在导入数据之后会发现与实际的数据情况不符。这时候多数的项目都是重建数据挖掘那一套。但项目中很少会有人这么直白地对外承认,往往都不说。所以外人不知道底细以为多成功。其实先期建的就是废物一堆。
考试内容一、基础知识1计算机系统的组成和应用领域。2计算机软件的基础知识。3计算机网络的基础知识和应用知识。4信息安全的基本概念。二、数据结构与算法1数据结构、算法的基本概念。2线性表的定义、存储和运算。3树形结构的定义、存储和运算。4排序的基本概念和排序方法。5检索的基本概念和检索算法。三、 *** 作系统1 *** 作系统的基本概念、主要功能和分类。2进程、线程、进程间的通信的基本概念。3存储管理、文件管理、设备管理的主要技术。4典型 *** 作系统的应用。四、数据库系统的基本原理1数据库的基本概念,数据库系统的组成。2数据模型概念和主要的数据模型。3关系数据模型的基本概念,关系 *** 作和关系代数。4结构化查询语言SQL。5事务管理、并发控制、故障恢复的基本概念。五、数据库设计和数据库应用1关系数据库的规范化理论。2数据库设计的目标、内容和方法。3数据库应用开发工具。4数据库技术发展。六、上机 *** 作1掌握计算机基本 *** 作。2掌握C语言程序设计基本技术、编程和调试。3掌握与考试内容相关的知识的上机应用。其实三级数据库广度挺大,没什么深度,就算有几项知识不熟悉也没关系,但像C语言这样的基础知识应该打好一点,市场上的同类书都差不多,没什么特别的,你如果有时间可以买一本回来仔细看,我觉得只要真正仔细看了,肯定能过的(我以前就是没仔细看书,结果考的时候发现很多题目似曾相识,好后悔啊……),时间不是很多的话建议多做以前的题目,重复的几率很高,而且你想,总共就那么些个知识,又不能出太深,出不了什么新题的,考过的都知道,大差不离。
第一:计算机基础知识。计算机基础知识涉及到三大块内容,包括 *** 作系统、编程语言和计算机网络,其中 *** 作系统要重点学习一下Linux *** 作系统,编程语言可以选择Java或者Python。如果要从事大数据开发,应该重点关注一下Java语言,而如果要从事大数据分析,可以重点关注一下Python语言。计算机网络知识对于大数据从业者来说也比较重要,要了解基本的网络通信过程,涉及到网络通信层次结构和安全的相关内容。
第二:数据库知识。数据库知识是学习大数据相关技术的重要基础,大数据的技术体系有两大基础,一部分是分布式存储,另一部分是分布式计算,所以存储对于大数据技术体系有重要的意义。初学者可以从Sql语言开始学起,掌握关系型数据库知识对于学习大数据存储依然有比较重要的意义。另外,在大数据时代,关系型数据库依然有大量的应用场景。
第三:数学和统计学知识。从学科的角度来看,大数据涉及到三大学科基础,分别是数学、统计学和计算机,所以数学和统计学知识对于大数据从业者还是比较重要的。从大数据岗位的要求来看,大数据分析岗位(算法)对于数学和统计学知识的要求程度比较高,大数据开发和大数据运维则稍微差一些,所以对于数学基础比较薄弱的初学者来说,可以考虑向大数据开发和大数据运维方向发展。
数据库开发工程师需要学习的课程有:
1、计算机导论
内容提要:为新学生提供一个关于计算机科学与技术学科的入门介绍,使他们对该学科有一个整体的认识,并了解该专业的学生应具有的基本知识和技能以及在该领域工作应有的职业道德与应遵守的法律准则。
2、数字电路与数字逻辑
内容提要:介绍数字逻辑与数字系统的基本概念、分析方法和设计原理,包括开关理论基础、组合逻辑、时序逻辑、可编程逻辑器件、数字系统等。
3、计算机组成原理与汇编语言
内容提要:以冯诺依曼计算机模型为出发点,介绍计算机的组织结构和工作原理,剖析计算机的运算器、存储器、控制器和输入输出设备的结构、工作原理和相互关系;介绍80X86指令系统、汇编语言与汇编指令、汇编程序与汇编过程、简单汇编程序设计、汇编语言与高级语言的接口、宏汇编等。
4、计算机网络
内容提要:介绍数据通信的基本概念和计算机网络的基本原理,包括计算机网络的体系结构、数据通信的基本方法和协议、计算机网络的主要应用协议;同时介绍计算机网络系统的安全和管理知识,使学生对数据通信和计算机网络有一个全面理解。
5、计算机体系结构
内容提要:研究计算机系统结构的基本概念、基本原理、基本结构和基本分析方法,使同学在具有一定的软硬件知识基础上能综合认识计算机系统的软硬件功能分配与各种不同结构类型机器的特性和性能评价方法。为研究、开发、应用高级计算机系统打下基础。确立全面、系统的观点和学会定量分析问题的方法。
6、离散数学
内容提要:包括集合论、数理逻辑、图论、组合数学等内容,形式化的数学证明贯穿此课程。
7、高级程序设计语言
内容提要:分别以C、C#或JAVA为例,介绍程序设计和语言,程序的基本数据结构、类型定义、简单类型和结构化类型、程序的基本控制结构、结构化程序设计、面向对象的程序设计等。
8、算法分析与设计
内容提要:本课程延续数据结构课程的学习,从算法分析和设计的角度出发,除去传统的分类查找算法和一般的设计方法外,主要内容包括如下几个部分:算法研究的理论基础,递归分析技术,基本算法设计策略(几类经典算法学习),多项式运算与FFT,串匹配,概率分析算法。希望通过这一课程的学习,使学生能对现代的算法设计及分析的基本工具能有较全面的掌握。
9、数据结构
内容提要:介绍线性表及其链接存储结构与算法、数组与矩阵、堆栈与队列、广义表的存储结构与多元多项式表示、串与文本编辑、排序、树、图、文件结构。
10、数据库系统原理
内容提要:介绍数据库系统的基本概念、原理、方法及应用,主要包括数据库系统概论、数据库管理系统实现技术、数据库存储结构及其他类型的数据库系统。
11、编译技术
内容提要:介绍编译原理的理论和实践,包括编译程序设计、词法分析、语法分析、符号表、声明和存储管理、代码生成以及优化技术。
12、 *** 作系统
内容提要:介绍 *** 作系统的设计与实现,包括 *** 作系统各组成部分的概述、互斥性和同步性、处理器实现、调度算法、存储算法、设备管理和文件系统。
数据库开发工程师是指设计、开发、维护管理大型数据库的专业人才。
第一类是MySQL,以自由软件为主,以社团式开发为代表。版本选择40,侧重于在Linux平台(RedHat80)。MySQL数据库短小精悍,速度比较快,它是自由软件产品,现在美国国家航天局的数据库系统就是MySQL。在很多中小型的ICP有着广泛的应用。
第二类是SQLServer2000,中小型企业数据库,界面友好,可 *** 作性强,在数据库市场占有很大的份量,SQLServer2000是企业产品的代表,定位数据库中低端市场。
第三类是Oracle9i,中大型企业数据库,跨平台,在数据库中高市场占有很大的份量,Oracle9i介绍主要是Windows2000平台和Linux平台(RedHat80)。Oracle9i在金融、电信、银行有很多经典应用。
数据库开发需要学习数据结构与算法, *** 作系统程序,语言开发,数据库知识,基础知识,SQL语言数据流程,设置数据库系统的运行和管理。光写数据库开发还不行,还得要搭配一门开发语言,只有开发语言了,结合数据库开发才是一个合格的程序员。开发语言建议你学Java或者是PhP。
以上就是关于数据挖掘方向,Python中还需要学习哪些内容全部的内容,包括:数据挖掘方向,Python中还需要学习哪些内容、网站的数据库是用来做什么的一般的图文网站需要多大的数据库啊算法是怎样的呢拜托高手指教啦!、数据挖掘算法需要什么样的数据库等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)