自学计算机专业课程:
-----------------------
序号 国码 省码 新计划课程 学分 老计划课程
1 0001 4423 马克思主义哲学原理 3 哲学(0006) 一代三
2 0002 4424 DXP理论概论 3
3 0003 4425 法律基础与思想道德修养 2
4 0012 4405 英语(一) 7 英语(一)
5 0022 4403 高等数学(工专) 7 高等数学(工专)
6 2198 4402 线性代数 3 线性代数
7 2314 4420 模拟电路与数字电路 6 电子线路与数字逻辑
2315 模拟电路与数字电路(实践) 2
8 2316 4426 计算机应用技术 2 计算引论
2317 计算机应用技术(实践) 3
9 2321 4411 汇编语言程序设计 3 汇编语言程序设计
2322 汇编语言程序设计(实践) 1
10 0342 4412 高级语言程序设计 3 FORTRAN语言
0343 高级语言程序设计(实践) 1
11 2142 4413 数据结构导论 4 数据结构
12 2318 4409 计算机组成原理 4 计算机组成原理
13 2319 44121 微型计算机及接口技术 2 微型计算机及应用
2320 微型计算机及接口技术(实践) 2
14 2323 4414 *** 作系统概论 4 *** 作系统
15 2120 4415 数据库及应用 3 数据库概论
2121 数据库及应用(实践) 1
16 2141 4422 计算机网络技术 4 电工电子学或普通物理
计算机 *** 作技术或计算方法
17 4427 实践考核:综合实验(10)
首 页| 自考简介 | 考试机构 | 考试计划 | 考试动态 | 学习园地 | 政策查询 | 自考期刊 | 教材信息 | 社考专栏 | 下载中心 | 自考论坛
本 科 专 业
专 科 专 业
开考体制改革试点专业
命题动态 自学ks
国家学历文凭考试 非学历证书考试
全国计算机等级考试 全国英语等级考试
NIT考试 全国少儿计算机考试
“两学”考试 全国外语翻译证书考试
剑桥办公管理国际证书考试 剑桥少儿英语等级考试
剑桥英语五级证书考试 社会艺术水平考级
全国大学英语四、六级考试(CET) 中国市场营销资格证书考试
学习方法
考试技巧
样题选登
助学单位
有关政策与法规
自学ks暂行条例
自学ks有关规定
现行报考收费文件
福建省自学ks奖励基金会
助学文件查询
2005年《福建自学ks》
2004年《福建自学ks》
2003年《福建自学ks》
2002年《福建自学ks》
2001年《福建自学ks》
购买教材须知 自学ks教材
中英合作教材 全国公共英语等级考试(PETS)教材
全国计算机等级考试(NCRE)教材 全国计算机应用技术证书考试(NIT)教材
全国少儿计算机考试(少儿NIT)教材 两学教育考试教材
全国外语翻译证书考试(NAETI)教材 英语专业教材配套VCD、磁带
2004年《活页文丛》目录 教材相关新闻
全国计算机等级考试(NCRE) 全国英语等级考试(PETS)
全国计算机应用技术证书考试(NIT) 全国外语翻译证书考试(NAETI)
“两学”考试 剑桥办公管理国际证书考试
全国剑桥少儿英语等级考试 剑桥英语五级证书考试
社会艺术水平考级 全国少儿计算机考试
全国大学英语四、六级考试(CET) 中国市场营销资格证书考试
全国高等学校英语应用能力考试
相关文档
全省自考工作会暨表彰大会材料
考务考籍相关软件
自学ks基金会表格
你的位置:首页>>考试计划>>开考体制改革试点专业
计算机软件专业(本科)考试计划
--------------------------------------------------------------------------------
来源:福建自考办
2006-02-23
高等教育自学ks计算机软件专业(本科)考试计划
专业代码:080718(基础科段)、080719(本科段)
主考学校:福建农林大学
一.指导思想
高等教育自学ks是我国高等教育基本制度之一,是以高等教育学历考试为主的国家考试,是个人自学、社会助学、国家考试相结合的高等教育形式,是我国高等教育体系的重要组成部分。
高等教育自学ks计算机软件专业(本科)是为满足软件产业迅速发展需要而设置的;同时,根据高等教育自学ks的特点,具有较强的针对性和实用性,注重考核应考者对本专业的基本理论、基础知识和基本技能的掌握程度以及运用所学知识分析和解决问题的能力。
二.学历层次和规格
本专业分专科和本科两种学历,在总体上与全日制普通高校相近专业同等学历的水平相一致。
本专业考试计划为衔接式计划,整个计划分为基础科段和本科段两个既相对独立又互相衔接的阶段,依据不同层次考生采取不同的培养模式,形成多模式的应用型软件人才培养体系。凡通过本计划基础科段规定的15门课程考试,成绩合格,并通过相应课程的实践考核,累计达到80学分,思想品德经鉴定符合要求者,发给专科毕业z书。凡继续参加本计划本科段规定的12门课程考试,成绩合格,并通过相应课程的实践考核,完成毕业设计并合格,思想品德经鉴定符合要求者,发给本科毕业z书。
凡获得本科毕业z书,其学业水平达到了国家规定的学位标准,按照《中华人民共和国高等教育法》第二十二条和《中华人民共和国学位条例》的规定,由主考学校授予学士学位。
三.专业培养目标和基本要求
高等教育自学ks计算机软件专业(本科)培养德、智、体全面发展的,具有坚实的计算机实际应用技能与方法,具有良好的科学素质、创新精神、实践能力和国际竞争能力、适应国内外软件产业市场需求的国际型、通用型、实用型的软件高级专门人才。本专业要求应考者努力学习马克思列宁主义、毛泽东思想、邓小平理论,树立爱国主义、集体主义和社会主义思想,遵守法律、法规,具有良好的思想品德。要求掌握计算机科学方面的基本理论与方法,掌握计算机软件主流技术、软件开发方法与软件工程、软件项目工程组织与管理;有良好的外语运用技能。可以攻读计算机科学和相近学科的有关研究方向硕士学位。
四.考试课程与学分
(1)基础科段(C080718)
序号
课程代码
课程名称
学分
1
0001
马克思主义哲学原理
3
2
0002
邓小平理论概论
3
3
0003
法律基础与思想道德修养
2
4
0011
大学语文(本)
6
5
0023
高等数学(工本)
10
6
0015
英语(二)
14
7
2198
线性代数
3
8
2316
计算机应用技术
2
2317
计算机应用技术(实践)
3
9
0342
高级语言程序设计(一)
3
0343
高级语言程序设计(一)(实践)
1
10
7011
数字逻辑电路
5
7012
数字逻辑电路(实践)
2
11
2318
计算机组成原理
4
12
7013
算法与数据结构
4
7014
算法与数据结构(实践)
1
13
2326
*** 作系统
4
2327
*** 作系统(实践)
1
14
2336
数据库原理
4
2337
数据库原理(实践)
1
15
0896
电子商务概论
4
0897
电子商务概论(实践)
2
总学分
82
(2)本科段(C080719)
序号
课程代码
课程名称
学分
备注
1
0004
毛泽东思想概论
2
2
0005
马克思主义政治经济学原理
3
3
2197
概率论与数理统计(二)
3
4
7015
计算机专业英语
6
5
2324
离散数学
4
6
2339
计算机网络与通信
6
7
7016
编译原理
5
8
2333
软件工程
3
2334
软件工程(实践)
1
9
3142
互联网技术及应用
4
3143
互联网技术及应用(实践)
1
10
7017
面向网络编程技术
4
7018
面向网络编程技术(实践)
1
11
7019
分布式数据库
4
7020
分布式数据库(实践)
1
12
7021
软件能力成熟度模型(CMM)
4
过程考核
6998
毕业设计
不计学分
总学分
52
1
0023
高等数学(工本)
10
加
考
课
程
2
7013
算法与数据结构
4
7014
算法与数据结构(实践)
1
3
2326
*** 作系统
4
2327
*** 作系统(实践)
1
4
2318
计算机组成原理
4
5
2336
数据库原理
4
2337
数据库原理(实践)
1
说明:
1.序号后加“”号为全国统考课程。
2.年龄在40岁以上的考生可申请免考英语(二),但必须加考三门课程,其学分不少于14学分。三门课程为:工程经济(4学分)(课程代码2194)、网络 *** 作系统(5学分)(课程代码2335)、局域网技术与组网工程(5学分)(课程代码3141)。
3.为鼓励考生参加国际国内认证,凡获得SUN公司的JAVA认证可免考“面向网络编程技术”课程;凡获得Oracle公司的Oracle认证,可免考“分布式数据库”课程等。
4.报考本科段的条件
(1)学完本计划基础科段的考生可直接报考本专业本科段。
(2)计算机类各专业(非本专业基础科段)专科毕业生报考本专业须加考1一门课程
(3)电工电子信息类非计算机类各专业专科及专科以上学历层次的毕业生报考本专业,须加考1、2、3三门课程。
(4)理工类非电工电子信息类专业专科及专科以上学历层次的毕业生报考本专业,须加考1、2、3、4四门课程。
(5)非理工科类各专业专科及专科以上学历层次的毕业生报考本专业,须加考1、2、3、4、5五门课程。
五.课程说明和自学教材
1.马克思主义哲学原理(课程说明略)
自学教材:《马克思主义哲学原理》赵家祥编,经济科学出版社
2.邓小平理论概论(课程说明略)
自学教材:《邓小平理论概论》钱淦荣编,中国财政经济出版社
3.法律基础与思想道德修养(课程说明略)
自学教材:《法律基础与思想道德修养》,巩献田编,高等教育出版社
4.毛泽东思想概论(课程说明略)
自学教材:《毛泽东思想概论》罗正楷主编,武汉大学出版社
5.马克思主义政治经济学原理(课程说明略)
自学教材:《马克思主义政治经济学原理》卫兴华主编,武汉大学出版社
6.大学语文(本)
本课程为本专业的一门公共课,是为了提高自学应考者语言文化素养和公共文化基础知识而设置的公共课程。内容包括范文选读以及与之相关的语言知识和文学知识。
通过该课程的学习,旨在使应考者对一般文言文具有初步阅读能力,对一般说明、议论、记叙文章具有较强的理解、分析能力,对文学艺术作品具有初步分析、鉴赏能力。该课程的考核应注重知识的初步应用能力。
自学教材:《大学语文》徐中玉主编,华东师范大学出版社
7.英语(二)
本课程为本专业的一门公共课。本课程的目的是使应考者掌握4000个单词(含中学阶段1600个单词)、一定量的习语和系统的语法知识,具有较强的阅读能力和一定的英译汉能力以及初步的听、说、写和汉译英的能力,使其能以英语为工具,获取专业所需要的信息,并为进一步提高英语水平打下较好的基础。
应考者在学完本课程后,应能借助词典独立阅读与后期课文难度相当的一般性资料,并能译成汉语,理解基本正确,译文基本通顺。
自学教材:《大学英语自学教程》(上、下册)高远主编,高等教育出版社
8.高等数学(工本)
本课程为本专业的一门公共课。通过学习,要求应考者系统地获得一元函数的微积分学、多元函数微积分学(包括向量代数与空间解析几何)、常微分方程、级数的基本知识、理论和方法。要求应考者掌握各有关内容的基本概念、基本理论和基本方法,具有比较熟练地运用能力和分析能力、空间想象能力及抽象数学模型的初步能力,为学习后续课程和进一步扩大数学知识奠定必要的基础。
自学教材:《高等数学》(上、下册)陈庆乐主编,西安交通大学出版社
9.线性代数
本课程为本专业的一门公共课。其内容包括:行列式,矩阵及其运算,向量的线性相关矩阵,线性方程组、特征值问题与实二次型。
通过本课程的学习,使应考者掌握行列式的定义,性质;熟练运用矩阵的运算法则;熟练掌握线性方程组解的结构及其判别法则,掌握特征值的重要概念。
自学教材:《工程数学(线性代数)》魏战线主编,辽宁大学出版社
10.数字逻辑电路
本课程为本专业的一门主要专业基础课。内容包括:数字电子技术概述、逻辑代数、集成逻辑门、组合逻辑电路、时序逻辑电路、存储器、脉冲信号的产生和变换电路、数模和模数转换器、中小规模的逻辑电路设计。
通过本课程的学习,使应考者掌握一些数字逻辑电路基本理论、概念、方法及应用,具有中小规模逻辑电路设计初步能力。
自学教材:《数字集成电路基础》皇甫正贤编著,南京大学出版社
11.计算机应用技术
本课程为本专业的一门专业基础课。内容包括:计算机应用基础知识、DOS、WINDOWS *** 作系统简介、中文WINDOW95/98 *** 作系统的使用,汉字输入/输出方法综述、字处理软件WORD97与表格处理软件EXCEL97、网络初步知识。
通过本课程学习,使应考者具有微机应用、文字编辑表格生成的能力。
自学教材:《计算机应用技术》张宁主编,经济科学出版社
12.高级语言程序设计
本课程为本专业的主要一门专业基础课之一。内容包括:C语言程序结构、基本数据类型和运算、各类语句、构造数据类型(数组结构、联合、枚举)和应用,指针、函数、编译预处理、文件处理、C语言程序设计和调试。
通过本课程学习,使应考者掌握C语言及使用C语言编程的知识,具有用C语言描述、求解问题的基本能力。
自学教材:《高级语言程序设计》迟成文主编,经济科学出版社
13.计算机组成原理
本课程为本专业的主要一门专业基础课之一。内容包括:计算机系统的基本概念、运算组织、存储器组织、导址技术和指令系统、整机结构、控制器的设计、输入输出和接口等。
通过本课程学习,使应考者掌握计算机基本组成结构及各部件的工作原理和逻辑实现。
自学教材:《计算机组成原理》胡越明主编,经济科学出版社
14.算法与数据结构
本课程为本专业的一门专业基础课。课程内容有:算法与数据结构的基本概念,包括算法的时间、空间复杂性和抽象数据类型;基于序列的抽象数据类型表、栈、队列、串;反映层次关系的抽象数据类型树;在实际应用中常用的排序与选择算法;非线性结构图及图的算法;表示集合的抽象数据类型,包括字典、优先队列和并查集等。
通过本课程的学习,使应考者在掌握基础知识的同时,加深理解“算法”与“数据结构”的紧密关系,学会分析研究实际问题的特点,选择适当的数据结构和存储结构,设计有效的求解算法;通过实践训练,强化学生运用基本数据结构进行复杂程序设计的训练过程,提高利用计算机解决实际问题的实践技能。
自学教材:《数据结构用C语言描述》宁正元主编,水电出版社
15.数据库原理
本课程为本专业的一门专业基础课。本课程内容为:数据库概论、关系数据模型、关系运算理论、SQL语言、关系数据库的规范化,数据库设计的全过程、数据库的保护、数据库管理系统的结构,以及分布式数据库面向对象的数据库等数据库新技术的介绍。
通过本课程的学习,使应考者掌握数据库的基本原理和技术,能应用现有数据库管理系统,掌握数据库设计和数据库系统的开发方法。
自学教材:《数据库原理》丁宝康主编,经济科学出版社
16. *** 作系统
本课程为本专业的一门专业基础课。课程内容为: *** 作系统的典型算法和结构、作业管理、进程管理、存储管理、设备管理、文件管理、 *** 作系统结构设计以及UNIX *** 作系统介绍。
通过本课程的学习,使应考者掌握 *** 作系统的基本结构、设计原理及实现方法,了解它与硬件和其它系统软件的关系,能使用和分析常见的 *** 作系统。
自学教材:《 *** 作系统》谭耀明主编,中国人民大学出版社
17.概率论与数理统计
本课程为本专业的一门公共课。是研究随机现象统计规律的一门数学课。本课程概率论部分包括:随机事件及其概率、随机变量、多维随机变量和随机变量的数字特征等内容;数理统计部分包括抽样分布、参数估计、假设检验、方差分析、回归分析和正交试验设计等内容。
通过本课程的学习,要求应考者理解概率论的基本概念,熟悉随机事件及其概率的重要性质,熟悉随机变量的常用分布,并会进行相应的计算。掌握数理统计中有关参数估计和假设检验的方法,了解方差分析、回归分析和正交试验设计。
自学教材:《工程数学(概率论与数理统计)》范金城主编,辽宁大学出版社
18.离散数学
本课程为本专业的一门专业基础课。课程内容为:命题逻辑和一阶谓词逻辑的基本概念和基本演算;集合的概念和运算、二元关系和函数;代数运算和代数系统的基本性质、半群和群、队和域、格和布尔代数;图的基本概念、树、欧拉图和哈密顿图、平面图、图着色、赋权图、二部图等。
通过本课程的学习,使应考者有抽象思维和逻辑推理能力,掌握计算机科学技术常用的离散数学中的概念、性质和运算。
自学教材:《离散数学》左孝凌等编,上海科技出版社
19.计算机专业英语
本课程为专业的一门专业基础课。课程内容有:计算机专业词汇,包括一般的单词在计算机科学中的不同的意义,以及各种缩写词( *** 作系统、与计算机有关的组织、各种应用软件、计算机的各种部件等); *** 作过程中出现“出错信息”理解,以及对解决问题的解释;通过查阅字典完成对一些英语版应用软件中README、HELP文件的阅读、理解,从而解决在将来的日常应用中使用英语版应用软件的能力等。
通过本课程的学习,使应考者能熟练阅读计算机外文资料,熟练理解 *** 作过程中出现的“出错信息”,提高计算机软件编程能力。
自学教材:软件工程英语 Philip Lew 孙伟 清华大学出版社
20.互联网及其应用
本课程为本专业的一门应用性和实践性都很强的专业课。课程内容包括:Internet和Intranet的概念和基本原理、连接方式和接口、IP地址、上网步骤、网络服务、E-Mail、>
文 | 郭小贤
数据科学并没有一个独立的学科体系,统计学,机器学习,数据挖掘,数据库,分布式计算,云计算,信息可视化等技术或方法来对付数据。
但从狭义上来看,我认为数据科学就是解决三个问题:
1 datapre-processing;(数据预处理)
2 datainterpretation;(数据解读)
3datamodeling and analysis(数据建模与分析)
这也就是我们做数据工作的三个大步骤:
1、原始数据要经过一连串收集、提取、清洗、整理等等的预处理过程,才能形成高质量的数据;
2、我们想看看数据“长什么样”,有什么特点和规律;
3、按照自己的需要,比如要对数据贴标签分类,或者预测,或者想要从大量复杂的数据中提取有价值的且不易发现的信息,都要对数据建模,得到output。
这三个步骤未必严谨,每个大步骤下面可能依问题的不同也会有不同的小步骤,但按我这几年的经验来看,按照这个大思路走,数据一般不会做跑偏。
这样看来,数据科学其实就是门复合型的技术,既然是技术就从编程语言谈起吧,为了简练,只说说R和Python。但既然是荐数据科学方面的书,我这里就不提R/Python编程基础之类的书了,直接上跟数据科学相关的。
R programming
如果只是想初步了解一下R语言已经R在数据分析方面的应用,那不妨就看看这两本:
R inaction:我的R语言大数据101。其实对于一个没有任何编程基础的人来说,一开始就学这本书,学习曲线可能会比较陡峭。但如果配合上一些辅助材料,如官方发布的R basics(>
Dataanalysis and graphics using R:使用R语言做数据分析的入门书。这本书的特点也是紧贴实战,没有过多地讲解统计学理论,所以喜欢通过情境应用来学习的人应该会喜欢这本入门书。而且这本书可读性比较强,也就是说哪怕你手头没电脑写不了代码,有事没事拿出这本书翻一翻,也能读得进去。
但如果你先用R来从事实实在在的数据工作,那么上面两本恐怕不够,还需要这些:
Modernapplied statistics with S:这本书里统计学的理论就讲得比较多了,好处就是你可以用一本书既复习了统计学,又学了R语言。(S/Splus和R的关系就类似于Unix和Linux,所以用S教程学习R,一点问题都没有)
Datamanipulation with R:这本书实务性很强,它教给你怎么从不同格式的原始数据文件里读取、清洗、转换、整合成高质量的数据。当然和任何一本注重实战的书一样,本书也有丰富的真实数据或模拟数据供你练习。对于真正从事数据处理工作的人来说,这本书的内容非常重要,因为对于任何研究,一项熟练的数据预处理技能可以帮你节省大量的时间和精力。否则,你的研究总是要等待你的数据。
RGraphics Cookbook:想用R做可视化,就用这本书吧。150多个recipes,足以帮你应付绝大多数类型的数据。以我现在极业余的可视化 *** 作水平来看,R是最容易做出最漂亮的图表的工具了。
Anintroduction to statistical learning with application in R:这本书算是著名的the element of statistical learning的姊妹篇,后者更注重统计(机器)学习的模型和算法,而前者所涉及的模型和算法原没有后者全面或深入,但却是用R来学习和应用机器学习的很好的入口。
Ahandbook of statistical analysis using R:这本书内容同样非常扎实,很多统计学的学生就是用这本书来学习用R来进行统计建模的。
Python
Think Python,ThinkStats,Think Bayes:这是AllenB Downey写的著名的Think X series三大卷。其实是三本精致的小册子,如果想快速地掌握Python在统计方面的 *** 作,好好阅读这三本书,认真做习题,答案链接在书里有。这三本书学通了,就可以上手用Python进行基本的统计建模了。
PythonFor Data Analysis: 作者是pandas的主要开发者,也正是Pandas使Python能够像R一样拥有dataframe的功能,能够处理结构比较复杂的数据。这本书其实analysis讲得不多,说成数据处理应该更合适。掌握了这本书,处理各种糟心的数据就问题不大了。
Introductionto Python for Econometrics, Statistics and DataAnalysis:这本书第一章就告诉你要安装Numpy, Scipy, Matplotlib, Pandas, IPython等等。然后接下来的十好几章就是逐一介绍这几个库该怎么用。很全面,但读起来比较枯燥,可以用来当工具书。
PracticalData Analysis: 这本书挺奇葩,貌似很畅销,但作者把内容安排得东一榔头西一棒子,什么都讲一点,但一个都没讲透。这本书可以作为我们学习数据分析的一个索引,看到哪块内容有意思,就顺着它这个藤去摸更多的瓜。
PythonData Visualization Cookbook: 用Python做可视化的教材肯定不少,我看过的也就这一本,觉得还不错。其实这类书差别都不会很大,咬住一本啃下来就是王道。
Exploratory Data Analysis 和 Data Visualization
Exploratory DataAnalysis:John Tukey写于1977年的经典老教材,是这一领域的开山之作。如今EDA已经是统计学里的重要一支,但当时还是有很多人对他的工作不屑一顾。可他爱数据,坚信数据可以以一种出人意料的方式呈现出来。正是他的努力,让数据可视化成为一门无比迷人的技术。但这本书不推荐阅读了,内容略过时。要想完整地了解EDA,推荐下一本:
ExploratoryData Analysis with MATLAB:这本书虽然标题带了个MATLAB,但实际上内容几乎没怎么讲MATLAB,只是每讲一个方法的时候就列出对应的MATALB函数。这本书的重要之处在于,这是我读过的讲EDA最系统的一本书,除了对visualization有不输于John Tucky的讲解外,对于高维的数据集,通过怎样的方法才能让我们从中找到潜在的pattern,这本书也做了详尽的讲解。全书所以案例都有对应的MATALB代码,而且还提供了GUI(图形用户界面)。所以这本书学起来还是相当轻松愉悦的。
VisualizeThis:中译本叫“鲜活的数据”,作者是个“超级数据迷”,建立了一个叫>
Machine Learning & Data Mining
这一块就不多说了,不是因为它不重要,而是因为它太太太重要。所以这一部分就推两本书,都是”世界名著“,都比较难读,需要一点点地啃。这两本书拿下,基本就算是登堂入室了。其实作为机器学习的延伸和深化,概率图模型(PGM)和深度学习(deep learning)同样值得研究,特别是后者现在简直火得不得了。但PGM偏难,啃KDaphne那本大作实在太烧脑,也没必要,而且在数据领域的应用也不算很广。deep learning目前工业界的步子迈得比学术界的大,各个domain的应用如火如荼,但要有公认的好教材问世则还需时日,所以PGM和deep learning这两块就不荐书了。
TheElement of Statistical Learning:要学机器学习,如果让我只推荐一本书,我就推荐这本巨著。Hastie、Tibshirani、Friedman这三位大牛写书写得太用心了,大厦建得够高够大,结构也非常严谨,而且很有前瞻性,纳入了很多前沿的内容,而不仅仅是一部综述性的教材。(图表也做得非常漂亮,应该是用R语言的ggplot2做的。)这本书注重讲解模型和算法本身,所以需要具备比较扎实的数理基础,啃起这本书来才不会太吃力。事实上掌握模型和算法的原理非常重要。机器学习(统计学习)的库现在已经非常丰富,即使你没有完全搞懂某个模型或算法的原理和过程,只要会用那几个库,机器学习也能做得下去。但你会发现你把数据代进去,效果永远都不好。但是,当你透彻地理解了模型和算法本身,你再调用那几个库的时候,心情是完全不一样的,效果也不一样。
DataMining: Concepts and Techniques, by Jiawei Han and Micheline Kamber 数据挖掘的教材汗牛充栋,之所以推荐这本韩家炜爷爷的,是因为虽然他这本书的出发点是应用,但原理上的内容也一点没有落下,内容非常完整。而且紧跟时代,更新的很快,我看过的是第二版,就已经加进去了social network analysis这种当时的前沿内容。现在已经有第三版了,我还没看过,但应该也加入了不少新内容。其实这本书并不难读,只是篇幅较长,啃起来比较耗时。
其实这两本书里单拎出来一块内容可能又是几本书的节奏,比如bayesian方法,再拿出两三本书来讲也不为过,我个人用到的比较多,而且也确实有不少好书。但并非是所有data scientist都要用到,所以这一块就不再细说。
还有一些印象比较深刻的书:
Big DataGlossary: 主要讲解大数据处理技术及工具,内容涵盖了NoSQL,MapReduce,Storage,Servers,NLP库与工具包,机器学习工具包,数据可视化工具包,数据清洗,序列化指南等等。总之,是一本辞典式的大数据入门指导。
Mining ofMassive Datasets:这本书是斯坦福大学Web Mining的讲义,里面很多内容与韩家炜的Data Mining那本书重合,但这本书里详细地讲了MapReduce的设计原理,PageRank(Google创业时期的核心排序算法,现在也在不断优化更新)讲解得也比较详细。
DevelopingAnalytic Talent: 作者是个从事了十几年数据工作的geek,技术博客写得很有个人风格,写的内容都比较偏门,通常只有具备相关数据处理经验的人能体会出来,丝毫不照顾初学者的感受。比如他会谈到当数据流更新太快时该怎么办,或者MapReduce在什么时候不好用的问题,才不管你懂不懂相关基础原理。所以这本书不太适合初学者阅读。这本书其实是作者的博客文章的集结,用how to become a data scientist的逻辑把他近几年的博客文章串联了起来。
Past, Present and Future of Statistical Science:这本书是由COPSS(统计学社主席委员会,由国际各大统计学会的带头人组成)在50周年出版的一本纪念册,里面有50位统计学家每人分别贡献出的一两篇文章,有的回忆了自己当年如何走上统计学这条路,有的探讨了一些统计学的根本问题,有的谈了谈自己在从事的前沿研究,有的则给年轻一代写下了寄语。非常有爱的一本书。
其它资料
Harvard Data Science:这是H大的Data science在线课,我没有修过,但口碑很好。这门课需要费用8千刀左右,比起华盛顿大学的4千刀的Data science在线课虽贵一倍,但比斯坦福的14千刀要便宜将近一半(而且斯坦福的更偏计算机)。如果想自学,早有好心人分享了slides:(>
PyData:PyData是来自各个domain的用Python做数据的人每年举行一次的聚会,期间会有各路牛人举行一些规模不大的seminar或workshop,有好心人已经把video上传到github,有兴趣的去认领吧(DataTau/datascience-anthology-pydata · GitHub)
工具
R/Python/MATLAB(必备):如果是做数据分析和模型开发,以我的观察来看,使用这三种工具的最多。R生来就是一个统计学家开发的软件,所做的事也自然围绕统计学展开。MATLAB虽然算不上是个专业的数据分析工具,但因为很多人不是专业做数据的,做数据还是为了自己的domain expertise(特别是科学计算、信号处理等),而MATLAB又是个强大无比的Domain expertise工具,所以很多人也就顺带让MATLAB也承担了数据处理的工作,虽然它有时候显得效率不高。Python虽然不是做数据分析的专业软件,但作为一个面向对象的高级动态语言,其开源的生态使Python拥有无比丰富的库,Numpy, Scipy 实现了矩阵运算/科学计算,相当于实现了MATLAB的功能,Pandas又使Python能够像R一样处理dataframe,scikit-learn又实现了机器学习。
SQL(必备):虽然现在人们都说传统的关系型数据库如Oracle、MySQL越来越无法适应大数据的发展,但对于很多人来说,他们每天都有处理数据的需要,但可能一辈子都没机会接触TB级的数据。不管怎么说,不论是用关系型还是非关系型数据库,SQL语言是必须要掌握的技能,用什么数据库视具体情况而定。
MongoDB(可选):目前最受欢迎的非关系型数据库NoSQL之一,不少人认为MongoDB完全可以取代mySQL。确实MongoDB方便易用,扩展性强,Web20时代的必需品。
Hadoop/Spark/Storm(可选): MapReduce是当前最著名也是运用最广泛的分布式计算框架,由Google建立。Hadoop/Spark/storm都是基于MapReduce的框架建立起来的分布式计算系统,要说他们之间的区别就是,Hadoop用硬盘存储数据,Spark用内存存储数据,Storm只接受实时数据流而不存储数据。一言以蔽之,如果数据是离线的,如果数据比较复杂且对处理速度要求一般,就Hadoop,如果要速度,就Spark,如果数据是在线的实时的流数据,就Storm。
OpenRefine(可选):Google开发的一个易于 *** 作的数据清洗工具,可以实现一些基本的清洗功能。
Tableau(可选):一个可交互的数据可视化工具, *** 作简单,开箱即用。而且图表都设计得非常漂亮。专业版1999美刀,终身使用。媒体和公关方面用得比较多。
Gephi(可选):跟Tableau类似,都是那种可交互的可视化工具,不需要编程基础,生成的图表在美学和设计上也是花了心血的。更擅长复杂网络的可视化。
来自知乎
以上是小编为大家分享的关于怎样进行大数据的入门级学习?的相关内容,更多信息可以关注环球青藤分享更多干货
Create table T_course (
Course_id nvarchar(10),
Speciality_id nvarchar(10),
Course_Name nvarchar(20),
Mark int
)
Create table T_speciality(
Speciality_id nvarchar(10),
Speciality_Name nvarchar(20)
)
Create table T_enroll(
Id nvarchar(10),
Speciality_id nvarchar(10),
Name nvarchar(20)
)
(1) insert into T_course values ('004','001','关系数据库',3)
(2) select Course_Name from T_course a
join T_speciality b
on aSpeciality_id =bSpeciality_id
where bSpeciality_Name='软件技术'
(3) select Name from T_enroll c
join T_speciality b
on cSpeciality_id =bSpeciality_id
where bSpeciality_Name='软件技术'
(4) select Name from T_enroll c
join T_course a
on aSpeciality_id =cSpeciality_id
where aCourse_Name='关系数据库'
一下步骤以mysql数据库为例:
登录数据库
代码:mysql -u root -p
输入密码
创建数据库
代码:
create database test;
使用刚才创建的数据库
代码: use test;
创建一张表
代码:
create table user(id int not null,username varchar(100) not null,password varchar(100) not null,primary key(id));
向表里添加一条数据
insert into user(id,username,password) values(1,'zhang','123');
查询数据
代码:select from user;
至此,一套完整的流程就跑完了。
问题一:创建数据库的两种方法 交互式创建,就是你右击数据库然后选择新建数据库按钮就可以还有一种就是sql语句创建比如创建一个数据库名为a 的数据库,那么sql语句就是,create database a;然后执行下就可以
问题二:如何用MySQL建立数据库 这很简单啊!
在Windows下,假如你的MySQL装在 D:\MySQL
就可以这样:
先切换到它的bin目录
cd D:\MySQL\bin\
抚:\MySQL\bin>mysql -u root -p
接着输入你的root密码
接下来你就可以创建数据库、创建用户、创建修改表之类的 *** 作(常用命令如下)。
查看现有数据库
mysql> show databases;
创建数据库(假如数据库名为 mydb)
mysql> create database mydb;
删除数据库(假如数据库名为 mydb)
mysql> drop database accounts;
使用数据库(假如使用数据库 mydb)
mysql> use mydb;
执行完使用数据库命令后,就可以对该数据库进行创建、修改、插入、删除表等 *** 作,这些表的 *** 作命令你可以到网上找找,不是很难的。一个数据库就相当于一个 Excel 文件,而表则相当于Excel文件的单元格,数据就是存放在表中。
问题三:怎样建立一个简单数据库? 把excel导入数据库,不出现表格嵌套可以使用下面这个方法导入;
思路:
(1)、把excel数据读入到dataset中;
(2)、建立相应结构的数据表格
(3)、把dat畅set中的数据更新到数据表中
问题四:如何用数据库向导创建数据库 Microsoft Access 提供了三种方法来创建 Access 数据库 (Microsoft Access 数据库:数据和对象(如表、查询或窗体)组成的 ,与特定的主题或用途有关。)。
可以使用“数据库向导”来创建数据库。通过该向导可以从内置模板中进行选择,然后对其进行一定程度的自定义。随后,该向导会为数据库创建一组表、查询、窗体和报表,同时还会创建切换面板。表中不含任何数据。如果内置模板中的某个模板非常符合您的要求,请使用该方法。
使用“数据库向导”创建数据库
利用“数据库向导”,用一步 *** 作即可为所选数据库类型创建必需的表、窗体和报表。这是创建数据库的最简单方法。该向导提供了有限的选项来自定义数据库。
单击工具栏上的“新建”。
在“新建文件”任务窗格中,在“模板”下,单击“本机上的模板”。
在“数据库”选项卡上,单击要创建的数据库类型的图标,然后单击“确定”。
在“文件新建数据库”对话框中,指定数据库的名称和位置,然后单击“创建”。
按照“数据库向导”的指导进行 *** 作。
如果向导未启动
这可能是因为 Access 正运行于沙盒模式,但您的计算机上尚未安装 Microsoft Jet 40 SP8 或更高版本。启用沙盒模式后,必须安装有 Jet 40 SP8 或更高版本,Access 才能完全发挥作用。
有关安装 Jet 升级的详细信息,请参阅 Office Online 文章关于 Microsoft Jet 40 SP8 或更高版本。
有关沙盒模式的详细信息,请参阅 Office Online 文章关于 Microsoft Jet Expression Service 沙盒模式。
注释 不能使用“数据库向导”向已有的数据库中添加新的表、窗体或报表。
如果正在使用 Access 2003,可以在 中搜索 Access 模板。下载模板是创建数据库的最快方式。如果您找到了非常符合要求的模板,请使用该方法。模板是一个包含表、查询、窗体和报表的 Access 数据库文件 (mdb)。表中不含任何数据。打开数据库后,可以自定义数据库和对象。
使用模板创建数据库
这是创建数据库的最快方式。如果能找到并使用与您的要求非常接近的模板,则此方法效果最佳。
在工具栏上单击“新建”。
在“新建文件”任务窗格中,在“模板”下,搜索特定的模板,或单击“Office Online 模板”找到合适的模板。
找到需要的 Access 模板,然后单击“下载”。
如果要基于自己的设计创建数据库,请先创建一个空数据库,然后再分别添加表、窗体、报表及其他对象。这是最灵活的方法,但需要分别定义每一个数据库元素。
不使用“数据库向导”创建空数据库
单击工具栏上的“新建”。
在“新建文件”任务窗格中的“新建”下,单击“空数据库”。
在“文件新建数据库”对话框中,指定数据库的名称和位置,然后单击“创建”。
然后将出现“数据库”窗口 (数据库窗口:在打开 Access 数据库或 Access 项目时出现的窗口。它显示用于新建数据库对象和打开现有对象的快捷方式。),现在便可以在数据库中创建所需的对象 (数据库对象:Access 数据库包含诸如表、查询、窗体、报表、页、宏和模块等对象;Access 项目包含诸如窗体、报表、页、宏和模块等对象。)。>>
问题五:怎样在mysql中创建数据库 是这句:创建一个数据库MYSQLDATA
mysql> CREATE DATABASE MYSQLDATA;
基本 *** 作:MySQL中新建用户,新建数据库,用户授权,删除用户,修改密码的相关 *** 作测试环境:WIN32 mysql5045注:本 *** 作是在WIN命令提示符下,phpMyAdmin同样适用。
用户:phplamp 用户数据库:phplampDB1新建用户。登录MYSQL
@>mysql -u root -p
@>密码
创建用户
mysql> insert into mysqluser(Host,User,Password) values(localhost,phplamp,password(1234));
刷新系统权限表
mysql>flush privileges;
这样就创建了一个名为:phplamp 密码为:1234 的用户。然后登录一下。mysql>exit;
@>mysql -u phplamp -p
@>输入密码
mysql>登录成功2为用户授权。登录MYSQL(有ROOT权限)。我里我以ROOT身份登录
@>mysql -u root -p
@>密码
首先为用户创建一个数据库(phplampDB)
mysql>create database phplampDB;
授权phplamp用户拥有phplamp数据库的所有权限。
>grant all privileges on phplampDB to identified by '1234';
刷新系统权限表
mysql>flush privileges;
mysql>其它 *** 作/
如果想指定部分权限给一用户,可以这样来写:
mysql>grant select,update on phplampDB to identified by '1234';
刷新系统权限表。
mysql>flush privileges;
/3删除用户。@>mysql -u root -p
@>密码
mysql>DELETE FROM user WHERE User=phplamp and Host=localhost;
mysql>flush privileges;
删除用户的数据库
mysql>drop database phplampDB;4修改指定用户密码。@>mysql -u root -p
@>密码
mysql>update mysqluser set password=password('新密码') where User=phplamp and Host=localhost;
mysql>flush privileges;5列出所有数据库mysql>show database;6切换数据库mysql>use '数据库名';7列出所有表mysql>show t>>
问题六:怎么创建数据库连接 方法一、通过编写代码来连接数据库
1定义连接字符串。Data Source=服务器;Initial Catalog=数据库名;User ID=用户名;Pwd=密码 如:Data Source=IDEA-PC\SQLEXPRESS;Initial Catalog=student;User ID=sa;
2创建Connection对象。 SqlConnection sqlconnection1=new SqlConnection(constring);
constring为连接字符串。
3打开与数据库的链接。 Sqlconnection1Open();
4这时数据库就连接成功,可以 *** 作数据库了。
方法二、通过拖拽形式建立数据库连接
1打开视图-->服务器资源管理器。
2右键点就数据连接,选择添加连接。
3选择服务器名(先刷新一下)-->登陆到服务器身份验证形式-->选择一个数据库名-->测试链接-->确定(如果测试链接成功的话)。
4这是建立数据库连接就成功了,可以使用了。
问题七:sqlserver 下怎么建立数据库 怎么建表 方法/步骤
1
首先我们打开SQL SERVER自带的数据库管理工具,从开始菜单中可以找到,如图点击进去;
2
开始连接SQL SERVER服务器,就是我们装好的SQL SERVER 服务器;
3
右击数据库,选择第一个,新建一个数据库;
4
填写数据库的名称,下面是设置自动增长的,一般不用管,默认
5
点击确定后就可以生成一个数据库,此时里面是没有表的;
6
右击表新建一个表,填写你要的字段名称
7
填完字段名称后点击字段名称那个内部窗口的小叉叉,然后就提示你输入表名了,填写下表名,一个数据库的建立过程就是这样的;
或者
create database stuDB
on primary -- 默认就属于primary文件组,可省略
(
/--数据文件的具体描述--/
name='stuDB_data', -- 主数据文件的逻辑名称
filename='D:\stuDB_datamdf', -- 主数据文件的物理名称
size=5mb, --主数据文件的初始大小
maxsize=100mb, -- 主数据文件增长的最大值
filegrowth=15%--主数据文件的增长率
)
log on
(
/--日志文件的具体描述,各参数含义同上--/
name='stuDB_log',
filename='D:\stuDB_logldf',
size=2mb,
filegrowth=1mb
)
问题八:oracle数据库怎么创建新用户? 在CRT中进入oracle --连接sqlplus
按照下面写完代码直接复制进去回车就行了
---建立用户代码为:CREATE USER 用户名字 PROFILE DEFAULT IDENTIFIED BY 密码 DEFAULT TABLESPACE 指定表空间名字 TEMPORARY TABLESPACE 临时表空间 ACCOUNT UNLOCK;
---赋权
begin
EXECUTE IMMEDIATE 'GRA�T SELECT ANY DICTIONARY TO 用户名';
EXECUTE IMMEDIATE 'GRANT ALTER ANY TABLE TO 用户名';
EXECUTE IMMEDIATE 'GRANT ALTER SYSTEM TO 用户名';
EXECUTE IMMEDIATE 'GRANT ALTER ANY PROCEDURE TO 用户名';
EXECUTE IMMEDIATE 'GRANT CONNECT TO 用户名';
EXECUTE IMMEDIATE 'GRANT CREATE ANY PROCEDURE TO 用户名';
EXECUTE IMMEDIATE 'GRANT CREATE ANY TABLE TO 用户名';
EXECUTE IMMEDIATE 'GRANT CREATE ANY INDEX TO 用户名';
EXECUTE IMMEDIATE 'GRANT CREATE DATABASE LINK TO 用户名';
EXECUTE IMMEDIATE 'GRANT CREATE PUBLIC DATABASE LINK TO 用户名';
EXECUTE IMMEDIATE 'GRANT CREATE ANY VIEW TO 用户名';
EXECUTE IMMEDIATE 'GRANT CREATE PUBLIC SYNONYM TO 用户名';
EXECUTE IMMEDIATE 'GRANT CREATE TABLE TO 用户名';
EXECUTE IMMEDIATE 'GRANT DELETE ANY TABLE TO 用户名';
EXECUTE IMMEDIATE 'GRANT DROP PUBLIC DATABASE LINK TO 用户名';
EXECUTE IMMEDIATE 'GRANT DROP ANY TRIGGER TO 用户名';
EXECUTE IMMEDIATE 'GRANT DROP ANY INDEX TO 用户名';
EXECUTE IMMEDIATE 'GRANT DROP ANY PROCEDURE TO 用户名';
EXECUTE IMMEDIATE 'GRANT DROP ANY TABLE TO 用户名';
EXECUTE IMMEDIATE 'GRANT DROP ANY VIEW TO 用户名';
>>
问题九:如何创建数据库 1、通过向导建立和使用数据库
第一步:选择服务视图,然后展开DataBase(数据库节点),右键点击JavaDB
启动服务器
2、在右键单击JavaDB,选择创建数据库
3、在d出的对话框中填写相应的名称,写完后点击确定完成的数据的创建。
追问: 你好。你可以解释下你们的术语吗 ? 我不太懂、 我只能是略知一点。 谢谢、 我都想学。想给说些简单的吧、 回答: HTML(超文本标记语言):这是基础,简单好学,这是网页的基本架构,你首先应该学的就是这个,页面上有哪些东西都是由他来控制的,记住网页文档的结构与一些常用的标记就可以了比如说层的标记是<div></div>,表格的标记是<table></table>等,查看一个网页的html可以右击网页---查看源文件(当然其中还有可能包含css和javascript)。CSS(层又叠样式表):就是控制HTML上的标记的表现样式的,比如说你需要控制HTML的DIV标记的样式是宽200,高100,背景红色,就会用到这个。DIV+CSS(即用层和CSS来布局网页):没什么多说的,只要会CSS和知道HTML里的DIV就会了。javascript/vbscript(脚本语言):这两种脚本语言任选一个学习就可以了,现在javascript还是占大多数,学这个有什么用呢?如果是在客户端(即你的浏览器),可以实现很多效果,比如说下拉菜单的伸缩,不学这个也行,主要影响就是网页没有令人惊艳的效果。dom(文档对象模型):这个是脚本语言、html、CSS的结合体,也是非必需要学的。photoshop:用来做处理的,设计网页需要先在photoshop里做出来,然后切片,再用html布局到网页里。flash:用来做动画的,比如网页上的动画广告等。下面讲的这些东西就是网站程序这块的了,这是现在网站必不可少的一部分。一个网站信息量大,如果光靠上面美工那些东西,工作量大,不易维护。如果只会美工做出来的那些东西做出来的是静态网站、会下面这些做出来的就是动态网站了。ASP/PHP/JSP/ASPNET(编程语言):这是用来实现网页编程的一些语言,你可以任选一个,可以用来实现像用户注册、登录等的这些功能(这需要与下面所说的数据库结合)。MSSQL/MYSQL/ACCESS/ORACLE(数据库):任选一个,学会了其中一个,其他的几个就不用愁了。数据库就是存放数据的仓库,在网站上使用当然是存放网站上数据的一个仓库了,比如说用户登录注册,就涉及到将用户注册信息保存到数据库,登录时到数据库里去取,并比对他的密码是不是与注册时填写的一致,另外像网站里的文章,一个中型网站上有成千上万篇文章,如果单纯的用HTML那些去做,工作量可想而知,如果将所有文章放到数据库里,再通过上面的编程语言去生成,就会省去不少功夫。另外,如果你是刚高中毕业的话,建议你去报个培训班,要不然学起来会很慢,我也是自学,都摸了三四年了,还不算一个高手。 追问: 谢谢、在麻烦下。 你可以给我排序下,我学锝顺序呢? 你还可以给我推荐些书吗 ? 回答: 按照我写的顺序就可以了,由静态到动态的学习。至于书,也没什么好推荐的,网上下载的资料很多,也很杂,如果不想买书完全可以在网上下载。 追问: 恩、谢谢。 谢谢你这么耐心。 非常感谢、
以上就是关于我想自学计算机专业,请问网上哪里有这方面的资料或软件全部的内容,包括:我想自学计算机专业,请问网上哪里有这方面的资料或软件、怎样进行大数据的入门级学习、请用SQL命令创建上面的三张表. 并完成下面的 *** 作等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)