一、Excel
Excel使用人群众多是新手入门级数据分析工具,也是最基本的数据分析工具之一。Excel主要学习使用常用函数、快捷键 *** 作、基本图表制作、数据透视表等。Excel具有多种强大的功能,可以满足大多数数据分析工作的需要。而且Excel提供了相当友好的 *** 作界面,对于有基本统计理论的用户来说更容易上手。
二、SQL软件
SQL是一种数据库语言,它具有数据 *** 作和数据定义功能,交互性强,能给用户带来很大方便。SQL专注于Select、聚合函数和条件查询。关联库是目前应用较广的数据库管理系统,技术较为成熟。这类数据库包括mysql.SQLServer.Oracle.Sybase.DB2等等。
SQL作为一种 *** 作命令集,以其丰富的功能受到业界的广泛欢迎,成为提高数据库运行效率的保证。SQLServer数据库的应用可以有效提高数据请求和返回速度,有效处理复杂任务,是提高工作效率的关键。
三、Python软件
Python提供了能够简单有效地对对象进行编程的高级数据结构。Python语法和动态类型,以及解释性语言的本质,使它成为大多数平台上写脚本和快速开发应用的编程语言,并可用于可定制软件中的扩展程序语言。丰富的Python标准库提供了源代码或机器代码,适用于各种主要系统平台。Python有极其简单的解释文档,所以更容易上手。
四、BI工具
BI工具是商业智能(Busines Inteligence)分析工具的英文缩写。它是一个完整的大数据分析解决方案,可以有效地整合企业中现有的数据,快速准确地提供报表和帮助领导作出决策的数据依据,帮助企业做出明智的业务决策。BI工具是根据数据分析过程设计的。首先是数据处理,数据清理,然后是数据建模,最后是数据可视化,用图表识别问题,影响决策。
在思迈特软件Smartbi的例子中,Smartbi以工作流的形式为库表提取数据模型的语义,通过可视化工具来处理数据,使其成为具有语义一致性和完整性的数据模型;它也增强了自助式数据集建立数据模型的能力。该系统支持的数据预处理方法有:采样、分解、过滤与映射、列选择、空值处理、合并列、合并行、元数据编辑、线选择、重复值清除、排序等等。
它能通过表格填写实现数据采集和补录,并能对数据源进行预先整合和处理,通过简单的拖放产生各种可视图。同时,提供了丰富的图标组件,可实时显示相关信息,便于利益相关者对整个企业进行评估。
目前市场上的大数据分析软件很多,如何选择取决于企业自身的需求。因此,企业在购买数据分析软件之前,首先要了解企业数据分析的目的是什么。假如你是数据分析的新手,对需求了解不多,不妨多试试BI工具,BI工具在新手数据分析方面还是比较有优势的。
SAS(STATISTICALANALYSIS
SYSTEM)是由美国NORTH
CAROLINA州立大学1966年开发的统计分析软件。1976年SAS软件研究所(SAS
INSTITUTE
INC。)成立,开始进行SAS系统的维护、开发、销售和培训工作。期间经历了许多版本,并经过多年来的完善和发展,SAS系统在国际上已被誉为统计分析的标准软件,在各个领域得到广泛应用。
SAS
(Statistical
Analysis
System)是一个模块化、集成化的大型应用软件系统。它由数十个专用模块构成,功能包括数据访问、数据储存及管理、应用开发、图形处理、数据分析、报告编制、运筹学方法、计量经济学与预测等等。
SAS系统基本上可以分为四大部分:SAS数据库部分;SAS分析核心;SAS开发呈现工具;SAS对分布处理模式的支持极其数据仓库设计。
SAS系统主要完成以数据为中心的四大任务:数据访问;数据管理(sas
的数据管理功能并不很出色,而是数据分析能力强大所以常常用微软的产品管理数据,再导成sas数据格式.要注意与其他软件的配套使用);数据呈现;数据分析。当前(2007年)软件最高版本为SAS9.2
1.系统 *** 作功能:
供用户进行EPS数据平台的数据打开、保存、查询导出等功能。
1.1数据查询功能:
EPS数据平台可以实现对数据库指标的实时多维查询,指标模糊查询,指标维度转换以及对指标的各种选择功能,包括全选,全不选,选择层等。
用户查询时可以通过鼠标拖拽数据库的维来完成对数据库的多维检索,将需要查询的维度信息拖拽到行或列,可以任意组成需要的报表格式。
1.2结果保存功能:
用户每次查询的条件可以根据需要保存到系统中,以方便下次用户登录时进行查询。用户还可以在已有查询条件的基础上进行查询并保存结果。
1.3数据导出功能:
用户通过点击数据导出按钮,可以将查询到的数据、图表或地图导出到Excel,PDF格式文件。
2.数据模式功能:
供用户切换数据显示模式,可以将查询结果显示为表格、图表和数字地图三种数据显示模式。
2.1图表功能:
可以根据选取数据的类型按照需求选择不同的图形按钮,如饼图,柱图,折线图,面积图,雷达图等。还可以通过功能按钮设置添加标注,添加图例,显示图形坐标。
2.2数字地图功能:
数字地图以直观的形式展示分地区数据。用户点击工具栏地图按钮,可按地图模式查看数据。地图类型因所选择数据源而异,即数据为世界各国数据显示世界地图,数据为中国数据则显示中国地图。
3.数据分析预测功能:
EPS数据平台的预测分析系统是将各种分析和预测工具整合在一起的一个开放的平台,功能强大,而且 *** 作简单,容易掌握。作为开放的数据平台,不仅能为用户提供系统内嵌的强大的数据资源,而且能够为用户所需的预测分析提供高级经济预测。
3.1表格转置功能:
可以将数据表格中的行与列进行转置以满足不同用户对数据的需求。在表格视图中,用户可以点击按钮转换数据表的行列。
3.2数据筛选功能:
数据筛选功能主要用于对查询出来的数据按照一定条件进行过滤筛选,用户可以根据需要设定各种筛选条件包括等于、不等于、大于、小于、大于等于、小于等于、A和B之间、小于A或大于B,数据筛选的范围可由用户定义。用户既可以对整个数据表格进行筛选,也可以对表格中的一部分数据进行筛选。
3.3数据高亮显示:
系统可以根据用户设定高亮显示条件,将满足条件的数据高亮显示为红色。
3.4描述统计:
对于查询出来的表格数据可以对行列进行合并计算。计算方法包括求和、平均值、最大值、最小值、众数、中位数、方差、标准差、偏度、峰度、变异系数、平方和、一阶自相关、上十分位数、下十分位数、上四分位数、下四分位数等方法。
3.5数据80/20分析:
根据著名经济学家帕雷托(80/20)法则进行数据分析,用户通过选择一列的数据,系统则返回基于此列数据进行80-20分析的结果,即依降序排列此列数据,表格正常显示前80%结果,而后20%结果则以总和形式显示。
3.6数据预测功能:
用户点击按钮,系统进入高级预测分析页面,用户可以根据需要选择不同的统计方法展开分析预测。
预测模块主要是利用计量经济学的各种预测分析方法对数据库中的计算统计量进行单变量的预测分析。方法包括:线性回归、指数平滑、趋势分析、ARIMA、自相关分析、邹氏(Chow)检验、怀特(自异方差)检验、残差自相关GODFREY准则等高级数据分析方法。
l 对原始序列数据进行季节性处理,包括加法方程,乘法方程,设定季节处理多项式迭代次数。
l 对原始序列数据进行缺失值处理,包括删除该点,均值插补,N次均值插补,取上一时点值,线性插补,线性趋势插补等方法。
l 对预测结果设定置信度范围。
l 可以进行图形检验,图形检验中包括原始序列图形,模型模拟序列图形,预测期模型预测图形和置信范围,以及残差图形。
l 预测结果显示表格中,包括原始序列数据,模型拟和数据,模型预测数据,置信区间上下限数据。
l 预测结果可以保存为用户命名的文件,或者导出为EXCEL、MHT文件格式。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)