1、数据处理工具:Excel
数据分析师,在有些公司也会有数据产品经理、数据挖掘工程师等等。他们最初级最主要的工具就是Excel。有些公司也会涉及到像Visio,Xmind、PPT等设计图标数据分析方面的高级技巧。数据分析师是一个需要拥有较强综合能力的岗位,因此,在有些互联网公司仍然需要数据透视表演练、Vision跨职能流程图演练、Xmind项目计划导图演练、PPT高级动画技巧等。
2、数据库:MySQL
Excel如果能够玩的很转,能胜任一部分数据量不是很大的公司。但是基于Excel处理数据能力有限,如果想胜任中型的互联网公司中数据分析岗位还是比较困难。因此需要学会数据库技术,一般Mysql。你需要了解MySQL管理工具的使用以及数据库的基本 *** 作数据表的基本 *** 作、MySQL的数据类型和运算符、MySQL函数、查询语句、存储过程与函数、触发程序以及视图等。比较高阶的需要学习MySQL的备份和恢复熟悉完整的MySQL数据系统开发流程。
3、数据可视化:Tableau &Echarts
如果说前面2条是数据处理的技术,那么在如今“颜值为王”的现在,如何将数据展现得更好看,让别人更愿意看,这也是一个技术活。好比公司领导让你对某一个项目得研究成果做汇报,那么你不可能给他看单纯的数据一样,你需要让数据更直观,甚至更美观。
1.Trim(A1)
清除掉字符串前后空格。
MySQL有同名函数,Python有近似函数strip。
如果要清除所有空格,用substitute(A1,“ ”,“”)
2.Concatenate(A1,A2……)
合并单元格中的内容
或"我"&"很"&"好" = 我很好
MySQL有近似函数concat
3.Replace(指定字符串,哪个位置开始替换,替换几个字符,替换成什么)
MySQL中有同名函数,Python中有同名函数
4.Left/Right(指定字符串,截取长度)
Mid(指定字符串,开始位置,截取长度)
MySQL中有同名函数
5.Len/Lenb
返回字符串的长度,在len中,中文计算为一个,在lenb中,中文计算为两个。
MySQL中有同名函数,Python中有同名函数。
6.Find(要查找字符,指定字符串,第几个字符)
查找某字符串出现的位置,可以指定为第几次出现
MySQL中有近似函数 find_in_set,Python中有同名函数
7.Text
将数值转化为指定的文本格式
1.Lookup(查找的值,值所在的位置,返回相应位置的值)
2.Vlookup(查找的值,哪里找,找哪个位置的值,是否精准匹配)
3.Index(查找的区域,区域内第几行,区域内第几列)
和Match组合,功能强大
4.Match(查找指定的值,查找所在区域,查找方式的参数)
5.Row
返回单元格所在的行
Column
返回单元格所在的列
6.Offset(指定点,偏移多少行,偏移多少列,返回多少行,返回多少列)
if,and,or,is系列
MySQL中有同名函数,Python中有同名函数
1.Sum/Sumif/Sumifs、Count/Countif/Countifs、max、min
MySQL中有同名函数,Python中有同名函数
2.Sumproduct
统计总和相关
MySQL中有同名函数
3.Rank(A2,A2:A23)
排序,返回指定值在引用区域的排名,重复值同一排名。
SQL中有近似函数row_number() 。
4.Rand/Randbetween
常用随机抽样,前者返回0~1之间的随机值,后者可以指定范围。
MySQL中有同名函数。
5.Averagea
求平均值,也有Averageaif,Averageaifs
MySQL中有同名函数,python有近似函数mean。
6.Substotal(引用区域,参数)
汇总型函数,将平均值、计数、最大最小、相乘、标准差、求和、方差等参数化,换言之,只要会了这个函数,上面的都可以抛弃掉了。
7.Int/Round
取整函数,int向下取整,round按小数位取数。
round(3.1415,2) =3.14
round(3.1415,1)=3.1
1.Year、Month、Day、Date(年,月,日)、Now、Today
2.Weekday(指定时间,参数)
参数为1代表从星期日开始算作第一天
3.Datedif(开始日期,结束日期,参数)
日期计算函数,计算两日期的差。参数决定返回的是年还是月等。
MySQL中有近似函数 DateDiff。
4.同时显示日期和时间:自定义格式为yyyy-m-d AAAA
快捷键,格式转换(数值、文本、时间),数组,分列(SQL和Python中有类似的spilt ( )函数),合并单元格,数据透视表(聚合功能有一点类似SQL中的gorup by,python中则有更为强大的pandas.pivot_table( )),删除重复项(功能类似SQL中的distinct ,python中的set),单元格条件格式,冻结首行首列(在Python和R中,read_csv函数,会有一个专门的参数header=true,来判断是否读取表头作为columns的名字),自定义下拉菜单(数据有效性),查找公式错误,分组和分级显示,分析工具库,第三方应用
快速合并多列数据:把列拉宽-选取数据-填充-两端对齐
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)