一:python基础数据分析打怪升级进度:day03
(一):python优势
数据分析领域中python开发者最多python语言简洁、有大量第三方库(二):Python IDE推荐
PycharmVisual Studio Code(三):基础语法
1-1:简单输入打印语句
dream = input("你的梦想是什么?")print(dream)
1-2:条件判断语句
level = int(input("输入你的篮球水平:"))if level == 1: print("超级高水平!")else: print("青年队球霸!")
1-3:for循环和while循环
# 求1加到100的和sum = 0for i in range(1,101): sum = sum + i print(sum)
sum = 0i = 1while i<=100: sum = sum+i i = i + 1print(sum)
1-4:列表、元组、集合、字典
# 列表 *** 作增删改查a = []# 添加一个元素'夜斗小神社'a.append('夜斗小神社')# 打印a列表的长度print(len(a))# 插入一个元素a.insert(1, 'CSDN')print(a)# d出一个元素a.pop()print(a)
# 元组(一旦初始化就不能改)a = ('夜斗小神社', 'CSDN')print(a)
# 集合a = set(['夜斗小神社', 'CSDN'])a.add('财富自由')print(a)a.remove('CSDN')print(a)
# 字典a = {'夜斗小神社':"CSDN"} # 定义一个字典print(a)a['打卡学习'] = 'day03' # 添加一个元素print(a)a.pop('夜斗小神社') # 删除一个元素print(a)result = a.get('打卡学习') # 获取元素print(('夜斗小神社' in a)) # 夜斗小神社是否在a里面
1-5:函数
def function(): print("进入函数内部")# 调用函数print("开始调用函数")function()
二:Numpy基础(一):Numpy底层数据结构好
Numpy数组存储存储在一个均匀连续的内存块中Numpy利用cpu矢量化计算,高效快速Numpy矩阵计算可以采取多线程方式(二):基础语法
2-1:创建ndarray数组对象
import numpy as np # 导入模块命名为npa = np.array([['!', '@', '$'],['a','b','c']]) # 创建ndarray数组print(a)print(a.shape) # 打印形状
2-2:dtype定义结构
#Coding:utf8import numpy as np # 导入模块命名为npstruct_type = np.dtype({'names':['CSDN','level','start'], # 定义字段 'formats':['S32','i', 'i']}) # formats数据类型a = np.array([('YEDOU','4','1005')], dtype=struct_type) # ndarray数组print(a)
2-3:常用函数
#Coding:utf8import numpy as np # 导入模块命名为np# 1:连续数组的创建s1 = np.arange(1, 12) # 左闭右开print(s1)s2 = np.linspace(1, 11,11) # start stop 元素个数print(s2)s3 = np.arange(1, 13).reshape(3, 4)print(s3)# 2:常见计算print(np.add(s1,s2)) # 加print(np.subtract(s1,s2)) # 减print(np.multiply(s1,s2)) # 乘print(np.divIDe(s1,s2)) # 除print(np.power(s1,s2)) # n次方print(np.remainder(s1,s2)) # 取余数# 3:聚合函数print(np.amin(s3)) # 全部元素最小值print(np.amin(s3,0)) # 沿着axis=0最小值 从列看 4列print(np.amin(s3,1)) # axis=1最小值 从行看 3行print(np.ptp(s3)) # 最大值与最小值之差print(np.ptp(s3,0)) # axis=0print(np.ptp(s3,1)) # axis=1print(np.percentile(s3, 50)) # 百分位数print(np.percentile(s3, 50, axis=0)) print(np.percentile(s3, 50, axis=1))print(np.median(s3)) # 求中位数print(np.mean(s3)) # 求平均数print(np.average(s3)) # 加权平均数print(np.std(s3)) # 标准差print(np.var(s3)) # 方差# 4: 排序print(np.sort(s3))
三:Pandas基础(一):SerIEs结构
3-1:创建定长的字典序列
#Coding:utf8import pandas as pd# 1:data为列表x1 = pd.SerIEs([1, 2, 3, 4])# 2:data为列表,创建index索引x2 = pd.SerIEs(data=[1,2,3,4],index=['a','b','c','d'])print(x1)print(x2)# 3:data为字典d = {'a':1, 'b':2,'c':3}x3 = pd.SerIEs(d)print(x3)
(二):DataFrame结构
3-2:创建DataFrame
#Coding:utf8import pandas as pddata = {'Chinese': [1,2,3,4],'English':[5,6,7,8]}# 默认索引indexdf1 = pd.DataFrame(data)print(df1)# 添加索引indexdf2 = pd.DataFrame(data, index=['ZF', 'GY', 'LB', 'DC'])print(df2)
(三):常见的函数 *** 作
3-3:数据导入和导出
import pandas as pd# 导入excel文件s1 = pd.read_excel('./你的文件名.xlsx')# 导出为excel表s2 = pd.DataFrame(s1)s2.to_excel('./文件名.xlsx')
3-4:数据清洗利器
# 1:删除不必要的行和列df = pd.DataFrame()df.drop(columns=['你要删掉的列名'])df.drop(index=['你要删掉的行名'])
# 2:重命名列名df = pd.DataFramedf.rename(columns={'更换前':'更换后'})
# 3:去掉重复的行df = pd.DataFramedf = df.drop_duplicates()
# 4:更改数据格式df = pd.DataFramedf['列名'].astype('数据类型')
# 5:删除数据间的空格df = pd.DataFramedf['列名'] = df['列名'].map(str.strip())
# 6:大小写转换df = pd.DataFrame# 大写df.columns = df.columns.str.upper()# 小写df.columns = df.columns.str.lower()# 首字母大写df.columns = df.columns.str.Title()
# 7:查找空缺值df = pd.DataFramedf.isnull.any()
# 8:apply函数数据处理df = pd.DataFrame# 将列名大写df['列名'] = df['列名'].apply(str.upper())
(三):统计函数 *** 作
describe()函数df = pd.DataFrame# 描述函数信息df.describe()
merge()函数import pandas as pd# 合并两个表df1 = pd.DataFrame()df2 = pd.DataFrame()df3 = pd.merge(df1, df2, on='基于哪个列名进行连接')# how: inner内连接 left左连接 right右连接 outer外连接 df4 = pd.merge(df1, df2, how='合并方式')
在这个星球上,你很重要,请珍惜你的珍贵! ~~~夜斗小神社 总结 以上是内存溢出为你收集整理的【如何3秒钟看出一个人的python实力|Python 数据分析打怪升级之路 day03】:最简介Python基础、Numpy基础、pandas基础 看完后仍然心有余悸全部内容,希望文章能够帮你解决【如何3秒钟看出一个人的python实力|Python 数据分析打怪升级之路 day03】:最简介Python基础、Numpy基础、pandas基础 看完后仍然心有余悸所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)