SEP拥有比NIS更强大的功能,比如程序控制,硬件设备控制,等等,这些都是NIS没有的。
而且SEP是可以通过SEPM服务器更新的,而不需要所有的SEP联入Internet,只需要SEPM联入Internet即可,这样更方便企业内部的网络权限管理。
最主要的是,SEP拥有SEPM,也就是SEP的管理端,通过这个,可以集约管理下面所有的SEP管理端。比NIS更适合批量部署。
总的来说,就是SEP适合大量部署的企业用户,而NIS只能适用于个人用户。1、导入excel表格数据
Excel有两种格式,分别为xls和xlsx格式,两种都可以用python的Pandas模块的read_excel方法导入。read_excel方法返回的结果是DataFrame,DataFrame的一列对应着Excel的一列
read_excel方法参数介绍:
(1)sheet_name参数:该参数用于指定导入Excel中的哪一个sheet,如果不填写这个参数,则默认导入第一个sheet
(2)index_col参数:该参数用于指定表格的哪一列作为DataFrame的行索引。从0开始计数
(3)nrows参数:该参数可以控制导入的行数,该参数在导入文件体积较大时比较有用
(4)skipfooter参数:该参数可以在导入数据时,跳过表格底部的若干行
(5)header参数:当使用Pandas的read_excel方法导入Excel文件时,默认表格的第一行为字段名。如果表格的第一行不是字段名。则需要使用该参数设置字段名
(6)usecols参数:该参数可以控制导入Excel表格中的哪些列
(7)names参数:该参数可以对导入数据的列名进行重命名
import pandas as pd# 导入pandas模块并将其缩写
df=pdread_excel("C:/Users/kzk/Desktop/背景介绍xlsx")#使用该方法导入数据
df
登录后复制
括号里为本地表格地址,可以通过查看属性进行获取,注意地址的分隔符时反斜杠
df1=pdread_excel("C:/Users/kzk/Desktop/背景介绍xlsx",index_col=0)
df1
#取消行索引
登录后复制
df2=pdread_excel("C:/Users/kzk/Desktop/背景介绍xlsx",nrows=5)
df2
#导入前五行
登录后复制
df3=pdread_excel("C:/Users/kzk/Desktop/背景介绍xlsx",header=None)
df3
#取消表格第一行为默认表头,以0123···为表头
登录后复制
df4=pdread_excel("C:/Users/kzk/Desktop/背景介绍xlsx",header=None,name=['A','B','C','D','E'])
df4
#取消表格第一行为默认表头,以ABCDE为表头
登录后复制
df5=pdread_excel("",header=None,names={'A','B','C','D','E'},usecols=[1,3])
df5
#索引为1和3,也就是第二列和第四列
登录后复制
2、导入CSV格式数据
read_csv方法中的sep参数表示要导入的csv文件的分隔符,默认是半角逗号。encoding参数用来指定CSV文件的编码,常用的有utf-8h和gbk
import pandas as pd
df1=pdread_csv("",sep=",",encoding="gbk")
df1
登录后复制
df2=pdread_csv("",sep=",",encoding="gbk",nrows=3)
df2
#只导入前三行
登录后复制
df4=pdread_csv("",sep=",",encoding="gbk",names=["ID","fruit","amount"])
df4
登录后复制
3、导入JSON数据
JSON数据是一种轻量级的数据交换格式,容易阅读,也容易被机器扫描,在互联网应用中很常见,有时候从后台系统中导出来的数据就是JSON格式
JSON文件实际上存储的是一个JSON对象或者一个JSON数组,JSON对象是由多个键值对组成的,类似python的字典,JSON数组由多个JSON对象组成,类似列表
import pandas as pd
json=pdread_json("路径")
json
登录后复制
4、导入txt格式数据
使用read_table方法,参数和用法与read_csv类似
import pandas as pd
df1=pdread_table("路径")
df1
登录后复制
5、导入(爬取)网络数据
在数据分析中,除了可以导入文件和数据库中的数据,还有一类非常重要的数据就是网络数据,网络中每天都会产生大量数据,这些数据具有实时性,种类丰富的特点,因此对于数据分析而言是十分重要的一类数据来源
关键技术:爬取网络表格类数据,pandsa库read_html()方法
read_html()方法用于导入带有table标签的网页表格数据,使用该方法前,首先要确定网页表格数据是否为table标签。右击网页中的表格查看元素
确定后才可以使用read_html的方法
常用参数说明如下
io:字符串,文件路径,也可以是URL连接,网址不接受>许可证是在控制台添加的,客户端没有添加的位置,客户端也用不着添加,sep121的许可证作用是为了控制台也就是服务器端能统一管理客户端,统一下发策略和升级病毒库,客户端本身作为单机版来用的话没有任何限制,可以从互联网升级。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)