data = pd.read_csv('1.csv',encoding='gb2312')
time = data["时间"]
print(type(time[0])) #查看时间数据的格式类型
print(time)
2.str转datetime
数据虽然为str类型,但是有一定的模板格式——"年-月-日-小时:分钟:秒.毫秒",format格式见后文解释。
data['date'] = pd.to_datetime(data['时间'], format='%Y-%m-%d-%H:%M:%S.%f', errors='coerce') #转换
print(WS['date'].head()) #查看
3.提取datetime格式中的年月日小时分钟秒
year = data['date'].dt.year # 提取年
month = data['date'].dt.month # 提取月
day = data['date'].dt.day # 提取天
hour = data['date'].dt.hour #提取小时
minute = data['date'].dt.minute #提取分钟
second = data['date'].dt.second #提取秒
4.将提取的数据插入到原dataframe,位置位于前几列,并进行查看。
data.insert(loc=0, column='second', value=second)
data.insert(loc=0, column='minute', value=minute)
data.insert(loc=0, column='hour', value=hour)
data.insert(loc=0, column='day', value=day)
data.insert(loc=0, column='month', value=month)
data.insert(loc=0, column='year', value=year)
print(data.iloc[:,:7].head())
5.format格式详细解释。
%y | 两位数的年份表示 |
%Y | 四位数的年份表示 |
%m | 月份 |
%d | 月内中的一天 |
%H | 24小时制小时数 |
%I | 12小时制小时数 |
%M | 分钟数 |
%S | 秒 |
%f | 毫秒 |
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)