背景:
我有很多很多的日志数据,每个日志里面都有日期字符串,我需要将其转换为datetime格式。
问题是,这些日志里的字符串格式五花八门,有2017-05-25T05:27:30313292255Z,有2016-07-01T00:00:00以及其他各种我还没有看到的格式。
开始我写了一长串的if else来判断格式,但是总有我漏掉的。
最后上网一查,发现dateutilparserparse。可以不用我们指定格式,直接将字符串转换为datetime格式。
注:我试了下"19/May/2017:04:10:06 +0000" 居然失败了- -!那可能这个函数只认识数字不认得字母吧。
你是用pyExcelerator还是xlrd读的excel如果是xlrd那它自带一个xldate_as_tuple函数,可以转成datetime,比如:
from datetime import datetime
from xlrd import xldate_as_tuple
d=datetime(xldate_as_tuple(x,0))#x就是你那串数字的变量
如果是用pyExcelerator,那好象它没有类似的函数,可以用下面这个函数:
def xldate_as_datetime(xldate, datemode=0):
if datemode not in (0, 1):
raise XLDateBadDatemode(datemode)
if xldate == 000:
return datetimetime(0, 0, 0)
if xldate < 000:
raise XLDateNegative(xldate)
xldays = int(xldate)
frac = xldate - xldays
seconds = int(round(frac 864000))
assert 0 <= seconds <= 86400
if seconds == 86400:
seconds = 0
xldays += 1
#if xldays >= _XLDAYS_TOO_LARGE[datemode]:
# raise XLDateTooLarge(xldate)
if xldays == 0:
# second = seconds % 60; minutes = seconds // 60
minutes, second = divmod(seconds, 60)
# minute = minutes % 60; hour = minutes // 60
hour, minute = divmod(minutes, 60)
return datetimetime(hour, minute, second)
if xldays < 61 and datemode == 0:
raise XLDateAmbiguous(xldate)
return (
datetimedatetimefromordinal(xldays + 693594 + 1462 datemode)
+ datetimetimedelta(seconds=seconds)
)
用法:
d=xldate_as_datetime(x)#x就是你那串数字的变量
可以通过设定格式来取年份、月份和日期
print selfbgdateGetValue()Format('%Y-%m-%d') 全格式日期
print selfbgdateGetValue()Format('%Y') 只取年份
Python 程序能用很多方式处理日期和时间,转换日期格式是一个常见的功能。
Python 提供了一个 time 和 calendar 模块可以用于格式化日期和时间。
时间间隔是以秒为单位的浮点小数。
每个时间戳都以自从1970年1月1日午夜(历元)经过了多长时间来表示。
Python 的 time 模块下有很多函数可以转换常见日期格式。如函数timetime()用于获取当前时间戳, 如下实例:
#!/usr/bin/python
# -- coding: UTF-8 --
import time; # 引入time模块
ticks = timetime()
print "当前时间戳为:", ticks
以上实例输出结果:
当前时间戳为: 145999455251
时间戳单位最适于做日期运算。但是1970年之前的日期就无法以此表示了。太遥远的日期也不行,UNIX和Windows只支持到2038年。
什么是时间元组?
很多Python函数用一个元组装起来的9组数字处理时间:
序号
字段
值
0 4位数年 2008
1 月 1 到 12
2 日 1到31
3 小时 0到23
4 分钟 0到59
5 秒 0到61 (60或61 是闰秒)
6 一周的第几日 0到6 (0是周一)
7 一年的第几日 1到366 (儒略历)
8 夏令时 -1, 0, 1, -1是决定是否为夏令时的旗帜
上述也就是struct_time元组。这种结构具有如下属性:
序号
属性
值
0 tm_year 2008
1 tm_mon 1 到 12
2 tm_mday 1 到 31
3 tm_hour 0 到 23
4 tm_min 0 到 59
5 tm_sec 0 到 61 (60或61 是闰秒)
6 tm_wday 0到6 (0是周一)
7 tm_yday 1 到 366(儒略历)
8 tm_isdst -1, 0, 1, -1是决定是否为夏令时的旗帜
获取当前时间
从返回浮点数的时间辍方式向时间元组转换,只要将浮点数传递给如localtime之类的函数。
#!/usr/bin/python
# -- coding: UTF-8 --
import time
localtime = timelocaltime(timetime())
print "本地时间为 :", localtime
以上实例输出结果:
本地时间为 : timestruct_time(tm_year=2016, tm_mon=4, tm_mday=7, tm_hour=10, tm_min=3, tm_sec=27, tm_wday=3, tm_yday=98, tm_isdst=0)
获取格式化的时间
你可以根据需求选取各种格式,但是最简单的获取可读的时间模式的函数是asctime():
#!/usr/bin/python
# -- coding: UTF-8 --
import time
localtime = timeasctime( timelocaltime(timetime()) )
print "本地时间为 :", localtime
以上实例输出结果:
本地时间为 : Thu Apr 7 10:05:21 2016
格式化日期
我们可以使用 time 模块的 strftime 方法来格式化日期,:
timestrftime(format[, t])
#!/usr/bin/python
# -- coding: UTF-8 --
import time
# 格式化成2016-03-20 11:45:39形式
print timestrftime("%Y-%m-%d %H:%M:%S", timelocaltime())
# 格式化成Sat Mar 28 22:24:24 2016形式
print timestrftime("%a %b %d %H:%M:%S %Y", timelocaltime())
# 将格式字符串转换为时间戳
a = "Sat Mar 28 22:24:24 2016"
print timemktime(timestrptime(a,"%a %b %d %H:%M:%S %Y"))
以上实例输出结果:
2016-04-07 10:25:09
Thu Apr 07 10:25:09 2016
14591750640
python中时间日期格式化符号:
%y 两位数的年份表示(00-99)
%Y 四位数的年份表示(000-9999)
%m 月份(01-12)
%d 月内中的一天(0-31)
%H 24小时制小时数(0-23)
%I 12小时制小时数(01-12)
%M 分钟数(00=59)
%S 秒(00-59)
%a 本地简化星期名称
%A 本地完整星期名称
%b 本地简化的月份名称
%B 本地完整的月份名称
%c 本地相应的日期表示和时间表示
%j 年内的一天(001-366)
%p 本地AM或PM的等价符
%U 一年中的星期数(00-53)星期天为星期的开始
%w 星期(0-6),星期天为星期的开始
%W 一年中的星期数(00-53)星期一为星期的开始
%x 本地相应的日期表示
%X 本地相应的时间表示
%Z 当前时区的名称
%% %号本身
获取某月日历
Calendar模块有很广泛的方法用来处理年历和月历,例如打印某月的月历:
#!/usr/bin/python
# -- coding: UTF-8 --
import calendar
cal = calendarmonth(2016, 1)
print "以下输出2016年1月份的日历:"
print cal;
以上实例输出结果:
以下输出2016年1月份的日历:
January 2016
Mo Tu We Th Fr Sa Su
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
Time 模块
Time 模块包含了以下内置函数,既有时间处理相的,也有转换时间格式的:
序号
函数及描述
1 timealtzone
返回格林威治西部的夏令时地区的偏移秒数。如果该地区在格林威治东部会返回负值(如西欧,包括英国)。对夏令时启用地区才能使用。
2 timeasctime([tupletime])
接受时间元组并返回一个可读的形式为"Tue Dec 11 18:07:14 2008"(2008年12月11日 周二18时07分14秒)的24个字符的字符串。
3 timeclock( )
用以浮点数计算的秒数返回当前的CPU时间。用来衡量不同程序的耗时,比timetime()更有用。
4 timectime([secs])
作用相当于asctime(localtime(secs)),未给参数相当于asctime()
5 timegmtime([secs])
接收时间辍(1970纪元后经过的浮点秒数)并返回格林威治天文时间下的时间元组t。注:ttm_isdst始终为0
6 timelocaltime([secs])
接收时间辍(1970纪元后经过的浮点秒数)并返回当地时间下的时间元组t(ttm_isdst可取0或1,取决于当地当时是不是夏令时)。
7 timemktime(tupletime)
接受时间元组并返回时间辍(1970纪元后经过的浮点秒数)。
8 timesleep(secs)
推迟调用线程的运行,secs指秒数。
9 timestrftime(fmt[,tupletime])
接收以时间元组,并返回以可读字符串表示的当地时间,格式由fmt决定。
10 timestrptime(str,fmt='%a %b %d %H:%M:%S %Y')
根据fmt的格式把一个时间字符串解析为时间元组。
11 timetime( )
返回当前时间的时间戳(1970纪元后经过的浮点秒数)。
12 timetzset()
根据环境变量TZ重新初始化时间相关设置。
Time模块包含了以下2个非常重要的属性:
序号
属性及描述
1 timetimezone
属性timetimezone是当地时区(未启动夏令时)距离格林威治的偏移秒数(>0,美洲;<=0大部分欧洲,亚洲,非洲)。
2 timetzname
属性timetzname包含一对根据情况的不同而不同的字符串,分别是带夏令时的本地时区名称,和不带的。
日历(Calendar)模块
此模块的函数都是日历相关的,例如打印某月的字符月历。
星期一是默认的每周第一天,星期天是默认的最后一天。更改设置需调用calendarsetfirstweekday()函数。模块包含了以下内置函数:
序号
函数及描述
1 calendarcalendar(year,w=2,l=1,c=6)
返回一个多行字符串格式的year年年历,3个月一行,间隔距离为c。 每日宽度间隔为w字符。每行长度为21 W+18+2 C。l是每星期行数。
2 calendarfirstweekday( )
返回当前每周起始日期的设置。默认情况下,首次载入caendar模块时返回0,即星期一。
3 calendarisleap(year)
是闰年返回True,否则为false。
4 calendarleapdays(y1,y2)
返回在Y1,Y2两年之间的闰年总数。
5 calendarmonth(year,month,w=2,l=1)
返回一个多行字符串格式的year年month月日历,两行标题,一周一行。每日宽度间隔为w字符。每行的长度为7 w+6。l是每星期的行数。
6 calendarmonthcalendar(year,month)
返回一个整数的单层嵌套列表。每个子列表装载代表一个星期的整数。Year年month月外的日期都设为0;范围内的日子都由该月第几日表示,从1开始。
7 calendarmonthrange(year,month)
返回两个整数。第一个是该月的星期几的日期码,第二个是该月的日期码。日从0(星期一)到6(星期日);月从1到12。
8 calendarprcal(year,w=2,l=1,c=6)
相当于 print calendarcalendar(year,w,l,c)
9 calendarprmonth(year,month,w=2,l=1)
相当于 print calendarcalendar(year,w,l,c)。
10 calendarsetfirstweekday(weekday)
设置每周的起始日期码。0(星期一)到6(星期日)。
11 calendartimegm(tupletime)
和timegmtime相反:接受一个时间元组形式,返回该时刻的时间辍(1970纪元后经过的浮点秒数)。
12 calendarweekday(year,month,day)
返回给定日期的日期码。0(星期一)到6(星期日)。月份为 1(一月) 到 12(12月)。
用Python实现字符串和日期相互转换的方法,具体如下:
这里用的分别是time和datetime函数来处理
import time,datetime//日期转化为字符串
# date to str
//输出时间
print timestrftime("%Y-%m-%d %X", timelocaltime())
#str to date
//字符串转化为日期
t = timestrptime("2016 - 12 - 05", "%Y - %m - %d")
y,m,d = t[0:3]
//输出时间
print datetimedatetime(y,m,d)
在Python中,日期和时间相关的函数和类被封装在datetime模块中。可以使用该模块中的函数和类来处理日期和时间相关的 *** 作。下面是一些常用的日期函数:
datetimedatetime(year, month, day, hour=0, minute=0, second=0, microsecond=0, tzinfo=None):创建一个datetime对象,表示指定的日期和时间。year、month和day参数是必需的,表示日期;hour、minute、second和microsecond参数是可选的,表示时间;tzinfo参数是可选的,表示时区信息。
datetimedate(year, month, day):创建一个date对象,表示指定的日期。year、month和day参数是必需的,表示日期。
datetimetime(hour=0, minute=0, second=0, microsecond=0, tzinfo=None):创建一个time对象,表示指定的时间。hour、minute、second和microsecond参数是可选的,表示时间;tzinfo参数是可选的,表示时区信息。
datetimedatetimenow(tz=None):返回一个datetime对象,表示当前日期和时间。tz参数是可选的,表示时区信息。
datetimedatetoday():返回一个date对象,表示当前日期。
这些函数可以用来创建、获取日期和时间对象,并进行各种日期和时间的 *** 作。例如,可以使用datetimedatetimenow()函数获取当前日期和时间,然后使用strftime()函数将其格式化为字符串输出。
#-- coding: utf-8 --
import os
#已知文件名的情况下,可以用这个函数
def getFileInfo(filepath):
info = {}
if ospathisfile(filepath):
info['TimeCreated'] = ospathgetctime(filepath)
info['TimeModified'] = ospathgetatime(filepath)
info['Size'] = ospathgetsize(filepath)
return info
# 如果只知道文件根目录,但是不知道具体的文件路径,
# 可以先用oslistdir获得文件和文件夹列表
#-------------------分界线----------------------
# 这是回答你的第二个问题。如何找到一个字符串中指定两个字符中间的字符串
# 这里用的是正则表达式
import re
special = "+$^[](){}|\/" #正则表达式中会出现的特殊字符
# 输入参数为原始字符,leftmark表示左边的分隔符号,rightmark表示右边的分隔符号
#函数返回在leftmark和rightmark中间的内容,可能匹配满足不止一次,没有找到就返回空
def matchpattern(str1,leftmark,rightmark):
lf,rt = leftmark,rightmark
#如果需要匹配的字符在正则表达式中时特殊字符,需要给予转义
if leftmark in special:
lf = '\%s'%leftmark
if rightmark in special:
rt = '\%s'%rightmark
pattern = recompile(r''+lf + '{0,}'+ rt)
matched = refindall(pattern,str1)
result = []
if matched:
#如果匹配成功了,就去头去尾,直接取中间的部分
for m in matched:
s = mreplace(leftmark, '')
s = sreplace(rightmark, '')
resultappend(s)
return result
else:
return None
if __name__ == '__main__':
print matchpattern("#abcsdfs%sdfsdf",'%','')
你可以利用
time
模块里的
strptime()和
strftime()。
strptime()根据你指定的格式控制字符串解读日期,
而
strftime()则根据你指定的格式控制字符串输出日期。
比如,把
“12-Jan-06
10:06”
格式转换成
“2006-01-12
10:06:00”
格式:
>>>
from
time
import
strptime,
strftime
>>>
>>>
myDate
=
'12-Jan-06
10:06'
>>>
parsed
=
strptime(
myDate,
'%d-%b-%y
%H:%M'
)
>>>
converted
=
strftime(
'%Y-%m-%d
%H:%M:00',
parsed
)
>>>
>>>
converted
'2006-01-12
10:06:00'
以上就是关于[python]统一转换日期格式dateutil.parser.parse全部的内容,包括:[python]统一转换日期格式dateutil.parser.parse、python 读取execl的时候 日期格式读出来的是一串数字,怎么才能还原成日期格式,我的日期是datetime类型、python datepickerctrl怎么取出四位年份的日期等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)