[python]统一转换日期格式dateutil.parser.parse

[python]统一转换日期格式dateutil.parser.parse,第1张

背景:

我有很多很多的日志数据,每个日志里面都有日期字符串,我需要将其转换为datetime格式

问题是,这些日志里的字符串格式五花八门,有2017-05-25T05:27:30313292255Z,有2016-07-01T00:00:00以及其他各种我还没有看到的格式。

开始我写了一长串的if else来判断格式,但是总有我漏掉的。

最后上网一查,发现dateutilparserparse。可以不用我们指定格式,直接将字符串转换为datetime格式。

注:我试了下"19/May/2017:04:10:06 +0000" 居然失败了- -!那可能这个函数只认识数字不认得字母吧。

你是用pyExcelerator还是xlrd读的excel如果是xlrd那它自带一个xldate_as_tuple函数,可以转成datetime,比如:

from datetime import datetime

from xlrd import xldate_as_tuple

d=datetime(xldate_as_tuple(x,0))#x就是你那串数字的变量

如果是用pyExcelerator,那好象它没有类似的函数,可以用下面这个函数:

def xldate_as_datetime(xldate, datemode=0):

if datemode not in (0, 1):

raise XLDateBadDatemode(datemode)

if xldate == 000:

return datetimetime(0, 0, 0)

if xldate < 000:

raise XLDateNegative(xldate)

xldays = int(xldate)

frac = xldate - xldays

seconds = int(round(frac 864000))

assert 0 <= seconds <= 86400

if seconds == 86400:

seconds = 0

xldays += 1

#if xldays >= _XLDAYS_TOO_LARGE[datemode]:

# raise XLDateTooLarge(xldate)

if xldays == 0:

# second = seconds % 60; minutes = seconds // 60

minutes, second = divmod(seconds, 60)

# minute = minutes % 60; hour = minutes // 60

hour, minute = divmod(minutes, 60)

return datetimetime(hour, minute, second)

if xldays < 61 and datemode == 0:

raise XLDateAmbiguous(xldate)

return (

datetimedatetimefromordinal(xldays + 693594 + 1462 datemode)

+ datetimetimedelta(seconds=seconds)

)

用法:

d=xldate_as_datetime(x)#x就是你那串数字的变量

可以通过设定格式来取年份、月份和日期

print selfbgdateGetValue()Format('%Y-%m-%d') 全格式日期

print selfbgdateGetValue()Format('%Y') 只取年份

Python 程序能用很多方式处理日期和时间,转换日期格式是一个常见的功能。

Python 提供了一个 time 和 calendar 模块可以用于格式化日期和时间。

时间间隔是以秒为单位的浮点小数。

每个时间戳都以自从1970年1月1日午夜(历元)经过了多长时间来表示。

Python 的 time 模块下有很多函数可以转换常见日期格式。如函数timetime()用于获取当前时间戳, 如下实例:

#!/usr/bin/python

# -- coding: UTF-8 --

import time; # 引入time模块

ticks = timetime()

print "当前时间戳为:", ticks

以上实例输出结果:

当前时间戳为: 145999455251

时间戳单位最适于做日期运算。但是1970年之前的日期就无法以此表示了。太遥远的日期也不行,UNIX和Windows只支持到2038年。

什么是时间元组?

很多Python函数用一个元组装起来的9组数字处理时间:

序号

字段

0 4位数年 2008

1 月 1 到 12

2 日 1到31

3 小时 0到23

4 分钟 0到59

5 秒 0到61 (60或61 是闰秒)

6 一周的第几日 0到6 (0是周一)

7 一年的第几日 1到366 (儒略历)

8 夏令时 -1, 0, 1, -1是决定是否为夏令时的旗帜

上述也就是struct_time元组。这种结构具有如下属性:

序号

属性

0 tm_year 2008

1 tm_mon 1 到 12

2 tm_mday 1 到 31

3 tm_hour 0 到 23

4 tm_min 0 到 59

5 tm_sec 0 到 61 (60或61 是闰秒)

6 tm_wday 0到6 (0是周一)

7 tm_yday 1 到 366(儒略历)

8 tm_isdst -1, 0, 1, -1是决定是否为夏令时的旗帜

获取当前时间

从返回浮点数的时间辍方式向时间元组转换,只要将浮点数传递给如localtime之类的函数。

#!/usr/bin/python

# -- coding: UTF-8 --

import time

localtime = timelocaltime(timetime())

print "本地时间为 :", localtime

以上实例输出结果:

本地时间为 : timestruct_time(tm_year=2016, tm_mon=4, tm_mday=7, tm_hour=10, tm_min=3, tm_sec=27, tm_wday=3, tm_yday=98, tm_isdst=0)

获取格式化的时间

你可以根据需求选取各种格式,但是最简单的获取可读的时间模式的函数是asctime():

#!/usr/bin/python

# -- coding: UTF-8 --

import time

localtime = timeasctime( timelocaltime(timetime()) )

print "本地时间为 :", localtime

以上实例输出结果:

本地时间为 : Thu Apr 7 10:05:21 2016

格式化日期

我们可以使用 time 模块的 strftime 方法来格式化日期,:

timestrftime(format[, t])

#!/usr/bin/python

# -- coding: UTF-8 --

import time

# 格式化成2016-03-20 11:45:39形式

print timestrftime("%Y-%m-%d %H:%M:%S", timelocaltime())

# 格式化成Sat Mar 28 22:24:24 2016形式

print timestrftime("%a %b %d %H:%M:%S %Y", timelocaltime())

# 将格式字符串转换为时间戳

a = "Sat Mar 28 22:24:24 2016"

print timemktime(timestrptime(a,"%a %b %d %H:%M:%S %Y"))

以上实例输出结果:

2016-04-07 10:25:09

Thu Apr 07 10:25:09 2016

14591750640

python中时间日期格式化符号:

%y 两位数的年份表示(00-99)

%Y 四位数的年份表示(000-9999)

%m 月份(01-12)

%d 月内中的一天(0-31)

%H 24小时制小时数(0-23)

%I 12小时制小时数(01-12)

%M 分钟数(00=59)

%S 秒(00-59)

%a 本地简化星期名称

%A 本地完整星期名称

%b 本地简化的月份名称

%B 本地完整的月份名称

%c 本地相应的日期表示和时间表示

%j 年内的一天(001-366)

%p 本地AM或PM的等价符

%U 一年中的星期数(00-53)星期天为星期的开始

%w 星期(0-6),星期天为星期的开始

%W 一年中的星期数(00-53)星期一为星期的开始

%x 本地相应的日期表示

%X 本地相应的时间表示

%Z 当前时区的名称

%% %号本身

获取某月日历

Calendar模块有很广泛的方法用来处理年历和月历,例如打印某月的月历:

#!/usr/bin/python

# -- coding: UTF-8 --

import calendar

cal = calendarmonth(2016, 1)

print "以下输出2016年1月份的日历:"

print cal;

以上实例输出结果:

以下输出2016年1月份的日历:

January 2016

Mo Tu We Th Fr Sa Su

1 2 3

4 5 6 7 8 9 10

11 12 13 14 15 16 17

18 19 20 21 22 23 24

25 26 27 28 29 30 31

Time 模块

Time 模块包含了以下内置函数,既有时间处理相的,也有转换时间格式的:

序号

函数及描述

1 timealtzone

返回格林威治西部的夏令时地区的偏移秒数。如果该地区在格林威治东部会返回负值(如西欧,包括英国)。对夏令时启用地区才能使用。

2 timeasctime([tupletime])

接受时间元组并返回一个可读的形式为"Tue Dec 11 18:07:14 2008"(2008年12月11日 周二18时07分14秒)的24个字符的字符串。

3 timeclock( )

用以浮点数计算的秒数返回当前的CPU时间。用来衡量不同程序的耗时,比timetime()更有用。

4 timectime([secs])

作用相当于asctime(localtime(secs)),未给参数相当于asctime()

5 timegmtime([secs])

接收时间辍(1970纪元后经过的浮点秒数)并返回格林威治天文时间下的时间元组t。注:ttm_isdst始终为0

6 timelocaltime([secs])

接收时间辍(1970纪元后经过的浮点秒数)并返回当地时间下的时间元组t(ttm_isdst可取0或1,取决于当地当时是不是夏令时)。

7 timemktime(tupletime)

接受时间元组并返回时间辍(1970纪元后经过的浮点秒数)。

8 timesleep(secs)

推迟调用线程的运行,secs指秒数。

9 timestrftime(fmt[,tupletime])

接收以时间元组,并返回以可读字符串表示的当地时间,格式由fmt决定。

10 timestrptime(str,fmt='%a %b %d %H:%M:%S %Y')

根据fmt的格式把一个时间字符串解析为时间元组。

11 timetime( )

返回当前时间的时间戳(1970纪元后经过的浮点秒数)。

12 timetzset()

根据环境变量TZ重新初始化时间相关设置。

Time模块包含了以下2个非常重要的属性:

序号

属性及描述

1 timetimezone

属性timetimezone是当地时区(未启动夏令时)距离格林威治的偏移秒数(>0,美洲;<=0大部分欧洲,亚洲,非洲)。

2 timetzname

属性timetzname包含一对根据情况的不同而不同的字符串,分别是带夏令时的本地时区名称,和不带的。

日历(Calendar)模块

此模块的函数都是日历相关的,例如打印某月的字符月历。

星期一是默认的每周第一天,星期天是默认的最后一天。更改设置需调用calendarsetfirstweekday()函数。模块包含了以下内置函数:

序号

函数及描述

1 calendarcalendar(year,w=2,l=1,c=6)

返回一个多行字符串格式的year年年历,3个月一行,间隔距离为c。 每日宽度间隔为w字符。每行长度为21 W+18+2 C。l是每星期行数。

2 calendarfirstweekday( )

返回当前每周起始日期的设置。默认情况下,首次载入caendar模块时返回0,即星期一。

3 calendarisleap(year)

是闰年返回True,否则为false。

4 calendarleapdays(y1,y2)

返回在Y1,Y2两年之间的闰年总数。

5 calendarmonth(year,month,w=2,l=1)

返回一个多行字符串格式的year年month月日历,两行标题,一周一行。每日宽度间隔为w字符。每行的长度为7 w+6。l是每星期的行数。

6 calendarmonthcalendar(year,month)

返回一个整数的单层嵌套列表。每个子列表装载代表一个星期的整数。Year年month月外的日期都设为0;范围内的日子都由该月第几日表示,从1开始。

7 calendarmonthrange(year,month)

返回两个整数。第一个是该月的星期几的日期码,第二个是该月的日期码。日从0(星期一)到6(星期日);月从1到12。

8 calendarprcal(year,w=2,l=1,c=6)

相当于 print calendarcalendar(year,w,l,c)

9 calendarprmonth(year,month,w=2,l=1)

相当于 print calendarcalendar(year,w,l,c)。

10 calendarsetfirstweekday(weekday)

设置每周的起始日期码。0(星期一)到6(星期日)。

11 calendartimegm(tupletime)

和timegmtime相反:接受一个时间元组形式,返回该时刻的时间辍(1970纪元后经过的浮点秒数)。

12 calendarweekday(year,month,day)

返回给定日期的日期码。0(星期一)到6(星期日)。月份为 1(一月) 到 12(12月)。

用Python实现字符串和日期相互转换的方法,具体如下:

这里用的分别是time和datetime函数来处理

import time,datetime

//日期转化为字符串

# date to str

//输出时间

print timestrftime("%Y-%m-%d %X", timelocaltime())

#str to date

//字符串转化为日期

t = timestrptime("2016 - 12 - 05", "%Y - %m - %d")

y,m,d = t[0:3]

//输出时间

print datetimedatetime(y,m,d)

在Python中,日期和时间相关的函数和类被封装在datetime模块中。可以使用该模块中的函数和类来处理日期和时间相关的 *** 作。下面是一些常用的日期函数:

datetimedatetime(year, month, day, hour=0, minute=0, second=0, microsecond=0, tzinfo=None):创建一个datetime对象,表示指定的日期和时间。year、month和day参数是必需的,表示日期;hour、minute、second和microsecond参数是可选的,表示时间;tzinfo参数是可选的,表示时区信息。

datetimedate(year, month, day):创建一个date对象,表示指定的日期。year、month和day参数是必需的,表示日期。

datetimetime(hour=0, minute=0, second=0, microsecond=0, tzinfo=None):创建一个time对象,表示指定的时间。hour、minute、second和microsecond参数是可选的,表示时间;tzinfo参数是可选的,表示时区信息。

datetimedatetimenow(tz=None):返回一个datetime对象,表示当前日期和时间。tz参数是可选的,表示时区信息。

datetimedatetoday():返回一个date对象,表示当前日期。

这些函数可以用来创建、获取日期和时间对象,并进行各种日期和时间的 *** 作。例如,可以使用datetimedatetimenow()函数获取当前日期和时间,然后使用strftime()函数将其格式化为字符串输出。

#-- coding: utf-8 --

import os

#已知文件名的情况下,可以用这个函数

def getFileInfo(filepath):

info = {}

if ospathisfile(filepath):

info['TimeCreated'] = ospathgetctime(filepath)

info['TimeModified'] = ospathgetatime(filepath)

info['Size'] = ospathgetsize(filepath)

return info

# 如果只知道文件根目录,但是不知道具体的文件路径,

# 可以先用oslistdir获得文件和文件夹列表

#-------------------分界线----------------------

# 这是回答你的第二个问题。如何找到一个字符串中指定两个字符中间的字符串

# 这里用的是正则表达式

import re

special = "+$^[](){}|\/" #正则表达式中会出现的特殊字符

# 输入参数为原始字符,leftmark表示左边的分隔符号,rightmark表示右边的分隔符号

#函数返回在leftmark和rightmark中间的内容,可能匹配满足不止一次,没有找到就返回空

def matchpattern(str1,leftmark,rightmark):

lf,rt = leftmark,rightmark

#如果需要匹配的字符在正则表达式中时特殊字符,需要给予转义

if leftmark in special:

lf = '\%s'%leftmark

if rightmark in special:

rt = '\%s'%rightmark

pattern = recompile(r''+lf + '{0,}'+ rt)

matched = refindall(pattern,str1)

result = []

if matched:

#如果匹配成功了,就去头去尾,直接取中间的部分

for m in matched:

s = mreplace(leftmark, '')

s = sreplace(rightmark, '')

resultappend(s)

return result

else:

return None

if __name__ == '__main__':

print matchpattern("#abcsdfs%sdfsdf",'%','')

你可以利用

time

模块里的

strptime()和

strftime()。

strptime()根据你指定的格式控制字符串解读日期,

strftime()则根据你指定的格式控制字符串输出日期。

比如,把

“12-Jan-06

10:06”

格式转换成

“2006-01-12

10:06:00”

格式:

>>>

from

time

import

strptime,

strftime

>>>

>>>

myDate

=

'12-Jan-06

10:06'

>>>

parsed

=

strptime(

myDate,

'%d-%b-%y

%H:%M'

)

>>>

converted

=

strftime(

'%Y-%m-%d

%H:%M:00',

parsed

)

>>>

>>>

converted

'2006-01-12

10:06:00'

以上就是关于[python]统一转换日期格式dateutil.parser.parse全部的内容,包括:[python]统一转换日期格式dateutil.parser.parse、python 读取execl的时候 日期格式读出来的是一串数字,怎么才能还原成日期格式,我的日期是datetime类型、python datepickerctrl怎么取出四位年份的日期等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/web/9559663.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-29
下一篇 2023-04-29

发表评论

登录后才能评论

评论列表(0条)

保存