如何截断datetime对象上的时间?

截断python datetime对象的最佳方法是什么?

在这种特殊情况下,到今天为止。基本上就是将小时,分,秒,微秒设置为0。

我希望输出也是一个datetime对象,而不是字符串。

324921 次浏览

截断是什么意思?

您可以通过使用strftime()方法和使用适当的格式字符串来完全控制格式。

http://docs.python.org/library/datetime.html#strftime-strptime-behavior

如果你不关心时间,请使用date而不是datetime

>>> now = datetime.now()
>>> now.date()
datetime.date(2011, 3, 29)

你可以像这样更新datetime:

>>> now.replace(minute=0, hour=0, second=0, microsecond=0)
datetime.datetime(2011, 3, 29, 0, 0)

你可以使用datetime。Strftime提取日,月,年…

例子:

from datetime import datetime
d = datetime.today()


# Retrieves the day and the year
print d.strftime("%d-%Y")

输出(今天):

29-2011

如果你只是想检索日期,你可以使用day属性:

from datetime import datetime
d = datetime.today()


# Retrieves the day
print d.day

输出(今天):

29

我觉得这就是你要找的…

>>> import datetime
>>> dt = datetime.datetime.now()
>>> dt = dt.replace(hour=0, minute=0, second=0, microsecond=0) # Returns a copy
>>> dt
datetime.datetime(2011, 3, 29, 0, 0)

但如果你真的不关心时间方面的事情,那么你真的应该只传递date对象…

>>> d_truncated = datetime.date(dt.year, dt.month, dt.day)
>>> d_truncated
datetime.date(2011, 3, 29)

你不能截断一个datetime对象,因为它是不可变的

但是,这里有一种方法可以构造一个新的datetime,包含0小时、分钟、秒和微秒字段,而不丢弃原始日期或tzinfo:

newdatetime = now.replace(hour=0, minute=0, second=0, microsecond=0)

有一个模块datetime_truncate为您处理这个问题。它只调用datetime。replace。

要获得与给定datetime对象对应的午夜,可以使用datetime.combine()方法:

>>> from datetime import datetime, time
>>> dt = datetime.utcnow()
>>> dt.date()
datetime.date(2015, 2, 3)
>>> datetime.combine(dt, time.min)
datetime.datetime(2015, 2, 3, 0, 0)

.replace()方法相比,其优点是基于__abc1的解决方案将继续工作,即使datetime模块引入了纳秒支持

tzinfo可以在必要时保留,但utc偏移量在午夜可能不同,例如,由于DST转换,因此简单的解决方案(设置tzinfo时间属性)可能会失败。看到如何获得给定时区的“午夜”UTC时间?

有一个用于操作日期的很棒的库:

import datetime
from delorean import Delorean
now = datetime.datetime.now()
d = Delorean(now, timezone='US/Pacific')


>>> now
datetime.datetime(2015, 3, 26, 19, 46, 40, 525703)


>>> d.truncate('second')
Delorean(datetime=2015-03-26 19:46:40-07:00, timezone='US/Pacific')


>>> d.truncate('minute')
Delorean(datetime=2015-03-26 19:46:00-07:00, timezone='US/Pacific')


>>> d.truncate('hour')
Delorean(datetime=2015-03-26 19:00:00-07:00, timezone='US/Pacific')


>>> d.truncate('day')
Delorean(datetime=2015-03-26 00:00:00-07:00, timezone='US/Pacific')


>>> d.truncate('month')
Delorean(datetime=2015-03-01 00:00:00-07:00, timezone='US/Pacific')


>>> d.truncate('year')
Delorean(datetime=2015-01-01 00:00:00-07:00, timezone='US/Pacific')

如果你想要返回datetime值:

>>> d.truncate('year').datetime
datetime.datetime(2015, 1, 1, 0, 0, tzinfo=<DstTzInfo 'US/Pacific' PDT-1 day, 17:00:00 DST>)

四年后:另一种方式,避免replace

我知道四年前接受的答案是有效的,但这似乎比使用replace更轻松:

dt = datetime.date.today()
dt = datetime.datetime(dt.year, dt.month, dt.day)

笔记

  • 当你创建一个datetime对象而没有将时间属性传递给构造函数时,你会得到midnight。
  • 正如其他人所指出的,这假设您想要一个datetime对象,以便以后与timedelta一起使用。
  • 当然,你可以用dt = datetime.datetime.now()代替第一行

6年后……我发现了这篇文章,我更喜欢numpy方法:

import numpy as np
dates_array = np.array(['2013-01-01', '2013-01-15', '2013-01-30']).astype('datetime64[ns]')
truncated_dates = dates_array.astype('datetime64[D]')

干杯

你可以为此使用熊猫(尽管它可能是该任务的开销)。你可以使用地板上装天花板作为普通数字和offset-aliases中的任何熊猫频率:

import pandas as pd
import datetime as dt


now = dt.datetime.now()
pd_now = pd.Timestamp(now)


freq = '1d'
pd_round = pd_now.round(freq)
dt_round = pd_round.to_pydatetime()


print(now)
print(dt_round)


"""
2018-06-15 09:33:44.102292
2018-06-15 00:00:00
"""

如果您正在处理DateTime类型的Series,有一种更有效的方法来截断它们,特别是当Series对象有很多行时。

你可以使用地板上函数

例如,如果你想把它截断为小时:

生成一个日期范围

times = pd.Series(pd.date_range(start='1/1/2018 04:00:00', end='1/1/2018 22:00:00', freq='s'))

我们可以比较替换和地板功能的运行时间来检查它。

%timeit times.apply(lambda x : x.replace(minute=0, second=0, microsecond=0))
>>> 341 ms ± 18.2 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


%timeit times.dt.floor('h')
>>>>2.26 ms ± 451 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

你可以用

datetime.date.today()

它很轻,而且完全符合你的要求。

>>> import datetime
>>> dt = datetime.datetime.now()
>>> datetime.datetime.date(dt)
datetime.date(2019, 4, 2)

详见https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.dt.floor.html

现在是2019年,我认为最有效的方法是:

df['truncate_date'] = df['timestamp'].dt.floor('d')

这里还有另一种方式,适合一行,但不是特别优雅:

dt = datetime.datetime.fromordinal(datetime.date.today().toordinal())

如果你想截断一个任意的timedelta:

from datetime import datetime, timedelta
truncate = lambda t, d: t + (datetime.min - t) % - d
# 2022-05-04 15:54:19.979349
now = datetime.now()


# truncates to the last 15 secondes
print(truncate(now, timedelta(seconds=15)))
# truncates to the last minute
print(truncate(now, timedelta(minutes=1)))
# truncates to the last 2 hours
print(truncate(now, timedelta(hours=2)))
# ...


"""
2022-05-04 15:54:15
2022-05-04 15:54:00
2022-05-04 14:00:00
"""

PS:这是针对python3的

你可以通过指定isoformat来实现

>>> import datetime
>>> datetime.datetime.now().isoformat(timespec='seconds', sep=' ')
2022-11-24 12:42:05

文档提供了关于isoformat()用法的更多细节。

https://docs.python.org/3/library/datetime.html#datetime.datetime.isoformat