如何在 python 中获得按创建日期排序的目录列表?

在 Windows 机器上,使用 python 获取按日期[ create | Amendment ]排序的目录中所有文件的列表的最佳方法是什么?

273725 次浏览

我过去曾使用 Python 脚本来确定目录中最后更新的文件:

import glob
import os


search_dir = "/mydir/"
# remove anything from the list that is not a file (directories, symlinks)
# thanks to J.F. Sebastion for pointing out that the requirement was a list
# of files (presumably not including directories)
files = list(filter(os.path.isfile, glob.glob(search_dir + "*")))
files.sort(key=lambda x: os.path.getmtime(x))

根据文件 mtime 应该可以完成你要找的工作。

编辑 : 注意,如果需要,您也可以使用 os.listdir ()代替 glob.globb ()-我在原始代码中使用 globb 的原因是,我希望使用 globb 只搜索具有特定文件扩展名集的文件,而 globb ()更适合这种情况。要使用 listdir,下面是它的样子:

import os


search_dir = "/mydir/"
os.chdir(search_dir)
files = filter(os.path.isfile, os.listdir(search_dir))
files = [os.path.join(search_dir, f) for f in files] # add path to each file
files.sort(key=lambda x: os.path.getmtime(x))

也许您应该使用 shell 命令。在 Unix/Linux 中,使用 sort 管道的 find 可能能够实现您想要的功能。

下面是一句俏皮话:

import os
import time
from pprint import pprint


pprint([(x[0], time.ctime(x[1].st_ctime)) for x in sorted([(fn, os.stat(fn)) for fn in os.listdir(".")], key = lambda x: x[1].st_ctime)])

这将调用 os.listdir ()来获取文件名列表,然后为每个文件调用 os.stat ()来获取创建时间,然后根据创建时间进行排序。

注意,这个方法对每个文件只调用 os.stat ()一次,这比对排序中的每个比较调用它更有效。

我的版本是这样的:

def getfiles(dirpath):
a = [s for s in os.listdir(dirpath)
if os.path.isfile(os.path.join(dirpath, s))]
a.sort(key=lambda s: os.path.getmtime(os.path.join(dirpath, s)))
return a

首先,我们构建一个文件名列表。Isfile ()用于跳过目录; 如果应该包含目录,则可以省略它。然后,我们就地对列表进行排序,使用修改日期作为键。

sorted(filter(os.path.isfile, os.listdir('.')),
key=lambda p: os.stat(p).st_mtime)

您可以使用 os.walk('.').next()[-1]而不是使用 os.path.isfile进行过滤,但是这会在列表中留下死符号链接,而且 os.stat会在它们上面失败。

更新 : 在 Python 3中按照修改日期对 dirpath的条目排序:

import os
from pathlib import Path


paths = sorted(Path(dirpath).iterdir(), key=os.path.getmtime)

(把 @ Pygirl 的回答放在这里以增加能见度)

如果您已经有一个文件名 files的列表,那么按照 Windows 上的创建时间对其进行排序(确保该列表包含绝对路径) :

files.sort(key=os.path.getctime)

例如,您可以使用 glob获得的文件列表,如 @ Jay 的回答所示。


旧答案 下面是更详细的 @Greg Hewgill的回答版本。这是最符合问题要求的。它区分了创建日期和修改日期(至少在 Windows 上)。

#!/usr/bin/env python
from stat import S_ISREG, ST_CTIME, ST_MODE
import os, sys, time


# path to the directory (relative or absolute)
dirpath = sys.argv[1] if len(sys.argv) == 2 else r'.'


# get all entries in the directory w/ stats
entries = (os.path.join(dirpath, fn) for fn in os.listdir(dirpath))
entries = ((os.stat(path), path) for path in entries)


# leave only regular files, insert creation date
entries = ((stat[ST_CTIME], path)
for stat, path in entries if S_ISREG(stat[ST_MODE]))
#NOTE: on Windows `ST_CTIME` is a creation date
#  but on Unix it could be something else
#NOTE: use `ST_MTIME` to sort by a modification date
        

for cdate, path in sorted(entries):
print time.ctime(cdate), os.path.basename(path)

例如:

$ python stat_creation_date.py
Thu Feb 11 13:31:07 2009 stat_creation_date.py

有一个 os.path.getmtime函数,它给出自纪元以来的秒数 应该比 os.stat快。

import os


os.chdir(directory)
sorted(filter(os.path.isfile, os.listdir('.')), key=os.path.getmtime)

这是学习的基本步骤:

import os, stat, sys
import time


dirpath = sys.argv[1] if len(sys.argv) == 2 else r'.'


listdir = os.listdir(dirpath)


for i in listdir:
os.chdir(dirpath)
data_001 = os.path.realpath(i)
listdir_stat1 = os.stat(data_001)
listdir_stat2 = ((os.stat(data_001), data_001))
print time.ctime(listdir_stat1.st_ctime), data_001

如果您想按照日期顺序(Python3)读取具有特定扩展名的文件,那么以下是我的回答: 使用 globbwithout filter。

dataset_path='/mydir/'
files = glob.glob(dataset_path+"/morepath/*.extension")
files.sort(key=os.path.getmtime)

不改变目录:

import os


path = '/path/to/files/'
name_list = os.listdir(path)
full_list = [os.path.join(path,i) for i in name_list]
time_sorted_list = sorted(full_list, key=os.path.getmtime)


print time_sorted_list


# if you want just the filenames sorted, simply remove the dir from each
sorted_filename_list = [ os.path.basename(i) for i in time_sorted_list]
print sorted_filename_list

Alex Coventry 的回答会产生一个异常,如果该文件是一个符号链接到一个不存在的文件,下面的代码纠正了这个回答:

import time
import datetime
sorted(filter(os.path.isfile, os.listdir('.')),
key=lambda p: os.path.exists(p) and os.stat(p).st_mtime or time.mktime(datetime.now().timetuple())

当文件不存在时,使用 now () ,并且 symlink 将出现在列表的最后。

在 python 3.5 + 中

from pathlib import Path
sorted(Path('.').iterdir(), key=lambda f: f.stat().st_mtime)

下面是一对简单的行,它查找扩展并提供排序选项

def get_sorted_files(src_dir, regex_ext='*', sort_reverse=False):
files_to_evaluate = [os.path.join(src_dir, f) for f in os.listdir(src_dir) if re.search(r'.*\.({})$'.format(regex_ext), f)]
files_to_evaluate.sort(key=os.path.getmtime, reverse=sort_reverse)
return files_to_evaluate
# *** the shortest and best way ***
# getmtime --> sort by modified time
# getctime --> sort by created time


import glob,os


lst_files = glob.glob("*.txt")
lst_files.sort(key=os.path.getmtime)
print("\n".join(lst_files))

对于 os.scandir的完整性(比 pathlib快2倍) :

import os
sorted(os.scandir('/tmp/test'), key=lambda d: d.stat().st_mtime)
from pathlib import Path
import os


sorted(Path('./').iterdir(), key=lambda t: t.stat().st_mtime)

或者

sorted(Path('./').iterdir(), key=os.path.getmtime)

或者

sorted(os.scandir('./'), key=lambda t: t.stat().st_mtime)

其中 m 时间是修正时间。

这是我的版本:

import os


folder_path = r'D:\Movies\extra\new\dramas' # your path
os.chdir(folder_path) # make the path active
x = sorted(os.listdir(), key=os.path.getctime)  # sorted using creation time


folder = 0


for folder in range(len(x)):
print(x[folder]) # print all the foldername inside the folder_path
folder = +1

原来 os.listdir是按照上次修改的顺序排序的,但是是反过来的,所以你可以这样做:

import os
last_modified=os.listdir()[::-1]

在路径中添加文件目录/文件夹,如果您希望具有特定的文件类型,请添加文件扩展名,然后按照时间顺序获取文件名。 这对我有用。

import glob, os
from pathlib import Path
path = os.path.expanduser(file_location+"/"+date_file)
os.chdir(path)
saved_file=glob.glob('*.xlsx')
saved_file.sort(key=os.path.getmtime)


print(saved_file)