Python中的目录树列表

我如何在Python中获得给定目录中的所有文件(和目录)的列表?

697089 次浏览

你可以使用

os.listdir(path)

参考和更多的操作系统函数看这里:

import os


for filename in os.listdir("C:\\temp"):
print  filename

试试这个:

import os
for top, dirs, files in os.walk('./'):
for nm in files:
print os.path.join(top, nm)

这是一种遍历目录树中每个文件和目录的方法:

import os


for dirname, dirnames, filenames in os.walk('.'):
# print path to all subdirectories first.
for subdirname in dirnames:
print(os.path.join(dirname, subdirname))


# print path to all filenames.
for filename in filenames:
print(os.path.join(dirname, filename))


# Advanced usage:
# editing the 'dirnames' list will stop os.walk() from recursing into there.
if '.git' in dirnames:
# don't go into any .git directories.
dirnames.remove('.git')

下面是我经常使用的一个辅助函数:

import os


def listdir_fullpath(d):
return [os.path.join(d, f) for f in os.listdir(d)]

我写了一个很长的版本,包含了我可能需要的所有选项:http://sam.nipl.net/code/python/find.py

我想它也适合这里:

#!/usr/bin/env python


import os
import sys


def ls(dir, hidden=False, relative=True):
nodes = []
for nm in os.listdir(dir):
if not hidden and nm.startswith('.'):
continue
if not relative:
nm = os.path.join(dir, nm)
nodes.append(nm)
nodes.sort()
return nodes


def find(root, files=True, dirs=False, hidden=False, relative=True, topdown=True):
root = os.path.join(root, '')  # add slash if not there
for parent, ldirs, lfiles in os.walk(root, topdown=topdown):
if relative:
parent = parent[len(root):]
if dirs and parent:
yield os.path.join(parent, '')
if not hidden:
lfiles   = [nm for nm in lfiles if not nm.startswith('.')]
ldirs[:] = [nm for nm in ldirs  if not nm.startswith('.')]  # in place
if files:
lfiles.sort()
for nm in lfiles:
nm = os.path.join(parent, nm)
yield nm


def test(root):
print "* directory listing, with hidden files:"
print ls(root, hidden=True)
print
print "* recursive listing, with dirs, but no hidden files:"
for f in find(root, dirs=True):
print f
print


if __name__ == "__main__":
test(*sys.argv[1:])

如果你需要通配符,也有一个模块。例如:

import glob
glob.glob('./[0-9].*')

将返回如下内容:

['./1.gif', './2.txt']

请参阅文档在这里

#import modules
import os


_CURRENT_DIR = '.'




def rec_tree_traverse(curr_dir, indent):
"recurcive function to traverse the directory"
#print "[traverse_tree]"


try :
dfList = [os.path.join(curr_dir, f_or_d) for f_or_d in os.listdir(curr_dir)]
except:
print "wrong path name/directory name"
return


for file_or_dir in dfList:


if os.path.isdir(file_or_dir):
#print "dir  : ",
print indent, file_or_dir,"\\"
rec_tree_traverse(file_or_dir, indent*2)


if os.path.isfile(file_or_dir):
#print "file : ",
print indent, file_or_dir


#end if for loop
#end of traverse_tree()


def main():


base_dir = _CURRENT_DIR


rec_tree_traverse(base_dir," ")


raw_input("enter any key to exit....")
#end of main()




if __name__ == '__main__':
main()

供参考添加扩展或ext文件的过滤器 进口操作系统< / p >

path = '.'
for dirname, dirnames, filenames in os.walk(path):
# print path to all filenames with extension py.
for filename in filenames:
fname_path = os.path.join(dirname, filename)
fext = os.path.splitext(fname_path)[1]
if fext == '.py':
print fname_path
else:
continue

只递归列出文件的漂亮的一行代码。我在setup.py package_data指令中使用了这个:

import os


[os.path.join(x[0],y) for x in os.walk('<some_directory>') for y in x[2]]

我知道这不是问题的答案,但可能会派上用场

递归实现

import os


def scan_dir(dir):
for name in os.listdir(dir):
path = os.path.join(dir, name)
if os.path.isfile(path):
print path
else:
scan_dir(path)

如果我觉得我会把这个扔进去。简单和肮脏的方式进行通配符搜索。

import re
import os


[a for a in os.listdir(".") if re.search("^.*\.py$",a)]

对于当前工作目录中的文件,无需指定路径

Python 2.7:

import os
os.listdir('.')

Python 3. x:

import os
os.listdir()

对于Python 2

#!/bin/python2


import os


def scan_dir(path):
print map(os.path.abspath, os.listdir(pwd))

对于Python 3

对于filter和map,你需要用list()来包装它们

#!/bin/python3


import os


def scan_dir(path):
print(list(map(os.path.abspath, os.listdir(pwd))))

现在的建议是用生成器表达式或列表推导式替换map和filter的使用:

#!/bin/python


import os


def scan_dir(path):
print([os.path.abspath(f) for f in os.listdir(path)])

下面的代码将列出目录和目录下的文件

def print_directory_contents(sPath):
import os
for sChild in os.listdir(sPath):
sChildPath = os.path.join(sPath,sChild)
if os.path.isdir(sChildPath):
print_directory_contents(sChildPath)
else:
print(sChildPath)

下面是一行python版本:

import os
dir = 'given_directory_name'
filenames = [os.path.join(os.path.dirname(os.path.abspath(__file__)),dir,i) for i in os.listdir(dir)]

这段代码列出给定目录名中所有文件和目录的完整路径。

我知道这是一个老问题。如果你在linux机器上,这是我遇到的一种简洁的方法。

import subprocess
print(subprocess.check_output(["ls", "/"]).decode("utf8"))

和我一起工作的是萨利赫在本页其他地方的回答的修改版本。

代码如下:

dir = 'given_directory_name'
filenames = [os.path.abspath(os.path.join(dir,i)) for i in os.listdir(dir)]

这是另一种选择。

os.scandir(path='.')

它返回os的迭代器。对应于path指定目录中的条目(以及文件属性信息)的DirEntry对象。

例子:

with os.scandir(path) as it:
for entry in it:
if not entry.name.startswith('.'):
print(entry.name)

使用scandir()而不是listdir()可以显著提高还需要文件类型或文件属性信息的代码的性能,因为os。如果操作系统在扫描目录时提供了该信息,则DirEntry对象将公开该信息。所有操作系统。DirEntry方法可以执行系统调用,但is_dir()和is_file()通常只需要符号链接的系统调用;os.DirEntry.stat()在Unix上总是需要一个系统调用,但在Windows上只需要一个符号链接。

Python Docs

虽然os.listdir()可以用于生成文件和目录名称的列表,但一旦有了这些名称,通常还需要做更多的工作——在Python3中,pathlib可以简化这些其他工作。让我们看一看,看看你是否和我一样喜欢它。

要列出目录内容,构造一个Path对象并获取迭代器:

In [16]: Path('/etc').iterdir()
Out[16]: <generator object Path.iterdir at 0x110853fc0>

如果我们只想要一个事物名称的列表

In [17]: [x.name for x in Path('/etc').iterdir()]
Out[17]:
['emond.d',
'ntp-restrict.conf',
'periodic',

如果你只想要dirs:

In [18]: [x.name for x in Path('/etc').iterdir() if x.is_dir()]
Out[18]:
['emond.d',
'periodic',
'mach_init.d',

如果你想要该树中所有conf文件的名称:

In [20]: [x.name for x in Path('/etc').glob('**/*.conf')]
Out[20]:
['ntp-restrict.conf',
'dnsextd.conf',
'syslog.conf',

如果你想在树>= 1K中列出conf文件:

In [23]: [x.name for x in Path('/etc').glob('**/*.conf') if x.stat().st_size > 1024]
Out[23]:
['dnsextd.conf',
'pf.conf',
'autofs.conf',

解析相对路径变得简单:

In [32]: Path('../Operational Metrics.md').resolve()
Out[32]: PosixPath('/Users/starver/code/xxxx/Operational Metrics.md')

使用路径导航非常清楚(尽管出乎意料):

In [10]: p = Path('.')


In [11]: core = p / 'web' / 'core'


In [13]: [x for x in core.iterdir() if x.is_file()]
Out[13]:
[PosixPath('web/core/metrics.py'),
PosixPath('web/core/services.py'),
PosixPath('web/core/querysets.py'),

简单的方法:

list_output_files = [os.getcwd()+"\\"+f for f in os.listdir(os.getcwd())]