最佳答案
我正在编写一个脚本,该脚本下降到一个目录树(使用 os.walk ()) ,然后访问匹配某个文件扩展名的每个文件。然而,由于我的工具将要使用的一些目录树也包含子目录,而这些子目录又包含无用的 很多内容(为了这个脚本的目的) ,我想我应该为用户添加一个选项来指定要从遍历中排除的目录列表。
这对于 os.walk ()来说很简单。毕竟,这取决于我是否真正想要访问 os.walk ()生成的相应文件/dirs,还是直接跳过它们。问题是,如果我有一个像这样的目录树:
root--
|
--- dirA
|
--- dirB
|
--- uselessStuff --
|
--- moreJunk
|
--- yetMoreJunk
我想排除 没用的东西和它的所有子目录,os.walk ()仍然会下降到 没用的东西的所有子目录(可能有成千上万个) ,不用说,这会大大减慢速度。在一个理想的世界中,我可以告诉 os.walk ()甚至不用再生产任何 没用的东西的孩子,但据我所知,没有办法这样做(是吗?).
有人有什么想法吗? 也许有第三方图书馆提供类似的东西?