通过比较两条绝对路径得到相对路径

我有两条绝对路径。我需要检查其中一条路径引用的位置是否是另一条路径的后代。如果是真的,我需要找出祖先的后代的相对路径。在 Python 中实现这一点的好方法是什么?有什么图书馆可以让我受益的吗?

124845 次浏览

Commprefix () Relpath ()是你的朋友:

>>> print os.path.commonprefix(['/usr/var/log', '/usr/var/security'])
'/usr/var'
>>> print os.path.commonprefix(['/tmp', '/usr/var'])  # No common prefix: the root is the common prefix
'/'

因此,您可以测试公共前缀是否是路径之一,也就是说,是否其中一个路径是公共祖先:

paths = […, …, …]
common_prefix = os.path.commonprefix(list_of_paths)
if common_prefix in paths:
…

然后您可以找到相关路径:

relative_paths = [os.path.relpath(path, common_prefix) for path in paths]

您甚至可以使用此方法处理两个以上的路径,并测试所有路径是否都位于其中一个路径之下。

PS : 根据您的路径的样子,您可能需要首先执行一些规范化(在不知道它们是否总是以’/’结尾,或者某些路径是相对的情况下,这很有用)。相关功能包括 ()()

PPS : 正如 Peter Briggs 在评论中提到的,上面描述的简单方法可能会失败:

>>> os.path.commonprefix(['/usr/var', '/usr/var2/log'])
'/usr/var'

即使 /usr/var没有路径的公共前缀。在调用 commonprefix()之前强制所有路径以“/”结束可以解决这个(特定的)问题。

PPPS : 正如 bluenote10所提到的,添加斜杠并不能解决一般的问题。下面是他的后续问题: 如何规避 Python 的 os.path.commprefix 的谬误?

PPPPS : 从 Python 3.4开始,我们有了 Pathlib,一个提供更健全的路径操作环境的模块。我猜想一组路径的公共前缀可以通过获取每个路径的所有前缀(使用 PurePath.parents()) ,获取所有这些父集的交集,并选择最长的公共前缀来获得。

PPPPPS : Python 3.5为这个问题引入了一个适当的解决方案: os.path.commonpath(),它返回一个有效的路径。

os.path.relpath :

从工作目录或可选的起始点返回一个相对的文件路径到 path。

>>> from os.path import relpath
>>> relpath('/usr/var/log/', '/usr/var')
'log'
>>> relpath('/usr/var/log/', '/usr/var/sad/')
'../log'

因此,如果相对路径以 '..'开始-这意味着第二条路径不是第一条路径的后代。

在 Python 3中,你可以使用 PurePath.relative_to:

Python 3.5.1 (default, Jan 22 2016, 08:54:32)
>>> from pathlib import Path


>>> Path('/usr/var/log').relative_to('/usr/var/log/')
PosixPath('.')


>>> Path('/usr/var/log').relative_to('/usr/var/')
PosixPath('log')


>>> Path('/usr/var/log').relative_to('/etc/')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/usr/local/Cellar/python3/3.5.1/Frameworks/Python.framework/Versions/3.5/lib/python3.5/pathlib.py", line 851, in relative_to
.format(str(self), str(formatted)))
ValueError: '/usr/var/log' does not start with '/etc'

另一个选择是

>>> print os.path.relpath('/usr/var/log/', '/usr/var')
log

编辑: 查看 jme 的答案,找到使用 Python 3的最佳方法。

使用 pathlib,您可以得到以下解决方案:

假设我们想检查 son是否是 parent的后代,并且它们都是 Path对象。 我们可以得到 list(parent.parts)路径中的 零件列表。 然后,我们只需检查儿子的开头等于父节的列表。

>>> lparent = list(parent.parts)
>>> lson = list(son.parts)
>>> if lson[:len(lparent)] == lparent:
>>> ... #parent is a parent of son :)

如果你想要剩下的部分,你可以直接做

>>> ''.join(lson[len(lparent):])

它是一个字符串,但是当然可以将其用作其他 Path 对象的构造函数。

纯 Python 2 w/o dep:

def relpath(cwd, path):
"""Create a relative path for path from cwd, if possible"""
if sys.platform == "win32":
cwd = cwd.lower()
path = path.lower()
_cwd = os.path.abspath(cwd).split(os.path.sep)
_path = os.path.abspath(path).split(os.path.sep)
eq_until_pos = None
for i in xrange(min(len(_cwd), len(_path))):
if _cwd[i] == _path[i]:
eq_until_pos = i
else:
break
if eq_until_pos is None:
return path
newpath = [".." for i in xrange(len(_cwd[eq_until_pos+1:]))]
newpath.extend(_path[eq_until_pos+1:])
return os.path.join(*newpath) if newpath else "."

在 Python3中,使用 pathlib 对 jme 的建议进行记录。

from pathlib import Path
parent = Path(r'/a/b')
son = Path(r'/a/b/c/d')
​
if parent in son.parents or parent==son:
print(son.relative_to(parent)) # returns Path object equivalent to 'c/d'