从Python中的文件名中提取扩展名

是否有函数从文件名中提取扩展名?

1386377 次浏览

使用#0

>>> import os>>> filename, file_extension = os.path.splitext('/path/to/somefile.ext')>>> filename'/path/to/somefile'>>> file_extension'.ext'

与大多数手动字符串拆分尝试不同,os.path.splitext将正确地将/a/b.c/d视为没有扩展名而不是扩展名.c/d,并且将.bashrc视为没有扩展名而不是扩展名.bashrc

>>> os.path.splitext('/a/b.c/d')('/a/b.c/d', '')>>> os.path.splitext('.bashrc')('.bashrc', '')
import os.pathextension = os.path.splitext(filename)[1]
import os.pathextension = os.path.splitext(filename)[1][1:]

仅获取扩展名的文本,而不获取点。

上述任何解决方案都可以,但在linux上,我发现扩展字符串的末尾有一个换行符,它会阻止匹配成功。将strip()方法添加到末尾。例如:

import os.pathextension = os.path.splitext(filename)[1][1:].strip()

对于简单的用例,一个选项可能是从点拆分:

>>> filename = "example.jpeg">>> filename.split(".")[-1]'jpeg'

当文件没有扩展名时没有错误:

>>> "filename".split(".")[-1]'filename'

但你必须小心:

>>> "png".split(".")[-1]'png'    # But file doesn't have an extension

也不适用于Unix系统中的隐藏文件:

>>> ".bashrc".split(".")[-1]'bashrc'    # But this is not an extension

一般使用,首选#0

值得在那里添加一个较低的,这样你就不会发现自己想知道为什么JPG没有出现在你的列表中。

os.path.splitext(filename)[1][1:].strip().lower()

使用拆分文本时,具有双扩展名的文件(例如file.tar.gzfile.tar.bz2等)存在问题。

>>> fileName, fileExtension = os.path.splitext('/path/to/somefile.tar.gz')>>> fileExtension'.gz'

应该是:.tar.gz

可能的解决方案是这里

另一种右分割的解决方案:

# to get extension only
s = 'test.ext'
if '.' in s: ext = s.rsplit('.', 1)[1]
# or, to get file name and extension
def split_filepath(s):"""get filename and extension from filepathfilepath -> (filename, extension)"""if not '.' in s: return (s, '')r = s.rsplit('.', 1)return (r[0], r[1])
filename='ext.tar.gz'extension = filename[filename.rfind('.'):]
name_only=file_name[:filename.index(".")

这将为您提供直到第一个“.”的文件名,这将是最常见的。

# try this, it works for anything, any length of extension# e.g www.google.com/downloads/file1.gz.rs -> .gz.rs
import os.path
class LinkChecker:
@staticmethoddef get_link_extension(link: str)->str:if link is None or link == "":return ""else:paths = os.path.splitext(link)ext = paths[1]new_link = paths[0]if ext != "":return LinkChecker.get_link_extension(new_link) + extelse:return ""
def NewFileName(fichier):cpt = 0fic , *ext =  fichier.split('.')ext = '.'.join(ext)while os.path.isfile(fichier):cpt += 1fichier = '{0}-({1}).{2}'.format(fic, cpt, ext)return fichier

很惊讶这还没有提到:

import osfn = '/some/path/a.tar.gz'
basename = os.path.basename(fn)  # os independentOut[] a.tar.gz
base = basename.split('.')[0]Out[] a
ext = '.'.join(basename.split('.')[1:])   # <-- main part
# if you want a leading '.', and if no result `None`:ext = '.' + ext if ext else NoneOut[] .tar.gz

好处:

  • 我能想到的任何东西都能正常工作
  • 没有模块
  • 没有正则表达式
  • 跨平台
  • 易于扩展(例如,扩展没有前导点,只有扩展的最后一部分)

作为函数:

def get_extension(filename):basename = os.path.basename(filename)  # os independentext = '.'.join(basename.split('.')[1:])return '.' + ext if ext else None

新版本3.4。

import pathlib
print(pathlib.Path('yourPath.example').suffix) # '.example'print(pathlib.Path("hello/foo.bar.tar.gz").suffixes) # ['.bar', '.tar', '.gz']

我很惊讶没有人提到#0pathlib太棒了!

虽然这是一个古老的话题,但我想知道为什么在这种情况下没有提到一个非常简单的Python api称为r分区:

要获取给定文件绝对路径的扩展名,您只需键入:

filepath.rpartition('.')[-1]

例子:

path = '/home/jersey/remote/data/test.csv'print path.rpartition('.')[-1]

会给你:'csv'

即使这个问题已经回答了,我也会在Regex中添加解决方案。

>>> import re>>> file_suffix = ".*(\..*)">>> result = re.search(file_suffix, "somefile.ext")>>> result.group(1)'.ext'

您可以在filename上使用split

f_extns = filename.split(".")print ("The extension of the file is : " + repr(f_extns[-1]))

这不需要额外的库

这是一个直接的字符串表示技术:我看到很多提到的解决方案,但我认为大多数都在考虑拆分。然而,Split在每次出现“.”时都会这样做。你更愿意寻找的是分区。

string = "folder/to_path/filename.ext"extension = string.rpartition(".")[-1]

您可以在Pathlib模块中找到一些很棒的东西(在python 3. x中可用)。

import pathlibx = pathlib.PurePosixPath("C:\\Path\\To\\File\\myfile.txt").suffixprint(x)
# Output'.txt'

只是join全部pathlib suffixes

>>> x = 'file/path/archive.tar.gz'>>> y = 'file/path/text.txt'>>> ''.join(pathlib.Path(x).suffixes)'.tar.gz'>>> ''.join(pathlib.Path(y).suffixes)'.txt'

这是最简单的方法,可以在单线中同时获取文件名和扩展名。

fName, ext = 'C:/folder name/Flower.jpeg'.split('/')[-1].split('.')
>>> print(fName)Flower>>> print(ext)jpeg

与其他解决方案不同,您不需要为此导入任何包。

对于Funsies…只需收集字典中的扩展,并在一个文件夹中跟踪所有扩展。然后只需拉取您想要的扩展。

import os
search = {}
for f in os.listdir(os.getcwd()):fn, fe = os.path.splitext(f)try:search[fe].append(f)except:search[fe]=[f,]
extensions = ('.png','.jpg')for ex in extensions:found = search.get(ex,'')if found:print(found)

一个真正的一行,如果你喜欢正则表达式。即使中间有额外的“.”也没关系

import re
file_ext = re.search(r"\.([^.]+)$", filename).group(1)

查看结果:点击这里

试试这个:

files = ['file.jpeg','file.tar.gz','file.png','file.foo.bar','file.etc']pen_ext = ['foo', 'tar', 'bar', 'etc']
for file in files: #1if (file.split(".")[-2] in pen_ext): #2ext =  file.split(".")[-2]+"."+file.split(".")[-1]#3else:ext = file.split(".")[-1] #4print (ext) #5
  1. 获取列表中的所有文件名
  2. 分割文件名并检查倒数第二个扩展名,它是否在pen_ext列表中?
  3. 如果是,则将其与最后一个扩展名连接并将其设置为文件的扩展名
  4. 如果不是,那么就把最后一个扩展名作为文件的扩展名
  5. 然后再检查一下
a = ".bashrc"b = "text.txt"extension_a = a.split(".")extension_b = b.split(".")print(extension_a[-1])  # bashrcprint(extension_b[-1])  # txt

您可以使用以下代码拆分文件名和扩展名。

    import os.pathfilenamewithext = os.path.basename(filepath)filename, ext = os.path.splitext(filenamewithext)#print file nameprint(filename)#print file extensionprint(ext)

从Python中的文件名中提取扩展名

Python os模块的拆分

拆分文本函数将文件路径拆分为一个具有两个值的元组——根和扩展名。

import os# unpacking the tuplefile_name, file_extension = os.path.splitext("/Users/Username/abc.txt")print(file_name)print(file_extension)

使用Pathlib模块获取文件扩展名

获取文件扩展名的Pathlib模块

import pathlibpathlib.Path("/Users/pankaj/abc.txt").suffix#output:'.txt'

您可以使用结束来识别python中的文件扩展名

像下面的例子

for file in os.listdir():if file.endswith('.csv'):df1 =pd.read_csv(file)frames.append(df1)result = pd.concat(frames)

此方法将需要字典、列表或集合。您可以使用内置字符串方法使用“. endswith”。这将在文件末尾的列表中搜索名称,只需str.endswith(fileName[index])即可完成。这更适合获取和比较扩展名。

https://docs.python.org/3/library/stdtypes.html#string-methods

例1

dictonary = {0:".tar.gz", 1:".txt", 2:".exe", 3:".js", 4:".java", 5:".python", 6:".ruby",7:".c", 8:".bash", 9:".ps1", 10:".html", 11:".html5", 12:".css", 13:".json", 14:".abc"}for x in dictonary.values():str = "file" + xstr.endswith(x, str.index("."), len(str))

示例2:

set1 = {".tar.gz", ".txt", ".exe", ".js", ".java", ".python", ".ruby", ".c", ".bash", ".ps1", ".html", ".html5", ".css", ".json", ".abc"}for x in set1:str = "file" + xstr.endswith(x, str.index("."), len(str))

示例3:

fileName = [".tar.gz", ".txt", ".exe", ".js", ".java", ".python", ".ruby", ".c", ".bash", ".ps1", ".html", ".html5", ".css", ".json", ".abc"];for x in range(0, len(fileName)):str = "file" + fileName[x]str.endswith(fileName[x], str.index("."), len(str))

例4

fileName = [".tar.gz", ".txt", ".exe", ".js", ".java", ".python", ".ruby", ".c", ".bash", ".ps1", ".html", ".html5", ".css", ".json", ".abc"];str = "file.txt"str.endswith(fileName[1], str.index("."), len(str))

例子5,6,7有输出输入图片描述

例8

fileName = [".tar.gz", ".txt", ".exe", ".js", ".java", ".python", ".ruby", ".c", ".bash", ".ps1", ".html", ".html5", ".css", ".json", ".abc"];exts = []str = "file.txt"for x in range(0, len(x)):if str.endswith(fileName[1]) == 1:exts += [x]     

最简单的方法是使用mimtype,下面是示例:

import mimetypes
mt = mimetypes.guess_type("file name")file_extension =  mt[0]print(file_extension)

我知道我迟到了

这就是我的简单解决方案

file = '/foo/bar/whatever.ext'extension = file.split('.')[-1]print(extension)
#output will be ext