如何排序字符串列表?

在Python中创建按字母顺序排序的列表的最佳方法是什么?

649328 次浏览
list.sort()

真的就是这么简单:)

基本的回答:

mylist = ["b", "C", "A"]
mylist.sort()

这将修改您的原始列表(即就地排序)。要获得列表的排序副本,而不改变原始列表,使用sorted()函数:

for x in sorted(mylist):
print x

然而,上面的例子有点幼稚,因为它们没有考虑区域设置,而是执行区分大小写的排序。您可以利用可选参数key来指定自定义排序顺序(使用cmp的替代方法是不推荐的解决方案,因为它必须计算多次- key只计算每个元素一次)。

因此,要根据当前语言环境进行排序,要考虑到特定于语言的规则(cmp_to_key是functools中的帮助函数):

sorted(mylist, key=cmp_to_key(locale.strcoll))

最后,如果你需要,你可以指定一个自定义区域来排序:

import locale
locale.setlocale(locale.LC_ALL, 'en_US.UTF-8') # vary depending on your lang/locale
assert sorted((u'Ab', u'ad', u'aa'),
key=cmp_to_key(locale.strcoll)) == [u'aa', u'Ab', u'ad']

最后注意:你会看到使用lower()方法的不区分大小写排序的例子——这些是不正确的,因为它们只适用于字符的ASCII子集。对于任何非英语数据,这两个都是错误的:

# this is incorrect!
mylist.sort(key=lambda x: x.lower())
# alternative notation, a bit faster, but still wrong
mylist.sort(key=str.lower)

但是这是如何处理特定于语言的排序规则的呢?它是否考虑了地区因素?

不,list.sort()是一个泛型排序函数。如果希望根据Unicode规则进行排序,则必须定义一个自定义排序键函数。你可以尝试使用pyuca模块,但我不知道它是否完整。

同样值得注意的是sorted()函数:

for x in sorted(list):
print x

这将返回一个新的、排序的列表版本,而不改变原始列表。

对字符串进行排序的正确方法是:

import locale
locale.setlocale(locale.LC_ALL, 'en_US.UTF-8') # vary depending on your lang/locale
assert sorted((u'Ab', u'ad', u'aa'), cmp=locale.strcoll) == [u'aa', u'Ab', u'ad']


# Without using locale.strcoll you get:
assert sorted((u'Ab', u'ad', u'aa')) == [u'Ab', u'aa', u'ad']

前面的mylist.sort(key=lambda x: x.lower())示例可以很好地用于ascii上下文。

假设s = "ZWzaAd"

要在字符串上面排序,简单的解决方案是在字符串下面。

print ''.join(sorted(s))

请在Python3中使用sorted()函数

items = ["love", "like", "play", "cool", "my"]
sorted(items2)

或者:

names = ['Jasmine', 'Alberto', 'Ross', 'dig-dog']
print ("The solution for this is about this names being sorted:",sorted(names, key=lambda name:name.lower()))

老问题,但如果你想执行无需设置的语言环境感知排序 locale.LC_ALL,你可以通过使用这个答案建议的PyICU图书馆来执行:

import icu # PyICU


def sorted_strings(strings, locale=None):
if locale is None:
return sorted(strings)
collator = icu.Collator.createInstance(icu.Locale(locale))
return sorted(strings, key=collator.getSortKey)

然后用例如:

new_list = sorted_strings(list_of_strings, "de_DE.utf8")

这对我来说很有效,不需要安装任何区域设置或更改其他系统设置。

(这已经被建议在上面的评论中,但我想给它更突出,因为我自己一开始错过了它。)

l =['abc' , 'cd' , 'xy' , 'ba' , 'dc']
l.sort()
print(l1)

结果

['abc', 'ba', 'cd', 'dc', 'xy']

这很简单: https://trinket.io/library/trinkets/5db81676e4 < / p >
scores = '54 - Alice,35 - Bob,27 - Carol,27 - Chuck,05 - Craig,30 - Dan,27 - Erin,77 - Eve,14 - Fay,20 - Frank,48 - Grace,61 - Heidi,03 - Judy,28 - Mallory,05 - Olivia,44 - Oscar,34 - Peggy,30 - Sybil,82 - Trent,75 - Trudy,92 - Victor,37 - Walter'

scores = scores.split(',') 对于已排序的x(分数): 打印(x) < / p >