我怎么能写一个正则表达式,只匹配字母?
使用字符集:[a-zA-Z]匹配a - z中的一个小写字母和大写字母。[a-zA-Z]+匹配一个或多个字母,^[a-zA-Z]+$只匹配由一个或多个字母组成的字符串(^和$分别标记字符串的开始和结束)。
[a-zA-Z]
[a-zA-Z]+
^[a-zA-Z]+$
^
$
如果你想匹配除A-Z之外的其他字母,你可以将它们添加到字符集:[a-zA-ZäöüßÄÖÜ]。或者使用预定义的字符类,如Unicode字符属性类\p{L},它描述了作为字母的Unicode字符。
[a-zA-ZäöüßÄÖÜ]
\p{L}
如果您对拉丁字母以外的字母感兴趣,\p{L}将匹配任何Unicode字母
/[a-zA-Z]+/
非常简单的例子。正则表达式在网上非常容易找到。
http://www.regular-expressions.info/reference.html
这取决于你对“性格”的理解:
[A-Za-z] -所有字母(大写和小写)
[A-Za-z]
[^0-9] -所有非数字字符
[^0-9]
对于PHP,下面的代码就可以了
'/^[a-zA-Z]+$/'
如果你的意思是任何字符编码中的任何字母,那么一个好的方法可能是删除非字母,如空格\s,数字\d,以及其他特殊字符,如:
\s
\d
[!@#\$%\^&\*\(\)\[\]:;'",\. ...more special chars... ]
或者用上述否定的否定来直接描述任何字母:
\S \D and [^ ..special chars..]
优点:
缺点:
只需使用\w或[:alpha:]即可。它是一个转义序列,只匹配可能出现在单词中的符号。
\w
[:alpha:]
pattern = /[a-zA-Z]/
输入“[a-zA-Z]: #{模式。match("mine blossom")}"好的
[a-zA-Z]: #{pattern.match("456")}"
[a-zA-Z]: #{pattern.match("")}"
put "[a-zA-Z]: #{pattern.match("#$%^&*")}"
把“(a-zA-Z): # {pattern.match(" # $ % ^和* ")}" 好吧
您可以尝试这个正则表达式:[^\W\d_]或[a-zA-Z]。
[^\W\d_]
最接近的选择是
[\u\l]+
匹配大写字母和小写字母的序列。但是,并非所有编辑器/语言都支持它,因此使用它可能更安全
正如其他用户所说
你可以用
/[a-z]/gi
[]——检查给定输入之间的任何字符
A-z,涵盖了整个字母表
G -----在整个字符串中
我-----得到大写和小写
Pattern pattern = Pattern.compile("^[a-zA-Z]+$"); if (pattern.matcher("a").find()) { ...do something ...... }
正则表达式,很少有人写为“/^[a-zA-Z]$/i”是不正确的,因为在最后他们提到了/我,这是不区分大小写的,在第一次匹配后,它将返回。而不是/我只是使用/ g,这是全局的,你也没有任何需要把^ $作为开始和结束。
/[a-zA-Z]+/g
Java:
String s= "abcdef"; if(s.matches("[a-zA-Z]+")){ System.out.println("string only contains letters"); }
使用字符组
\D
匹配除数字0-9以外的任何字符
^\D+$
参见示例在这里
最近,我在我的表单中使用了这种模式来检查人名,包括字母、空格和特殊字符,如重音符号。
pattern="[A-zÀ-ú\s]+"
JavaScript
如果你想返回匹配的字母:
# eyz0 // # eyz1
如果你想用星号('*')替换匹配的字母,例如:
('Example 123').replace(/[A-Z]/gi, '*') //结果:“;****** 123"*
('Example 123').replace(/[A-Z]/gi, '*')
/^[A-z]+$/.test('asd') // true /^[A-z]+$/.test('asd0') // false /^[A-z]+$/.test('0asd') // false
在python中,我发现了以下工作:
这是因为我们正在创建一个新的字符类(# EYZ0),它排除了(^)类\W中的任何字符(所有不是在[a-zA-Z0-9_]中的字符),也排除了任何数字(\d),也排除了下划线(_)。
\W
[a-zA-Z0-9_]
_
也就是说,我们已经取了字符类[a-zA-Z0-9_],并删除了0-9和_位。你可能会问,写[a-zA-Z]不是比写[^\W\d_]更简单吗?如果只处理ASCII文本,您将是正确的,但当处理unicode文本时:
0-9
\ W 匹配任何非单词字符的字符。这是\w的反义词。>如果使用了ASCII标志,这就相当于[^a-zA-Z0-9_]。
\ W
匹配任何非单词字符的字符。这是\w的反义词。>如果使用了ASCII标志,这就相当于[^a-zA-Z0-9_]。
^从python re模块文档
也就是说,我们取unicode中所有被认为是单词字符的字符,删除unicode中所有被认为是数字字符的字符,并删除下划线。
例如,下面的代码片段
import re regex = "[^\W\d_]" test_string = "A;,./>>?()*)&^*&^%&^#Bsfa1 203974" re.findall(regex, test_string)
返回
['A', 'B', 's', 'f', 'a']
所以,我读了很多答案,大部分答案都没有考虑到例外情况,比如有重音的字母或变音(á, à, ä等)。
我在typescript中编写了一个函数,该函数应该几乎可以外推到任何可以使用RegExp的语言。这是我个人在TypeScript中的对于我的用例实现。我所做的基本上是为我想添加的每种符号添加字母范围。在应用RegExp之前,我还将字符转换为大写,这为我节省了一些工作。
function isLetter(char: string): boolean { return char.toUpperCase().match('[A-ZÀ-ÚÄ-Ü]+') !== null; }
如果您想添加具有另一种重音的另一个字母范围,只需将其添加到正则表达式。特殊符号也是如此。
我用TDD实现了这个功能,我可以确认这至少适用于以下情况:
character | isLetter ${'A'} | ${true} ${'e'} | ${true} ${'Á'} | ${true} ${'ü'} | ${true} ${'ù'} | ${true} ${'û'} | ${true} ${'('} | ${false} ${'^'} | ${false} ${"'"} | ${false} ${'`'} | ${false} ${' '} | ${false}