我需要从字符串中删除所有不在a-z A-Z 0-9集中或不是空格的字符。
a-z A-Z 0-9
有人有函数来做这个吗?
听起来好像你已经知道你想做什么了,你基本上把它定义为一个正则表达式。
preg_replace("/[^A-Za-z0-9 ]/", '', $string);
正则表达式是你的答案。
$str = preg_replace('/[^a-z\d ]/i', '', $str);
i
^
\d
a-z
a
z
A-Z
对于unicode字符,它是:
preg_replace("/[^[:alnum:][:space:]]/u", '', $string);
这里有一个非常简单的正则表达式:
\W|_
并在需要时使用(带有正向/斜杠分隔符)。
/
preg_replace("/\W|_/", '', $string);
在这里用这个伟大的工具测试它,它解释了正则表达式在做什么:
http://www.regexr.com/
preg_replace("/\W+/", '', $string)
你可以在这里测试:http://regexr.com/
[\W_]+
$string = preg_replace("/[\W_]+/u", '', $string);
它会选择所有非A-Z, A-Z, 0-9,然后删除它。
参见示例:https://regexr.com/3h1rj
如果你需要支持其他语言,而不是典型的A-Z语言,你可以使用以下:
preg_replace('/[^\p{L}\p{N} ]+/', '', $string);
[^\p{L}\p{N} ]
\p{L}
\p{N}
+
这将保存来自其他语言和脚本的字母和数字,以及A-Z:
preg_replace('/[^\p{L}\p{N} ]+/', '', 'hello-world'); // helloworld preg_replace('/[^\p{L}\p{N} ]+/', '', 'abc@~#123-+=öäå'); // abc123öäå preg_replace('/[^\p{L}\p{N} ]+/', '', '你好世界!@£$%^&*()'); // 你好世界
这是一个很老的问题,但仍然有意义。我回答这个问题纯粹是想提供一些补充信息,对将来的访问者可能有用。