如何从字符串中删除除破折号之外的所有非字母数字字符?

如何从字符串中删除除破折号和空格字符之外的所有非字母数字字符?

466468 次浏览

[^a-zA-Z0-9 -]替换为空字符串。

Regex rgx = new Regex("[^a-zA-Z0-9 -]");
str = rgx.Replace(str, "");

正则表达式是[^\w\s\-]*

最好使用\s而不是空格(),因为文本中可能有一个制表符。

你可以试试:

string s1 = Regex.Replace(s, "[^A-Za-z0-9 -]", "");

其中s是您的字符串。

我可以用RegEx,他们可以提供优雅的解决方案,但他们可能会导致性能问题

char[] arr = str.ToCharArray();


arr = Array.FindAll<char>(arr, (c => (char.IsLetterOrDigit(c)
|| char.IsWhiteSpace(c)
|| c == '-')));
str = new string(arr);

使用紧凑框架时(没有FindAll)

将FindAll替换为1

char[] arr = str.Where(c => (char.IsLetterOrDigit(c) ||
char.IsWhiteSpace(c) ||
c == '-')).ToArray();


str = new string(arr);

1作者:ShawnFeatherly

使用System. Linq

string withOutSpecialCharacters = new string(stringWithSpecialCharacters.Where(c =>char.IsLetterOrDigit(c) || char.IsWhiteSpace(c) || c == '-').ToArray());

我做了一个不同的解决方案,通过消除控制字符,这是我最初的问题。

这比列出所有“特殊但好”的字符要好

char[] arr = str.Where(c => !char.IsControl(c)).ToArray();
str = new string(arr);

它更简单,所以我认为它更好!

基于这个问题的答案,我创建了一个静态类并添加了这些。认为它可能对某些人有用。

public static class RegexConvert
{
public static string ToAlphaNumericOnly(this string input)
{
Regex rgx = new Regex("[^a-zA-Z0-9]");
return rgx.Replace(input, "");
}


public static string ToAlphaOnly(this string input)
{
Regex rgx = new Regex("[^a-zA-Z]");
return rgx.Replace(input, "");
}


public static string ToNumericOnly(this string input)
{
Regex rgx = new Regex("[^0-9]");
return rgx.Replace(input, "");
}
}

那么这些方法可以用作:

string example = "asdf1234!@#$";
string alphanumeric = example.ToAlphaNumericOnly();
string alpha = example.ToAlphaOnly();
string numeric = example.ToNumericOnly();

想来点快的吗?

public static class StringExtensions
{
public static string ToAlphaNumeric(this string self,
params char[] allowedCharacters)
{
return new string(Array.FindAll(self.ToCharArray(),
c => char.IsLetterOrDigit(c) ||
allowedCharacters.Contains(c)));
}
}

这将允许您指定要允许的字符。

使用Regex有一个更简单的方法。

private string FixString(string str)
{
return string.IsNullOrEmpty(str) ? str : Regex.Replace(str, "[\\D]", "");
}

我在这里使用了其中一个答案的变体。我想用“-”替换空格,这样它对SEO友好,并且小写。也不引用我的服务层的system.web。

private string MakeUrlString(string input)
{
var array = input.ToCharArray();


array = Array.FindAll<char>(array, c => char.IsLetterOrDigit(c) || char.IsWhiteSpace(c) || c == '-');


var newString = new string(array).Replace(" ", "-").ToLower();
return newString;
}

这是一个非正则表达式堆分配友好的快速解决方案,这是我一直在寻找的。

不安全版本。

public static unsafe void ToAlphaNumeric(ref string input)
{
fixed (char* p = input)
{
int offset = 0;
for (int i = 0; i < input.Length; i++)
{
if (char.IsLetterOrDigit(p[i]))
{
p[offset] = input[i];
offset++;
}
}
((int*)p)[-1] = offset; // Changes the length of the string
p[offset] = '\0';
}
}

对于那些不想使用不安全或不信任字符串长度黑客的人。

public static string ToAlphaNumeric(string input)
{
int j = 0;
char[] newCharArr = new char[input.Length];


for (int i = 0; i < input.Length; i++)
{
if (char.IsLetterOrDigit(input[i]))
{
newCharArr[j] = input[i];
j++;
}
}


Array.Resize(ref newCharArr, j);


return new string(newCharArr);
}

这是一个使用@阿塔答案作为灵感的扩展方法。

"hello-world123, 456".MakeAlphaNumeric(new char[]{'-'});// yields "hello-world123456"

或者如果您需要连字符以外的其他字符…

"hello-world123, 456!?".MakeAlphaNumeric(new char[]{'-','!'});// yields "hello-world123456!"




public static class StringExtensions
{
public static string MakeAlphaNumeric(this string input, params char[] exceptions)
{
var charArray = input.ToCharArray();
var alphaNumeric = Array.FindAll<char>(charArray, (c => char.IsLetterOrDigit(c)|| exceptions?.Contains(c) == true));
return new string(alphaNumeric);
}
}

如果你正在使用JS,这里有一个非常简洁的版本

myString = myString.replace(/[^A-Za-z0-9 -]/g, "");