下面的代码将替换 ASCII 控制字符([\x00-\x1F\x7F]
的简写) :
my_string.replaceAll("\\p{Cntrl}", "?");
以下代码将替换所有 ASCII 不可打印字符([\p{Graph}\x20]
的简写) ,包括重音字符:
my_string.replaceAll("[^\\p{Print}]", "?");
但是,这两种方法都不适用于 Unicode 字符串。是否有人有好的方法从 Unicode 字符串中删除不可打印的字符?