我有一些字符串,里面有各种不同的表情符号/图像/符号。
并不是所有的字符串都是英语——其中一些是其他非拉丁语言,例如:
▓ railway??
→ Cats and dogs
I'm on 🔥
Apples ⚛
✅ Vi sign
♛ I'm the king ♛
Corée ♦ du Nord ☁ (French)
gjør at både ◄╗ (Norwegian)
Star me ★
Star ⭐ once more
早上好 ♛ (Chinese)
Καλημέρα ✂ (Greek)
another ✓ sign ✓
добрай раніцы ✪ (Belarus)
◄ शुभ प्रभात ◄ (Hindi)
✪ ✰ ❈ ❧ Let's get together ★. We shall meet at 12/10/2018 10:00 AM at Tony's.❉
...还有更多这样的例子。
我想去掉所有这些符号/图像,只保留不同语言的字母(和标点符号)。
我尝试使用EmojiParser图书馆来清除这些符号:
String withoutEmojis = EmojiParser.removeAllEmojis(input);
问题是EmojiParser不能删除大部分符号。♦符号是迄今为止我发现的唯一一个被移除的符号。
其他标志,如:✿❉★❈❧✿❋●✿♛🔥不移除
有没有办法从输入字符串中删除所有这些符号,只保留不同的语言中的字母和标点符号?