最佳答案
嗨,我想知道为什么下面的代码使用正则表达式分割字符串
#include<regex>
#include<vector>
#include<string>
std::vector<std::string> split(const std::string &s){
static const std::regex rsplit(" +");
auto rit = std::sregex_token_iterator(s.begin(), s.end(), rsplit, -1);
auto rend = std::sregex_token_iterator();
auto res = std::vector<std::string>(rit, rend);
return res;
}
int main(){
for(auto i=0; i< 10000; ++i)
split("a b c", " ");
return 0;
}
比下面的 Python 代码慢
import re
for i in range(10000):
re.split(' +', 'a b c')
这是
> python test.py 0.05s user 0.01s system 94% cpu 0.070 total
./test 0.26s user 0.00s system 99% cpu 0.296 total
我在 osx 上使用 clang + + 。
用 -O3进行编译使其降低到 0.09s user 0.00s system 99% cpu 0.109 total