最佳答案
我正在处理一些千兆字节的文本文件,希望使用 PowerShell 对它们进行一些流处理。这很简单,只要解析每一行并提取一些数据,然后将其存储在数据库中。
不幸的是,get-content | %{ whatever($_) }
似乎将管道的这个阶段的整个行集保存在内存中。它的速度也慢得惊人,实际上要花很长时间才能读完。
所以我的问题分为两部分:
get-content
上的迭代似乎比 C # 脚本慢100倍。我希望我在这里做了什么蠢事比如错过了 -LineBufferSize
参数之类的。