最佳答案
我通常处理约20Gb 大小的文本文件,我发现自己经常计算给定文件中的行数。
我现在做的方式只是 cat fname | wc -l
,它需要很长的时间。有没有更快的办法?
我在一个安装了 Hadoop 的高性能集群中工作。
我希望解决方案像 wc -l
解决方案那样简单,只需运行一行代码,但不确定它的可行性。
有什么想法吗?