在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
下午和群里的朋友争论了一下,有关awk和perl处理文本的速度,自己一直比较推崇perl,对awk知之甚少,结果就想当然的觉得perl快,结果一番争吵后,觉得还是实验一下靠谱,(其实是想证明一下perl确实很快……唉,找虐啊) 先是制造了一个文本,1200万行,大致内容如下 row.txt: row1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 row2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 row3 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 就是类似这种文本 然后就是用awk和perl,分别计算第四列的和
time awk '{ sum += $4 } END { printf "%.2f\n", sum }' row.txt 36000003.00 real 0m4.020s user 0m3.716s sys 0m0.288s time perl -ne '$sum+=$1 if /(?:.*?\s.*?){2}\s(\d).*/ ; END{printf "%.2f\n",$sum}' row.txt 36000003.00 real 0m17.635s user 0m17.320s sys 0m0.256s 唉,正儿八经的扇了一回脸啊…… 其实也正常,awk是C写的,而且对与列处理有专门的调优,这样比较一定是awk快的,只是自己对awk和sed一直有偏见,觉得有perl就用不上这俩货,结果…… 记录下,给自己提个醒儿,以后没实践过的时候,不要乱说话…… T^T |
请发表评论