在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
你曾经是否想要把一个大文件分割成多个小文件?比如一个5gb日志文件,我们需要把它分成多个小文件,这样我们才有可能使用普通的文本编辑器读取它。有时我们需要传输20gb的大文件到另一台服务器,这就需要我们把它分割成多个文件,这样便于传输数据。下面我们来讲解使用split命令来切割文件的方法。 复制代码 代码如下:[root@localhost database]# ls -lh gkdb.db -r--r--r-- 1 root root 411M Jul 23 17:20 gkdb.db 将将这个276M文件分割成20M的小文件,文件分割操作如下: 复制代码 代码如下:[root@localhost database]# split -b 20m gkdb.db gkdb_pack_ split 是命今。 -B 20M 是指将每个分卷文件最大20M 。 gkdb.db 需要分割的文件。 gkdb_pack_ 是指分割后的文件开头, 分割后后的文件名一般为 gkdb_pack_aa、gkdb_pack_ab、gkdb_pack_ac依次类推。 显示分割后的文件名及大小 复制代码 代码如下:[root@localhost database]# ll -lh gkdb_pack_a* -rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_aa -rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_ab -rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_ac -rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_ad -rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_ae -rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_af -rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_ag -rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_ah -rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_ai -rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_aj -rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_ak -rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_al -rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_am -rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_an -rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_ao -rw-r--r-- 1 root root 20M Jul 27 16:10 gkdb_pack_ap -rw-r--r-- 1 root root 20M Jul 27 16:10 gkdb_pack_aq -rw-r--r-- 1 root root 20M Jul 27 16:10 gkdb_pack_ar -rw-r--r-- 1 root root 20M Jul 27 16:10 gkdb_pack_as -rw-r--r-- 1 root root 20M Jul 27 16:10 gkdb_pack_at -rw-r--r-- 1 root root 11M Jul 27 16:10 gkdb_pack_au 最下面的那个文件是剩余的文件。 20*20+11=411MB 合并文件 复制代码 代码如下:[root@localhost database]# cat gkdb_pack_*>gkdb.tar.gz 组装前和组装后的MD5值都是一样的,不信的话可以使用md5sum命令来检测一下。 如果要分割的是一个文本文件,比如有好几千行,当然每行的字符数是不等的,想要以行数为分割,比如每100行生成1个文件,只需要 -l 参数,如下: 复制代码 代码如下:[root@pps public_rw]# split -l 100 test.txt 其实,如果不加任何参数,默认情况下是以1000行大小来分割的。 实例1、以每个文件1000行分割 复制代码 代码如下:$ split mylog $ wc -l * 4450 mylog 1000 xaa 1000 xab 1000 xac 1000 xad 450 xae 实例2、以每个文件20MB分割 复制代码 代码如下:$ split -b 20M logdata $ ls -lh | tail -n +2 -rw------- 1 sathiya sathiya 102M Jul 25 18:47 logdata -rw------- 1 sathiya sathiya 20M Jul 25 19:20 xaa -rw------- 1 sathiya sathiya 20M Jul 25 19:20 xab -rw------- 1 sathiya sathiya 20M Jul 25 19:20 xac -rw------- 1 sathiya sathiya 20M Jul 25 19:20 xad -rw------- 1 sathiya sathiya 20M Jul 25 19:20 xae -rw------- 1 sathiya sathiya 1.6M Jul 25 19:20 xaf 实例3、以每个文件50MB指定前缀分割 复制代码 代码如下:$ split --bytes=50M logdata mydatafile $ ls -lh total 204M -rw------- 1 sathiya sathiya 102M Jul 25 18:47 logdata -rw------- 1 sathiya sathiya 50M Jul 25 19:23 mydatafileaa -rw------- 1 sathiya sathiya 50M Jul 25 19:23 mydatafileab -rw------- 1 sathiya sathiya 1.6M Jul 25 19:23 mydatafileac 实例4、基于行数分割文件 复制代码 代码如下:$ wc -l testfile 2591 testfile $ split -l 1500 testfile importantlog $ wc -l * 1500 importantlogaa 1091 importantlogab 2591 testfile 实例5、以数字后缀命名分割文件 复制代码 代码如下:$ split -d testfile $ ls testfile x00 x01 x02 |
请发表评论