在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
“小骆驼”的“正则表达式“部分学习总结:
一、匹配语法: 1、".":任意单字符(‘\n‘除外); 2、“*“:匹配前项0~n次; 3、“+“:匹配前项1~n次; 4、“?”:匹配前项0~1次; 5.1、“\1"或"\2“:反向引用; 5.2、“\g{N}":方向引用,如果N为负数,则为相对反响引用; 6、“|”:“或“匹配(注意左边的条件可以屏蔽右边的条件); 7.1、“[]”:字符集单一字符匹配; 7.2、"[^]“:反向字符集单一字符匹配; 8.1、“\d":[0-9](反向匹配:"\D");“[\d\D]":任意字符(包括‘\n‘); 8.2、“\w":[A-Za-z0-9_](反向匹配:"\W"); 8.3、"\s":[\f\t\n\r ](反向匹配:"\S");(注意最后有空格); 8.4、"\h":[\t ];(匹配横向空白,注意最后有空格) 8.5、"\v":[\f\n\r];(匹配纵向空白) 8.6、“\R":跨造作系统断行匹配; 9、"//"或“m//"或“m<>"或“m%%"等等:模式匹配; 10.1、“/i":大小写无关修饰符; 10.2、“/s":使能“."匹配'\n'修饰符; 10.3、“/x":忽略模式空白与注释(‘#‘后部分); 11.1、“^":行首锚位; 11.2、“$":行尾锚位;(“\^\s*$\“:匹配任意空白行) 11.3、“\b“:单词锚位(以‘\w‘为准,方向匹配\B);("\bansersion"和“\bansersion\B"匹配:ansersiona, ansersion__ab134,但前者匹配ansersion,后者则不匹配) 12、“=~":绑定操作; 13、"($val)":使用变量; 14.1、“$1"或"$2"等等:"()"模式捕获变量; 14.2、“(?:xxx)":不捕获“xxx"之“$n"中,仅做分组; 14.3、“(?<label>xxx)":标签捕获,捕获结果位于“%+“中,引用key为“label";(方向引用“\1“和"\g{1}"需更改为\g{label}或\k<label>)(perl 5.010特性) 14.4、“ $`; $&; $' ":匹配字符串之前部分;匹配字符串部分;匹配字符串之后部分; 15、"{a}; {a,b}; {a,}":匹配a次;匹配a到b次;匹配a及a以上次;(无"{,b}",否则任意字符串会匹配成功——匹配0次) 16、"*?"; "+?"; "{a,}?", "{a,b}?":量词的“非贪婪匹配“,即通过递增索引来匹配(常规情况为“贪婪匹配“,即通过递减来匹配); 17、(?=exp);(?<=exp);(?!exp);(?<!exp):零宽断言。
二、处理语法 1、"s/a/b/":b替换首次出现的a; 2、“s/a/b/g":b替换全部的a; 3、界定符说明:“s/a/b/",“s{a}{b}",“s[a](b)",“s<a>#b#",及其它等效; 4、修饰符:"\g"全局替换,"\i",“\x"等同“匹配语法”;"/m"多行匹配; 5、绑定操作:同“匹配语法”; 6、大写转换:\U:后续字符串大写替换。"s/(a)/\U$1/","s/(a)/\U$1\Exxx/"(“\E“取消“\U”对xxx影响);“\u“单一字符大写替换:s/(a)/\u\L$1/ig(首字母大写); 7、小写转换:\L;\l同“大写转换“; 8、字符串分割(split):@fields = split /separator/, $string; 9、字符串拼接(join):my $result = join $glue, @pieces;(@pieces必须含2个或2个以上元素)
三、其他 1、优先级:
2、测试程序: #!/usr/bin/perl while(<>) { 3、常用字符串匹配与处理: (1)提取字符串字母部分: my @words = ($text =~ /([a-z]+/g); my $result = join "", @words; (2)提取记录hash: my %students = ($text =~ /(?<ID>\w+)\s+(?<Name>\w+)/g); |
请发表评论