C#正则学习

OStack程序员社区-中国程序员成长平台 › 门户 › 编程› c#›C#教程

原作者: [db:作者] 来自: [db:来源] 收藏邀请

正则的力量无法小觑，短短的几个字符，往往胜过几十行的代码，大大可以简化我们冗余的代码。

以前在js里用正则比较多，今天来熟悉下C#中正则的使用方法，权当笔记了！

如果把正则当做一门语言的话，那么正则的学习也和其他语言一样，从历史渊源到基本语法，从高级特性到性能优化，正则一样不少。

历史：

 正则表达式的“祖先”可以一直上溯至对人类神经系统如何工作的早期研究。Warren McCulloch 和 Walter Pitts 这两位神经生理学家研究出一种数学方式来描述这些神经网络。 　　1956 年, 一位叫 Stephen Kleene 的数学家在 McCulloch 和 Pitts 早期工作的基础上，发表了一篇标题为“神经网事件的表示法”的论文，引入了正则表达式的概念。正则表达式就是用来描述他称为“正则集的代数”的表达式，因此采用“正则表达式”这个术语。 　　随后，发现可以将这一工作应用于使用 Ken Thompson 的计算搜索算法的一些早期研究，Ken Thompson 是 Unix 的主要发明人。正则表达式的第一个实用应用程序就是 Unix 中的 qed 编辑器。 　　如他们所说，剩下的就是众所周知的历史了。从那时起直至现在正则表达式都是基于文本的编辑器和搜索工具中的一个重要部分。

基本语法字符：

\d (代表0-9的数字)

\D (代表除数字以外的其他字符)

\w (代表所有的单词字符-数字、字母、下划线)

\W (代表所有除单词字符外的字符)

\s (代表空白字符)

\S (代表除了空白字符以外的字符)

. (除了换行符外的任意字符)

[,,,] (匹配方括号内列出的所有字符)

[^,,,] (匹配方括号内列出的字符外的所有字符)

\b (匹配单词边界)

\B (匹配非单词边界)

^ (匹配字符开头位置)

$ (匹配字符结尾位置)

{n} (匹配n个符合条件的字符)

{n,m} (匹配n到m个符合条件的字符)

{n,} (匹配大于等于n个符合条件的字符)

？ (匹配1次或0次符合条件的字符)

+ (匹配一次或多次符合条件的字符)

* (匹配0次或多次符合条件的字符)

(a|b) (匹配符合a条件或者b条件的字符)

下面练习一些基本的例子来熟悉上面的基本语法

1.匹配3个数字，例如134

\d{3}

2.匹配一个单词以字母开头字母结尾中间是一个或多个数字，例如a123b

^[a-zA-Z]\d+[a-zA-Z]$

3.匹配固定电话例如 021-81234563 或者 0512-81755456

^\d{3,4}-\d{8}

4.匹配正整数

[1-9][0-9]*

5.匹配两位小数

(([0-9][1-9]*)|([1-9][0-9]*))+\.\d{2}

6.匹配邮政编码

^\d{6}$

7.匹配手机号码

^[1][3-9]\d{9}$

8.匹配身份证号码

^\d{18}$)|^\d{15}$

9.匹配汉字

^[\u4e00-\u9fa5]{1,}$

10.匹配URL

^http(s)?([\w-]+\.)+(\w-)+(/[\w-./?%&=]*)?$

上述是基本的使用语法，让我们来看看C#中是如何使用它们的

System.Text.RegularExpressions.Regex 这个事C#正则的使用类

他提供了如下方法来使用正则

1.IsMatch 是否匹配-示例代码:

1 //验证手机号码
2     public bool IsMobile(string mobile) {
3         return System.Text.RegularExpressions.Regex.IsMatch(mobile, @"^[1][3-9]\d{9}$");
4     }

2.Split 根据条件切割字符串

示例代码

//根据数字拆分字符串
    public String[] SplitStr(String str) {
        return System.Text.RegularExpressions.Regex.Split(str, @"[0-9]");
    }

    protected void btn_split_Click(object sender, EventArgs e) {
        string[] Result = SplitStr(this.tb_pwd.Text);
        int Len = Result.Length;
        for (int i = 0; i < Len; i++) {
            if (Result[i] != "") {
                Response.Write("<script>alert('拆分为！" + Result[i] + "')</script>");
            }
        }
    }

3.Replace

替换字符串

1     //替换字符串中的所有数字为指定字符
2     public String ReplaceWord(string str1, string str2) {
3         return System.Text.RegularExpressions.Regex.Replace(str1, @"\d", str2);
4     }

4.Matches

获取匹配集合

 1 //验证重复出现的词(正则需要优化)
 2     public String[] RepeatWords(string str) {
 3         System.Text.RegularExpressions.MatchCollection matches =
 4             System.Text.RegularExpressions.Regex.Matches(str, @"\b(?<word>\w+)\s+(\k<word>)\b", System.Text.RegularExpressions.RegexOptions.Compiled | System.Text.RegularExpressions.RegexOptions.IgnoreCase);
 5         int AIndex = matches.Count;
 6         if (AIndex != 0) {
 7             String[] RepeatWord = new string[AIndex];
 8             int i=0;
 9             foreach (System.Text.RegularExpressions.Match match in matches) {
10                 string word = match.Groups["word"].Value;
11                 RepeatWord[i] = word;
12                 i++;
13             }
14             return RepeatWord;
15         }
16         else {
17             return null;
18         }
19     }

正则的高级特性

1.分组和非捕获性分组

组是把符合括弧中组条件的字符保存起来，通过索引的方法供下面的匹配的调用

例如需要匹配 abc123abc

我们可以这样^(abc)123\1$,这里的（）即是一个需要捕获的组，他的条件是abc,这个时候在下一个位置，我们只要通过\1就可以重复利用上一次捕获过的值来匹配，如果有两个分组，那我们获取第二个分组就用\2

那在C#中如何利用呢？

string  x = "abc123abc";
Regex  r = new Regex(@"^(abc)123\1$");
if (r.IsMatch(x))
{
Console.WriteLine("group1 value:" + r.Match(x).Groups[1].Value);//输出：abc
}

这里为何是Groups[1]呢因为在匹配的时候第一个匹配的是符合所有条件的字符串，然后存储符合条件的组

我们也可以为组命名：

string  x = "abc123abc";
Regex  r = new Regex(@"^(?<test>abc)123\1$");
if (r.IsMatch(x))
{
Console.WriteLine("group1 value:" + r.Match(x).Groups["test"].Value);//输出：abc
}

这样是不是就更加形象了呢

有的时候我们想匹配组但是不想保存这个组匹配的内容，这个时候我们可以使用？：

1 string  x = "abc123abc";
2 Regex  r = new Regex(@"^(?:abc)123\1$");
3 if (r.IsMatch(x))
4 {
5 Console.WriteLine("group1 value:" + r.Match(x).Groups[1].Value);//输出：null
6 }

2.贪婪模式和非贪婪模式

一般情况下，正则都是贪婪模式，尤其是在+或者*修饰的条件下，正则都会去尽可能的匹配更多的内容，但是如果添加了？号，这个时候立马就会变成非贪婪模式

 1 string x = "Live for nothing,die for something";
 2 Regex r1 = new Regex(@".*thing");
 3 if (r1.IsMatch(x))
 4 {
 5 Console.WriteLine("match:" + r1.Match(x).Value);//输出：Live for nothing,die for something
 6 }
 7 Regex r2 = new Regex(@".*?thing");
 8 if (r2.IsMatch(x))
 9 {
10 Console.WriteLine("match:" + r2.Match(x).Value);//输出：Live for nothing
11 }

3.回溯与非回溯

在默认情况下正则匹配贪婪模式下，当匹配的字符陷入死胡同的时候，会进行回溯直到下一个字符能够接着匹配

比如 (.*)abc 来匹配123abc123abc 首先.*会进行贪婪匹配直到匹配到字符结尾的位置，接着匹配a,发现没有字符可以匹配上，引擎就向后回溯，直到a匹配到最后abc中的a，然后紧接着匹配b,然后匹配c 所以结果是 123abc123abc

好，接着来说明下非回溯模式的执行过程，同样首先.*像一只饿狼般的匹配到字符的结尾位置，这个时候开始匹配a 发现已经无法匹配，此模式下，不进行回溯，于是匹配失败，在有的业务下我们需要这样的非回溯匹配，语法例：(?>.*)abc

4.正向预搜索反向预搜索

不好解释，举例说明

正向预搜索

string x = "1024 used 2048 free";
Regex r1 = new Regex(@"\d{4}(?= used)");
if (r1.Matches(x).Count==1)
{
Console.WriteLine("r1 match:" + r1.Match(x).Value);//输出：1024
}
Regex r2 = new Regex(@"\d{4}(?! used)");
if (r2.Matches(x).Count==1)
{
Console.WriteLine("r2 match:" + r2.Match(x).Value); //输出：2048
}

r1表示匹配后面紧跟着used的四个数字于是乎匹配了1024 r2 匹配后面不是紧跟着used的四个数字于是乎匹配2048

反向预搜索

string x = "used:1024 free:2048";
Regex r1 = new Regex(@"(?<=used:)\d{4}");
if (r1.Matches(x).Count==1)
{
Console.WriteLine("r1 match:" + r1.Match(x).Value);//输出：1024
}
Regex r2 = new Regex(@"(?<!used:)\d{4}");
if (r2.Matches(x).Count==1)
{
Console.WriteLine("r2 match:" + r2.Match(x).Value);//输出：2048
}

r1匹配前面紧着着used:的四个数字于是乎匹配1024 r2匹配前面不是紧跟着used：的四个数字于是乎撇配2048

看着例子理解就很好理解了，另外正向和反向的组是不保存的

鲜花

握手

雷人

路过

鸡蛋

该文章已有0人参与评论

请发表评论

全部评论

专题导读

More+

10-27 六六分期app的软件客服如何联系？(六六分期

11-06 可心卡盟:win10系统火狐flash插件崩溃怎么

11-06 亲亲特价:怎么删除回收站图标

11-06 济南大学虚拟社区:鲁大师节能降温的具体办

11-06 xlueops.exe:无线网络安装向导

11-06 女斗合众国:win7系统cf与主机连接不稳定怎

11-06 0xc000022-[cf烟雾头]cf怎么调烟雾头

11-06 qizideyouhuo:应用程序无法正常启动0xc0000

11-06 ipz-185:win7系统vcf文件怎么打开

11-06 傻哥蹦迪:win10系统s4怎么打开usb调试

11-06 八神浩树gtaste:回收站清空了怎么恢复

11-06 妖尾之黑色守护:win10系统电脑没有1440x900

11-06 校园至尊魔王小说:win7系统浏览网页时字体

11-06 女斗合众国:win10系统访问共享文件夹提示请

11-06 tokyo hot n0654:恢复win7系统默认字体一招

11-06 雨酷仙境:设置win7系统转移临时文件夹腾出

11-06 阿穆纳伊之杖:win7系统开始菜单在右边还原

11-06 tunespotting:win10系统火狐flash插件总是

11-06 甘尔葛分析师：计谋网站seo关键词暴涨有什

11-06 蔡贵霖: 计谋网站seo关键词暴涨有什么秘密

11-06 博益网首页:ao3网页版进入不了解决方法

11-06 漏斗子专栏: 网站数据分析小白易懂精华篇

11-06 见证双虹怎么做:win7系统开启telnet命令的

11-06 颾狐蝶蜋:系统资源不足无法完成请求的服务

11-06 国光中学校歌:提交网站到alexa查询详细步骤

11-06 西安有情天:静态网页和动态网页的区别

11-06 红木雅尚斋:外部链接构造对网站的好处

11-06 前官礼遇：防止域名劫持–增强域安全性的10

11-06 密传二转答案: 中文分词算法有哪些

11-06 金泉家园邮编:百度快照劫持的表现及应对方

C#中的泛型发布时间：2022-07-10

C#Mid窗口的创建发布时间：2022-07-10

剪的笔顺,诠释剪的笔画,认识剪的部首

1 六六分期app的软件客服如何联系？(六六分期

六六分期app的软件客服如何联系？不知道吗？加qq群【895510560】即可！标题：六六分期

阅读：19185|2023-10-27

2 可心卡盟:win10系统火狐flash插件崩溃怎么

今天小编告诉大家如何处理win10系统火狐flash插件总是崩溃的问题，可能很多用户都不知

阅读：9988|2022-11-06

3 亲亲特价:怎么删除回收站图标

今天小编告诉大家如何对win10系统删除桌面回收站图标进行设置，可能很多用户都不知道

阅读：8325|2022-11-06

4 济南大学虚拟社区:鲁大师节能降温的具体办

今天小编告诉大家如何对win10系统电脑设置节能降温的设置方法，想必大家都遇到过需要

阅读：8695|2022-11-06

5 xlueops.exe:无线网络安装向导

我们在使用xp系统的过程中,经常需要对xp系统无线网络安装向导设置进行设置，可能很多

阅读：8638|2022-11-06

6 女斗合众国:win7系统cf与主机连接不稳定怎

今天小编告诉大家如何处理win7系统玩cf老是与主机连接不稳定的问题，可能很多用户都不

阅读：9655|2022-11-06

7 0xc000022-[cf烟雾头]cf怎么调烟雾头

电脑对日常生活的重要性小编就不多说了，可是一旦碰到win7系统设置cf烟雾头的问题，很

阅读：8622|2022-11-06

8 qizideyouhuo:应用程序无法正常启动0xc0000

我们在日常使用电脑的时候，有的小伙伴们可能在打开应用的时候会遇见提示应用程序无法

阅读：7998|2022-11-06

9 ipz-185:win7系统vcf文件怎么打开

今天小编告诉大家如何对win7系统打开vcf文件进行设置，可能很多用户都不知道怎么对win

阅读：8653|2022-11-06

10 傻哥蹦迪:win10系统s4怎么打开usb调试

今天小编告诉大家如何对win10系统s4开启USB调试模式进行设置，可能很多用户都不知道怎

阅读：7535|2022-11-06

客服电话

电子邮件

C#正则学习

请发表评论

全部评论

上一篇：

下一篇：

dphi-official/Machine_Learning_Bootcamp

nauzethc/ghost-material: Material Design

win7系统注册表编辑器打开的操作方法

CVE-2022-2135

CVE-2022-35902

剪的笔顺,诠释剪的笔画,认识剪的部首

六六分期app的软件客服如何联系？(六六分期

florent37/ViewAnimator: A fluent Android

florent37/Shrine-MaterialDesign2: implem

CVE-2020-36276

SimpleSoftwareIO/simple-sms: Send and re

关于我们

产品与服务

解决方案

139-2527-9053