博客
关于我
正则表达式的基本用法
阅读量:668 次
发布时间:2019-03-15

本文共 884 字,大约阅读时间需要 2 分钟。

正则表达式的基本用法

正则表达式是一种强大的工具,用来匹配一系列符合特定规则的字符串。它可以通过单个字符串描述一系列复杂的文本内容模式。

正则表达式的基本字符

原义字符包括字母、数字、符号以及特殊控制字符(如换行符、制表符等),这些字符通常都可以直接使用。例如:abc\n表示换行符。

元字符是一些具有特殊含义的符号,需要特定的处理方式。这些符号用于改变匹配模式的行为,常见的元字符包括: *(零或多次重复)、+(一次或多次重复)、?(零或一次)、\$(字符串末尾)、\^(字符串开头)等。

正则表达式的分类

字符类:用于将字符分组表示,系统内部同一组的清单

[abc]表示匹配a、b或c中的任意一个字符,而[^abc]则表示任何不在a、b、c中的字符。例如:^[a-z]$匹配一个长度为一个的字母;^[^a-z]匹配一个非字母字符。

范围类:表示字符的范围

[a-z]匹配一个大写字母,从a到z;[0-9]匹配一个数字字符。这些短写用途方便了编写表达式,例如:\d(数字),\D(非数字)。

预定义类:正则表达式中提供了一些预定义的字符类,简化了表达。例如:\s匹配任意空白字符(包括空格、制表符、换行等),\S则匹配非空白字符。同样,\w匹配单词字符(字母、数字、下划线),\W则匹配非单词字符。

.表示任意字符,除了换行符外还可能包含其他控制字符。通常会使用[. 韬]来明确表示包括换行符,但默认情况下.在多数引擎中不匹配换行符。

边界字符主要用于限定匹配的位置。例如,^表示匹配字符串的开头,$表示匹配字符串的结尾。为了更精确地控制单词边界,\b用来表示单词边界(字母与非字母位置的转换),\B表示非单词边界位置。例如:a\b表示两字以内以a结尾,而a\B表示a后面不是单词边界的位置。需要注意的是,这些边界在不同的引擎中有不同的实现方式和特性,需要根据具体需求选择合适的符号。

此外,正则表达式还支持使用括号(...)来创建子表达式。括号允许我们分割表达式,形成独立的子表达式,并在替换时以变量形式引用。例如,可以将日期格式转换成自定义格式的例子如下:

转载地址:http://isemz.baihongyu.com/

你可能感兴趣的文章
Net操作配置文件(Web.config|App.config)通用类
查看>>
net网络查看其参数state_dict,data,named_parameters
查看>>
Net连接mysql的公共Helper类MySqlHelper.cs带MySql.Data.dll下载
查看>>
NeurIPS(神经信息处理系统大会)-ChatGPT4o作答
查看>>
neuroph轻量级神经网络框架
查看>>
Neutron系列 : Neutron OVS OpenFlow 流表 和 L2 Population(7)
查看>>
new Blob()实现不同类型的文件下载功能
查看>>
New Concept English three (35)
查看>>
NEW DATE()之参数传递
查看>>
New Journey--工作五年所思所感小记
查看>>
new Queue(REGISTER_DELAY_QUEUE, true, false, false, params)
查看>>
New Relic——手机应用app开发达人的福利立即就到啦!
查看>>
new work
查看>>
new 一个button 然后dispose,最后这个button是null吗???
查看>>
NewspaceGPT的故事续写能力太强了
查看>>
NewspaceGPT绘制时序图
查看>>
NewspaceGPT绘制类图
查看>>
new一个对象的过程
查看>>
new和delete用法小结
查看>>
new对象时,JVM内部究竟藏了什么小秘密?
查看>>