正则表达式

正则表达式 (Regular Expression) : 是一个用来匹配字符串的特殊字符串(普通字符 + 特殊字符[元字符])

reference

正则表达式30分钟入门教程
Runoob - 正则表达式
揭开正则表达式的神秘面纱
Regex101
RegexLearn
Learn RegEx step by step, from zero to advanced.

正则字符

非打印字符

非打印字符	描述
`\cx`	匹配由x指明的控制字符。例如， `\cM` 匹配一个 Control-M 或回车符。x 的值必须为 A-Z 或 a-z 之一。否则，将 c 视为一个原义的 'c' 字符
`\f`	匹配一个换页符。等价于 `\x0c` 和 `\cL`
`\n`	匹配一个换行符。等价于 `\x0a` 和 `\cJ`
`\r`	匹配一个回车符。等价于 `\x0d` 和 `\cM`
`\t`	匹配一个制表符。等价于 `\x09` 和 `\cI`
`\v`	匹配一个垂直制表符。等价于 `\x0b` 和 `\cK`
`\s`	匹配任何空白字符，包括空格、制表符、换页符等等。等价于 `[ \f\n\r\t\v]`
`\S`	匹配任何非空白字符。等价于 `[^ \f\n\r\t\v]`
`\d`	匹配任何数字。等价于 `[0-9]`
`\D`	匹配非数字。等价于 `[^0-9]`
`\w`	匹配单词字符。等价于 `[a-zA-Z_0-9]`
`\W`	匹配非单词字符。等价于 `[^a-zA-Z_0-9]`

特殊字符

特别字符	描述
`$`	匹配输入字符串的结尾位置。如果设置了 RegExp 对象的 Multiline 属性，则 `$` 也匹配 `\n` 或 `\r`。要匹配 `$` 字符本身，请使用 `\$`
`( )`	标记一个子表达式的开始和结束位置。子表达式可以获取供以后使用。要匹配这些字符，请使用 `\(` 和 `\)`
`*`	匹配前面的子表达式零次或多次。要匹配 `` 字符，请使用 `\`
`+`	匹配前面的子表达式一次或多次。要匹配 `+` 字符，请使用 `\+`
`.`	匹配除换行符 `\n` 之外的任何单字符。要匹配 `.` ，请使用 `\.`
`[`	标记一个中括号表达式的开始。要匹配 `[`，请使用 `\[`
`?`	匹配前面的子表达式零次或一次，或指明一个非贪婪限定符。要匹配 ? 字符，请使用 `\?`
`\`	将下一个字符标记为或特殊字符、或原义字符、或向后引用、或八进制转义符。例如， `n` 匹配字符 'n'。`\n` 匹配换行符。序列 `\\` 匹配 `\`，而 `\(` 则匹配 `(`
`^`	匹配输入字符串的开始位置，除非在方括号表达式中使用，此时它表示不接受该字符集合。要匹配 `^` 字符本身，请使用 `\^`
`{`	标记限定符表达式的开始。要匹配 `{`，请使用 `\{`
`	`

限定符

指定正则表达式的一个给定组件必须要出现多少次才能满足匹配。有 * 或 + 或 ? 或 {n} 或 {n,} 或 {n,m} 共6种。

限定符	描述
`*`	匹配前面的子表达式零次或多次。例如，zo* 能匹配 "z" 以及 "zoo"。`*` 等价于`{0,}`
`+`	匹配前面的子表达式一次或多次。例如，'zo+' 能匹配 "zo" 以及 "zoo"，但不能匹配 "z"。`+` 等价于 `{1,}`
`?`	匹配前面的子表达式零次或一次。例如，"do(es)?" 可以匹配 "do" 或 "does" 中的"do" 。`?` 等价于 `{0,1}`
`{n}`	n 是一个非负整数。匹配确定的 n 次。例如，`o{2}` 不能匹配 "Bob" 中的 'o'，但是能匹配 "food" 中的两个 o
`{n,}`	n 是一个非负整数。至少匹配n 次。例如，`o{2,}` 不能匹配 "Bob" 中的 'o'，但能匹配 "foooood" 中的所有 o。`o{1,}` 等价于 `o+`。`o{0,}` 则等价于 `o*`
`{n,m}`	m 和 n 均为非负整数，其中n <= m。最少匹配 n 次且最多匹配 m 次。例如，`o{1,3}` 将匹配 "fooooood" 中的前三个 o。`o{0,1}` 等价于 `o?`。请注意在逗号和两个数之间不能有空格

定位符

将正则表达式固定到行首或行尾

定位符	描述
`^`	匹配输入字符串开始的位置。如果设置了 RegExp 对象的 Multiline 属性，`^` 还会与 `\n` 或 `\r` 之后的位置匹配
`$`	匹配输入字符串结尾的位置。如果设置了 RegExp 对象的 Multiline 属性，`$` 还会与 `\n` 或 `\r` 之前的位置匹配
`\b`	匹配一个字边界，即字与空格间的位置
`\B`	非字边界匹配

预定义字符类

符号	意义
.	任何字符（与行结束符可能匹配也可能不匹配）
`\d`	数字: `[0-9]`
`\D`	非数字： `[^0-9]`
`\s`	空白字符：`[ \t\n\x0B\f\r]`
`\S`	非空白字符：`[^\s]`
`\w`	单词字符：`[a-zA-Z_0-9]`
`\W`	非单词字符：`[^\w]`

Greedy 数量词
符号意义
X? X，一次或一次也没有
X* X，零次或多次
X+ X，一次或多次
X{n} X，恰好n次
X{n,} X，至少n次
X{n,m} X，至少n次，但是不超过m次

范围表示

符号	意义
`[abc]`	a、b 或 c（简单类）
`[^abc]`	任何字符，除了 a、b 或 c（否定）
`[a-zA-Z]`	a 到 z 或 A 到 Z，两头的字母包括在内（范围）
`[a-d[m-p]]`	a 到 d 或 m 到 p：`[a-dm-p]`（并集）
`[a-z&&[def]]`	d、e 或 f（交集）
`[a-z&&[^bc]]`	a 到 z，除了 b 和 c：`[ad-z]`（减去）
`[a-z&&[^m-p]]`	a 到 z，而非 m 到 p：`[a-lq-z]`（减去）

常用的一些正则表达式
符号意义
[^\\u4E00-\\u9FA5] 非中文
[^A-Za-z] 非英文
[^0-9] 非数字
[^A-Za-z\\u4E00-\\u9FA5] 非中文或英文
[^A-Za-z0-9] 非英文或数字
[^A-Za-z0-9_] 非因为或数字或下划线