Java正则操作类Pattern和Matcher

2023-12-16 20:41:04

Java正则操作类Pattern和Matcher

  • Pattern类

Pattern位于java.util.regex包中,是正则表达式的编译表示形式,此类的实例是不可变的,可供多个并发线程安全使用。Pattern 类没有公共构造方法。要创建一个 Pattern 对象,你必须首先调用其公共静态compile方法,它返回一个 Pattern 对象。该方法接受一个正则表达式作为它的参数。

  • Pattern.split(CharSequence input)

split(CharSequence input)方法,用于分割字符串,返回一个String[]数组。如下:

public static void main(String[] args) {
????Pattern p = Pattern.compile("\\d+");
????String[] split = p.split("我的车牌号是京A123456这个车牌是我第100个靓号,我很喜欢。");
????for (String s : split) {
????????System.out.println(s);
????}
}

输出结果:

我的车牌号是京A

这个车牌是我第

个靓号,我很喜欢。

  • Pattern.matches(String regex,CharSequence input)

该静态方法用于快速匹配字符串,该方法适合用于只匹配一次,且匹配全部字符串。该方法与String对象的matches方法一致,如下:

System.out.println("12345".matches("\\d+")); ???// true
System.out.println("车牌号12345".matches("\\d+")); ???// false
System.out.println("123d45".matches("\\d+")); ???// false

System.out.println(Pattern.matches("\\d+", "123456")); ?// true
System.out.println(Pattern.matches("\\d+", "车牌号123456")); ?// false
System.out.println(Pattern.matches("\\d+", "123abc456")); ?// false

  • Pattern.matcher(CharSequence input)

返回一个Matcher对象。Pattern类只能做一些简单的匹配操作,要想得到更强更便捷的正则匹配操作,那就需要将Pattern与Matcher一起合作。Matcher对象的没有公开的构造器,需要通过Pattern.mathcer方法创建实例,Matcher类提供了对正则表达式的分组支持,以及对正则表达式的多次匹配支持。

Pattern pattern = Pattern.compile("\\d+");
Matcher matcher = pattern.matcher("4348东aldkf45赛发送");
matcher.pattern();//返回pattern 也就是返回创建本Matcher对象的Pattern对象

  • Matcher类

Matcher 对象是对输入字符串进行正则解释和匹配操作的引擎。与Pattern 类一样,Matcher 也没有公共构造方法。你需要调用 Pattern 对象的 matcher 方法来获得一个 Matcher 对象。

  • Matchermatches()lookingAt()和find()方法

Matcher类提供三个匹配操作方法,三个方法均返回boolean类型,当匹配到时返回true,没匹配到则返回false。但需要注意的是matches()方法对整个字符串进行匹配,只有当整个字符串都匹配正则规则时才返回true。

lookingAt()对从字符串的开始位置进行匹配,只有匹配到的字符串在最前面才返回true。代码如下:

Pattern p2 = Pattern.compile("\\d+");
Matcher m2 = p2.matcher("123abc456");
System.out.println(m2.lookingAt()); // true

Matcher m3 = p2.matcher("abc1234");
System.out.println(m3.lookingAt()); // false

find()对字符串进行匹配,匹配到的子字符串可以在子字符串的任何位置。该方法表示是否存在与该模式匹配的下一个子字符串。简单来说就是在字符某部分匹配上模式就会返回true,同时匹配位置会记录到当前位置,再次调用时从该处匹配下一个位置,因此一般使用find配合循环和group方法获取全部的匹配子串。

Pattern pattern = Pattern.compile("\\d+");
Matcher matcher = pattern.matcher("abc123de456fg");
System.out.println(matcher.find()); ????// true

循环获取字串:

Pattern pattern = Pattern.compile("\\d+");
Matcher matcher = pattern.matcher("abc123de456fg");
//System.out.println(matcher.find()); ????// true
while (matcher.find()){
????System.out.println(matcher.group());
}

输出:

123

456
  • Mathcer类的start()end()和group()方法

当使用matches(),lookingAt(),find()执行匹配操作后,可以利用以上三个方法得到更详细的信息。

  1. start()返回匹配到的子字符串的第一个字符在字符串中的起始索引位置.
  2. end()返回匹配到的子字符串的最后一个字符在字符串中的索引位置。
  3. group()返回匹配到的子字符串

因此下面这段代码:

String src = "abc123de456fg";
Pattern pattern = Pattern.compile("\\d+");
Matcher matcher = pattern.matcher(src);
while (matcher.find()){
????System.out.println(src.substring(matcher.start(), matcher.end()));
}

等价于:

String src = "abc123de456fg";
Pattern pattern = Pattern.compile("\\d+");
Matcher matcher = pattern.matcher(src);
while (matcher.find()){
????System.out.println(matcher.group());
}

start(),end(),group()均有一个对应的重载方法,分别是start(int i),end(int i),group(int i),它们专用于分组操作,Mathcer类还有一个groupCount()方法用于返回有多少组。

  • 捕获

捕获组是把多个字符当一个独立单元进行处理的方法,它通过对括号内的字符分组来创建。组号按照左括号来数,只认左括号。

例如,正则表达式(dog)创建了单一分组,组里包含"d","o",和"g"。

捕获组是通过从左至右计算其开括号来编号,数左括号,依次数左括号的数量。例如,在表达式((A)(B(C))),有四个这样的组:

((A)(B(C)))

(A)

(B(C))

(C)

可以通过调用matcher对象的groupCount方法来查看表达式有多少个分组。groupCount方法返回一个int值,表示matcher对象当前有多个捕获组。还有一个特殊的组(group(0)),它总是代表整个表达式。该组不包括在groupCount的返回值中。

Pattern p = Pattern.compile("(\\D+)(\\d+)(\\D+)");
Matcher m = p.matcher("somewords123顶发动");
if (m.find()){
????System.out.println("分组个数:" + m.groupCount());
????System.out.println(m.group(0));
????System.out.println(m.group(1));
????System.out.println(m.group(2));
????System.out.println(m.group(3));
}

//输出//

分组个数:3

somewords123顶发动

somewords

123

顶发动

文章来源:https://blog.csdn.net/weixin_50083448/article/details/135036949
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。