Perl 中的非贪婪匹配149


在 Perl 正则表达式中,*、+、? 和 {} 量词指定匹配次数。默认情况下,这些量词是贪婪的,这意味着它们会匹配尽可能多的字符。但是,有时我们需要非贪婪的量词,以匹配尽可能少的字符。

要使量词是非贪婪的,我们可以在它们后面加上一个问号 (?)。例如,以下正则表达式将匹配尽可能少的字符,直到找到 "foo":.*?foo

这个正则表达式等同于以下正则表达式:reluctant_quantifier

reluctant_quantifier 匹配一个或多个字符,但尽可能少。例如,以下正则表达式将匹配 "foo" 之前的所有字符:^.*?foo

这个正则表达式等同于以下正则表达式:lazy_quantifier

lazy_quantifier 匹配零个或多个字符,但尽可能少。例如,以下正则表达式将匹配 "foo" 之后的所有字符:foo.*?$

非贪婪量词在以下情况下很有用:* 当你想匹配尽可能少的字符时。
* 当你想要匹配一个不定长度的字符串时。
* 当你想匹配一个嵌套的字符串时。

请注意,非贪婪量词不一定比贪婪量词效率低。在某些情况下,它们甚至可能是更有效的。例如,以下正则表达式将匹配一个 HTML 文档中的所有链接:

这个正则表达式使用非贪婪量词来匹配链接中的所有属性。如果我们使用贪婪量词,正则表达式将匹配整个 HTML 文档。

以下是有关 Perl 中非贪婪量词的一些附加提示:* 非贪婪量词只能与 *、+、? 和 {} 量词一起使用。
* 非贪婪量词不能与 .*、.+、.? 和 .{} 量词一起使用。
* 非贪婪量词不能与原子组一起使用。

通过遵循这些提示,你可以有效地使用非贪婪量词来编写正则表达式。

2024-12-16


上一篇:合并 Perl 文件的实用指南

下一篇:中文编程语言之小骆驼perl