JavaScript 正则表达式：提取 URL202

在 JavaScript 中，正则表达式是一种强大的工具，可用于验证、匹配和操作字符串。通过使用正则表达式，我们可以轻松地从文本中提取 URL。

JavaScript 中提取 URL 的正则表达式如下：```javascript
/https?:/\/(www\.)?[-a-zA-Z0-9@:%._\+~#=]{1,256}\.[a-zA-Z0-9()]{1,6}\b([-a-zA-Z0-9()@:%_\+.~#?&/=]*)?/g
```

这个正则表达式由以下部分组成：* https?:/\/：匹配 URL 的协议部分（http 或 https）。
* (www\.)?：匹配可选的 "www" 子域。
* [-a-zA-Z0-9@:%._\+~#=]{1,256}：匹配域名的主机部分，其长度为 1 到 256 个字符，并包含字母、数字和特殊字符。
* \.[a-zA-Z0-9()]{1,6}：匹配顶级域名 (TLD)，其长度为 1 到 6 个字符，并包含字母和括号。
* \b：匹配单词边界，以确保只匹配完整的 URL。
* ([-a-zA-Z0-9()@:%_\+.~#?&/=]*)?：匹配 URL 的路径部分，该部分是可选的，可以包含各种字符。

要使用此正则表达式提取文本中的 URL，我们可以使用以下代码：```javascript
const text = "本文包含以下 URL：, /path/to/";
const matches = (urlRegex);
(matches); // 输出：["", "/path/to/"]
```

上述代码将返回一个包含所有匹配 URL 的数组。我们还可以使用 `exec()` 方法来逐个匹配 URL：```javascript
const text = "本文包含以下 URL：, /path/to/";
let match = (text);
while (match != null) {
(match[0]); // 输出：["", "/path/to/"]

match = (text);
}
```

此外，我们还可以使用 `()` 方法来替换文本中的 URL：```javascript
const text = "本文包含以下 URL：, /path/to/";
const replacedText = (urlRegex, '');
(replacedText); // 输出："本文包含以下 URL：, "
```

通过使用 JavaScript 中的正则表达式，我们可以轻松地从文本中提取、匹配和操作 URL，从而使我们的应用程序更具动态性和交互性。

2025-01-27

上一篇：JavaScript 高级程序设计第 2 版

下一篇：如何用 JavaScript 判断是否为字符串