JSoup:用于 Java 的 HTML 解析器166


JSoup 是一个由 Java 编写的 HTML 解析器。它允许您使用 Java 代码解析、操作和修改 HTML 文档。它既快速又灵活,使其成为需要处理 HTML 文档的项目的理想选择。

安装 JSoup

您可以使用 Maven 或 Gradle 来安装 JSoup。Maven
```xml


jsoup
1.15.3

```
Gradle
```
implementation group: '', name: 'jsoup', version: '1.15.3'
```

使用 JSoup

要使用 JSoup,您需要创建一个 `Document` 对象。您可以通过从文件、字符串或 URL 加载 HTML 文档来创建 `Document` 对象。从文件加载 HTML
```java
Document doc = (new File("path/to/"), "utf-8");
```
从字符串加载 HTML
```java
String html = "ExampleHello World!";
Document doc = (html);
```
从 URL 加载 HTML
```java
Document doc = ("").get();
```

解析 HTML 文档

一旦你有了 `Document` 对象,你就可以使用 JSoup 的方法来解析 HTML 文档。您可以使用这些方法来获取文档的标题、正文和其他元素。获取文档的标题
```java
String title = ();
```
获取文档的正文
```java
String text = ();
```
获取文档中的元素
```java
Element element = ("my-id");
```

操作 HTML 文档

除了解析 HTML 文档之外,JSoup 还允许您操作文档。您可以使用这些方法来添加、删除或修改元素。添加元素
```java
Element newElement = ("div");
("id", "new-div");
().appendChild(newElement);
```
删除元素
```java
Element element = ("my-id");
();
```
修改元素的属性
```java
Element element = ("my-id");
("src", "");
```

保存修改后的 HTML 文档

一旦您对 HTML 文档进行了所需的更改,您就可以使用 JSoup 的方法来保存更改后的文档。将文档保存到文件
```java
(new OutputSettings().prettyPrint(true)).html();
("path/to/");
```
将文档保存到字符串
```java
String html = (new OutputSettings().prettyPrint(true)).html());
```

JSoup 是一个用于 Java 的功能强大且易于使用的 HTML 解析器。它允许您使用 Java 代码解析、操作和修改 HTML 文档。它既快速又灵活,使其成为需要处理 HTML 文档的项目的理想选择。

2025-01-14


上一篇:如何在 JavaScript 中解码

下一篇:在 JavaScript 中访问和操纵元素