JSoup:用于 Java 的 HTML 解析器166
JSoup 是一个由 Java 编写的 HTML 解析器。它允许您使用 Java 代码解析、操作和修改 HTML 文档。它既快速又灵活,使其成为需要处理 HTML 文档的项目的理想选择。
安装 JSoup
您可以使用 Maven 或 Gradle 来安装 JSoup。Maven
```xml
jsoup
1.15.3
```
Gradle
```
implementation group: '', name: 'jsoup', version: '1.15.3'
```
使用 JSoup
要使用 JSoup,您需要创建一个 `Document` 对象。您可以通过从文件、字符串或 URL 加载 HTML 文档来创建 `Document` 对象。从文件加载 HTML
```java
Document doc = (new File("path/to/"), "utf-8");
```
从字符串加载 HTML
```java
String html = "ExampleHello World!";
Document doc = (html);
```
从 URL 加载 HTML
```java
Document doc = ("").get();
```
解析 HTML 文档
一旦你有了 `Document` 对象,你就可以使用 JSoup 的方法来解析 HTML 文档。您可以使用这些方法来获取文档的标题、正文和其他元素。获取文档的标题
```java
String title = ();
```
获取文档的正文
```java
String text = ();
```
获取文档中的元素
```java
Element element = ("my-id");
```
操作 HTML 文档
除了解析 HTML 文档之外,JSoup 还允许您操作文档。您可以使用这些方法来添加、删除或修改元素。添加元素
```java
Element newElement = ("div");
("id", "new-div");
().appendChild(newElement);
```
删除元素
```java
Element element = ("my-id");
();
```
修改元素的属性
```java
Element element = ("my-id");
("src", "");
```
保存修改后的 HTML 文档
一旦您对 HTML 文档进行了所需的更改,您就可以使用 JSoup 的方法来保存更改后的文档。将文档保存到文件
```java
(new OutputSettings().prettyPrint(true)).html();
("path/to/");
```
将文档保存到字符串
```java
String html = (new OutputSettings().prettyPrint(true)).html());
```
JSoup 是一个用于 Java 的功能强大且易于使用的 HTML 解析器。它允许您使用 Java 代码解析、操作和修改 HTML 文档。它既快速又灵活,使其成为需要处理 HTML 文档的项目的理想选择。
2025-01-14
从脚本到全栈:JavaScript的十年蜕变与未来展望
https://jb123.cn/javascript/73563.html
Perl编程语言:揭开文本处理的神秘面纱,快速入门与核心应用速览!
https://jb123.cn/perl/73562.html
揭秘Perl中的‘中间值’:掌握数据流与效率优化的核心秘诀
https://jb123.cn/perl/73561.html
JavaScript驱动外汇市场:实时数据、交易与API开发全攻略
https://jb123.cn/javascript/73560.html
JavaScript 权限的奥秘:从浏览器沙箱到API安全实践
https://jb123.cn/javascript/73559.html
热门文章
JavaScript (JS) 中的 JSF (JavaServer Faces)
https://jb123.cn/javascript/25790.html
JavaScript 枚举:全面指南
https://jb123.cn/javascript/24141.html
JavaScript 逻辑与:学习布尔表达式的基础
https://jb123.cn/javascript/20993.html
JavaScript 中保留小数的技巧
https://jb123.cn/javascript/18603.html
JavaScript 调试神器:步步掌握开发调试技巧
https://jb123.cn/javascript/4718.html