博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Java 的HTML 解析器-----jsoup
阅读量:6678 次
发布时间:2019-06-25

本文共 699 字,大约阅读时间需要 2 分钟。

/**

  * jsoup 是一款 Java 的HTML 解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于JQuery的操作方法来取出和操    作数据。
  jsoup的主要功能如下:
   1. 从一个URL,文件或字符串中解析HTML;
  2. 使用DOM或CSS选择器来查找、取出数据;
  3. 可操作HTML元素、属性、文本; 
  jsoup是基于MIT协议发布的,可放心使用于商业项目。
  * */

在线Javadoc:

jsoup Cookbook(中文版):

下面先来看一个实例,用来获取网站中表格中的数字在表格中的位置

public static void main(String[] args) throws IOException {        Document doc = Jsoup.connect("http://www.menneske.no/arukone/5x5/eng/?number=499").get();        Elements contents = doc.getElementsByClass("arukone");        Elements datas = contents.get(0).getElementsByTag("table");        for (Element data : datas)         {            Elements trs=data.getElementsByTag("tr");            for (int i = 0; i

 

转载地址:http://kvrxo.baihongyu.com/

你可能感兴趣的文章
PHPCMS一个BUG
查看>>
APP云测试
查看>>
3-unit3 高速缓存DNS
查看>>
spark mllib 协同过滤算法,基于余弦相似度的用户相似度计算
查看>>
openwrt 基于qmi的 3G|4G拨号
查看>>
俞敏洪励志语
查看>>
开源|基于TensorFlow的聊天机器人-ErGo
查看>>
lucene4.0入门1
查看>>
Svn结合hook实现自动更新及多Project管理更新
查看>>
sgu 222
查看>>
让spring-data-jpa解放你的DAO
查看>>
58沈剑:架构师的平凡之路
查看>>
Hibernate问题-read-write缓存策略
查看>>
sql中实现汉字的拼音首字母查询
查看>>
Android 动态布局 (代码布局)
查看>>
MYSQL备份和恢复
查看>>
spark安装:在hadoop YARN上运行spark-shell
查看>>
Docker存储驱动之ZFS简介
查看>>
根据sql,一键生成excle 格式, 再通过 zip包压缩为zip
查看>>
PL/SQL Developer 添加数据
查看>>