博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
第7个httpClient 例子--httpclient+jsoup解析
阅读量:5845 次
发布时间:2019-06-18

本文共 2430 字,大约阅读时间需要 8 分钟。

hot3.png

目标获取博客园的标题与口号:https://www.cnblogs.com/

HTML:代码:

    
博客园 - 开发者的网上家园

 

pom.xml

org.apache.httpcomponents
httpclient
4.5.2
org.jsoup
jsoup
1.10.2

代码:

import org.apache.http.HttpEntity;import org.apache.http.client.methods.CloseableHttpResponse;import org.apache.http.client.methods.HttpGet;import org.apache.http.impl.client.CloseableHttpClient;import org.apache.http.impl.client.HttpClients;import org.apache.http.util.EntityUtils;import org.jsoup.Jsoup;import org.jsoup.nodes.Document;import org.jsoup.nodes.Element;import org.jsoup.select.Elements;public class HttpClientjsouDemo01 {    public static void main(String[] args) throws Exception {        //创建实例化对象        CloseableHttpClient httpClient = HttpClients.createDefault();        //创建实例化对象httpget        HttpGet httpGet = new HttpGet("http://www.cnblogs.com/");        //执行get请求        CloseableHttpResponse response = httpClient.execute(httpGet);        //返回实体整个网页内容        HttpEntity entity = response.getEntity();        String toString = EntityUtils.toString(entity,"utf-8");        response.close();//关闭请求流释放系统资源                //解析网页,得到文档对象        Document doc = Jsoup.parse(toString);        //获取tag 是title的所有dom元素        Elements elements = doc.getElementsByTag("title");        //获取第一个元素        Element element = elements.get(0);        //返回元素的文本        String text = element.text();        System.out.println("网页标题是:"+elements);        Element element2=doc.getElementById("site_nav_top"); // 获取id=site_nav_top的DOM元素        String navTop=element2.text(); // 返回元素的文本        System.out.println("口号:"+navTop);    }}

运行结果:

网页标题是:博客园 - 开发者的网上家园口号:代码改变世界Process finished with exit code 0

 

转载于:https://my.oschina.net/ch66880/blog/1525495

你可能感兴趣的文章
强制缓存和协商缓存有什么区别
查看>>
企业专属云计算平台落地,助力企业实现数字化转型
查看>>
多线程通信的三大法器,你真的会用吗?
查看>>
Python爬虫--- 1.4 正则表达式:re库
查看>>
Xcode 10 升级导致项目报错的常见问题
查看>>
我们来说一说TCP神奇的40ms
查看>>
[LeetCode] 97. Interleaving String
查看>>
微服务架构组件分析
查看>>
Mongodb数据的导出与导入
查看>>
在SAP UI中使用纯JavaScript显示产品主数据的3D模型视图
查看>>
前端编码规范之:样式(scss)编码规范
查看>>
python 设计模式-适配器模式
查看>>
【Leetcode】82. 删除排序链表中的重复元素 II
查看>>
vue_music:排行榜rank中top-list.vue中样式的实现:class
查看>>
修改校准申请遇到的问题
查看>>
第一天·浏览器内核及Web标准
查看>>
Java版本兼容问题
查看>>
【DL-CV】浅谈GoogLeNet(咕咕net)
查看>>
【许晓笛】详解 EOS 的新共识机制 BFT-DPoS
查看>>
python大佬养成计划----win下对数据库的操作
查看>>