16 获取元素中的数据

老大夫 发布于 2023-01-17 22:24
元素中获取数据 从元素中获取id 从元素中获取className 从元素中获取属性的值attr 从元素中获取所有属性attributes 从元素中获取文本内容text 测试类文件 @Test public void testData()throws Exception{ //解析文件,获取document Docu...

15 使用DOM的方式获取文档

老大夫 发布于 2023-01-17 20:32
使用dom方式遍历文档 元素获取 根据id查询元素getElementById 根据标签获取元素getElementsByTag 根据class获取元素getElementsByClass 根据属性获取元素getElementsByAttribute 测试类文件 @Test public void testDOM()throws Except...

14 Jsoup解析文件

老大夫 发布于 2023-01-17 20:30
Test测试类文件 @Test public void testFile()throws Exception{ //解析文件 Document doc = Jsoup.parse(new File("C:\\Users\\16259\\Desktop\\test.html"),"utf8"); Str...

13 jsoup解析字符串

老大夫 发布于 2023-01-17 19:59
测试类文件 @Test public void testString()throws Exception{ //使用工具类获取字符串 String content = FileUtils.readFileToString(new File("C:\\Users\\16259\\Desktop\\test.html")...

12 Jsoup解析Url

老大夫 发布于 2023-01-17 18:05
类文件 HttpClient适合于抓取数据,Jsoup适合解析数据,所以都要学习. package jsoup; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.junit.Test; import java.net.URL; public class JsoupF...

10 HttpClient-----请求参数

老大夫 发布于 2023-01-17 18:02
类文件 可以给请求设置多种参数,例如创建连接的最长时间,获取连接的最长时间,设置数据传输的最长时间 package cn.itcast.crawler.test; import jdk.nashorn.internal.ir.RuntimeNode; import org.apache.hc.client5.http.classic.methods.Htt...

09 HttpClient----连接池

老大夫 发布于 2023-01-17 17:40
类文件 注意由于交给连接池管理HttpClient了,所以我们在doGet方法中不要自己关闭HttpClient package cn.itcast.crawler.test; import org.apache.hc.client5.http.classic.methods.HttpGet; import org.apache.hc.client5.ht...

HttpClient发起请求ClientProtocolException和Target host is not specified问题分析

老大夫 发布于 2023-01-17 15:13
原因: 使用httpClient访问时,地址忘了加 http:// 协议了 解决方法: 在网址前加上http:// 引用 https://blog.csdn.net/Imobama/article/details/92794758

08 HttpCLient-----post带参数访问

老大夫 发布于 2023-01-17 14:35
类文件 这节课的地址不能用了,所以post请求返回的的不是200而是403 package cn.itcast.crawler.test; import com.sun.org.glassfish.gmbal.NameValue; import org.apache.hc.client5.http.classic.methods.HttpPost; imp...

07 HttpClient-----Post请求

老大夫 发布于 2023-01-17 14:30
类文件 不带参的post请求和get的区别就是请求对象的不同,之前是get这个是post package cn.itcast.crawler.test; import org.apache.hc.client5.http.classic.methods.HttpGet; import org.apache.hc.client5.http.classic.m...

06 Httpclient-----带参Get

老大夫 发布于 2023-01-17 14:28
类文件 这节课的地址不能用了,所以get请求返回的的不是200而是403 package cn.itcast.crawler.test; import org.apache.hc.client5.http.classic.methods.HttpGet; import org.apache.hc.client5.http.impl.classic.Clos...

05 HttpCLient----Get

老大夫 发布于 2023-01-17 14:27
类文件 package cn.itcast.crawler.test; import org.apache.hc.client5.http.impl.classic.CloseableHttpClient; import org.apache.hc.client5.http.impl.classic.CloseableHttpResponse; impor...

02 入门程序

老大夫 发布于 2023-01-17 14:22
全部课程学习文档:学习文档 类文件 package cn.itcast.crawler.test; import org.apache.hc.client5.http.classic.HttpClient; import org.apache.hc.client5.http.classic.methods.HttpGet; import org.apach...
标签: java 爬虫

SLF4J: Class path contains multiple SLF4J bindings.错误解决

老大夫 发布于 2023-01-17 14:08
原因:包冲突了 解决方法:删除其中一个 引用: https://blog.csdn.net/weixin_42181264/article/details/112168270

饥荒windows服务器建服务器

老大夫 发布于 2023-01-16 12:35
使用的软件也还是steam中自带的软件官方就有服务器的程序 (买游戏时自带的) 只不过在服务器就不用下载steam再下载软件这么麻烦了,使用一款叫做steamCMD的软件下载程序 只要在服务器上运行这个程序就算开服成功的了,具体配置存档用户之类的看到大佬的博客有写 B站 :https://www.bilibili.com/video/BV1LB4y1v7n...