元素中获取数据
从元素中获取id
从元素中获取className
从元素中获取属性的值attr
从元素中获取所有属性attributes
从元素中获取文本内容text
测试类文件
@Test
public void testData()throws Exception{
//解析文件,获取document
Docu...
使用dom方式遍历文档
元素获取
根据id查询元素getElementById
根据标签获取元素getElementsByTag
根据class获取元素getElementsByClass
根据属性获取元素getElementsByAttribute
测试类文件
@Test
public void testDOM()throws Except...
Test测试类文件
@Test
public void testFile()throws Exception{
//解析文件
Document doc = Jsoup.parse(new File("C:\\Users\\16259\\Desktop\\test.html"),"utf8");
Str...
测试类文件
@Test
public void testString()throws Exception{
//使用工具类获取字符串
String content = FileUtils.readFileToString(new File("C:\\Users\\16259\\Desktop\\test.html")...
类文件
HttpClient适合于抓取数据,Jsoup适合解析数据,所以都要学习.
package jsoup;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.junit.Test;
import java.net.URL;
public class JsoupF...
类文件
可以给请求设置多种参数,例如创建连接的最长时间,获取连接的最长时间,设置数据传输的最长时间
package cn.itcast.crawler.test;
import jdk.nashorn.internal.ir.RuntimeNode;
import org.apache.hc.client5.http.classic.methods.Htt...
类文件
注意由于交给连接池管理HttpClient了,所以我们在doGet方法中不要自己关闭HttpClient
package cn.itcast.crawler.test;
import org.apache.hc.client5.http.classic.methods.HttpGet;
import org.apache.hc.client5.ht...
原因: 使用httpClient访问时,地址忘了加 http:// 协议了
解决方法: 在网址前加上http://
引用 https://blog.csdn.net/Imobama/article/details/92794758
类文件
这节课的地址不能用了,所以post请求返回的的不是200而是403
package cn.itcast.crawler.test;
import com.sun.org.glassfish.gmbal.NameValue;
import org.apache.hc.client5.http.classic.methods.HttpPost;
imp...
类文件
不带参的post请求和get的区别就是请求对象的不同,之前是get这个是post
package cn.itcast.crawler.test;
import org.apache.hc.client5.http.classic.methods.HttpGet;
import org.apache.hc.client5.http.classic.m...
类文件
这节课的地址不能用了,所以get请求返回的的不是200而是403
package cn.itcast.crawler.test;
import org.apache.hc.client5.http.classic.methods.HttpGet;
import org.apache.hc.client5.http.impl.classic.Clos...
类文件
package cn.itcast.crawler.test;
import org.apache.hc.client5.http.impl.classic.CloseableHttpClient;
import org.apache.hc.client5.http.impl.classic.CloseableHttpResponse;
impor...
全部课程学习文档:学习文档
类文件
package cn.itcast.crawler.test;
import org.apache.hc.client5.http.classic.HttpClient;
import org.apache.hc.client5.http.classic.methods.HttpGet;
import org.apach...
原因:包冲突了
解决方法:删除其中一个
引用: https://blog.csdn.net/weixin_42181264/article/details/112168270
使用的软件也还是steam中自带的软件官方就有服务器的程序 (买游戏时自带的)
只不过在服务器就不用下载steam再下载软件这么麻烦了,使用一款叫做steamCMD的软件下载程序
只要在服务器上运行这个程序就算开服成功的了,具体配置存档用户之类的看到大佬的博客有写
B站
:https://www.bilibili.com/video/BV1LB4y1v7n...