时间:2023-1-17 作者:老大夫 分类: 传智JAVA爬虫学习笔记
tagname: 通过标签查找元素,比如:span
.class: 通过class名称查找元素,比如:.class_a
@Test
public void testSelector()throws Exception{
//解析html文件,获取document对象
Document doc = Jsoup.parse(new File("C:\\Users\\16259\\Desktop\\test.html"), "utf8");
//tagName: 通过标签查找元素,比如span
// Elements elements = doc.select("span");
// for (Element element : elements) {
// System.out.println(element.text());
// }
//#id: 通过ID查找元素,比如:#city_bjj
// Element element = doc.select("#city_bj").first();
// System.out.println("获取到的结果是:"+ element.text());
//.class: 通过class名称查找元素,比如:.class_a
// Element element = doc.select(".class_a").first();
// System.out.println("得到的结果是: "+element.text());
//[attribute]: 利用属性查找元素,比如:[abc]
// Element element = doc.select("[abc]").first();
// System.out.println("得到的结果是: "+element.text());
//[attr=value]: 利用属性值来查找元素,比如:[class=s_name]
// Elements elements = doc.select("[class=s_name]");
// for (Element element : elements) {
// System.out.println(element.text());
// }
}
推荐阅读:
02 入门程序
22 封装HttpClient
24 实现爬虫功能2
20 开发准备
18 selector选择器的组合使用获取元素
23 实现爬虫功能1
21 编写案例的引导类,Service,Dao,Pojo
19 idea工程文件打包
15 使用DOM的方式获取文档
16 获取元素中的数据
行动消除疑虑