时间:2023-1-17 作者:老大夫 分类: 传智JAVA爬虫学习笔记
元素中获取数据
@Test
public void testData()throws Exception{
//解析文件,获取document
Document doc = Jsoup.parse(new File("C:\\Users\\16259\\Desktop\\test.html"), "utf8");
//根据id获取元素
Element element = doc.getElementById("test");
String str="";
// 1.从元素中获取id
// str=element.id();
// 2.从元素中获取className
// str=element.className();
// Set<String> classSet = element.classNames();
// for(String strs:classSet ){
// System.out.println(strs);
// }
// 3.从元素中获取属性的值attr
// str=element.attr("class");
// 4.从元素中获取所有属性attributes
// Attributes attributes = element.attributes();
// System.out.println(attributes.toString());
// 5.从元素中获取文本内容text
str=element.text();
//打印获取的内容
System.out.println("获取到的数据是:"+str);
}
推荐阅读:
02 入门程序
22 封装HttpClient
24 实现爬虫功能2
20 开发准备
18 selector选择器的组合使用获取元素
23 实现爬虫功能1
17 使用选择器获取元素
21 编写案例的引导类,Service,Dao,Pojo
19 idea工程文件打包
15 使用DOM的方式获取文档
行动消除疑虑