使用Xpath和正则数据提取

本文介绍二中提取数据的方法,Xpath和正则。
还有第三种bs4方法提取,但是总感觉还是不如xpath用的顺手,故总结如下。

Xpath

首先要将html文件转换问xml文件,然后查找html节点或者元素。
以下重点是xpath的使用,如何在xpath插件中按照匹配规则匹配出所要的内容。