python--Xpath网页爬取(一)提取热词
来源:华佗健康网
今天给大家带来一个小知识哦,就是我们从网页上想提取出来其中的文字。下面的代码或许能帮助到你呢。一起来学习吧:
import requests
from lxml import etree
url='https://weixin.sogou.com/'
rqq=requests.get(url)
html=etree.HTML(rqq.content,etree.HTMLParser())
html
result1=html.xpath('//*[@id="topwords"]/li/a/text()')
result1
以上就是用Xpath方法来提取网页中的热点词汇。大家可以试试是引入不同的路径,提取出来会是什么样的内容呢,大家快去试试吧!
因篇幅问题不能全部显示,请点此查看更多更全内容