前期准备!python版本:Python3
模块:Requests、Beautifulsoup、LXML
模块安装 :pip install requests 、pip install beautifulsoup4、pip install lxml
IDE:pycharm
网站分析通过requests库来看看这个页面的源代码:
点开一个笑话查看全文,你会发现每一个都有一个?.html
按下f12查看其源代码,按照其布局发现 :
每个笑话对应其中一个<li>标签,分析得每个笑话展开全文的网址藏在href当中,我们只需要获取href就能得到笑话的网址
通过以上代码,成功获得第一页所有笑话的网址后缀:
简单分析笑话页面html内容后,接下来获取一个页面全部笑话的内容:
学习群:643692991
效果:
群贤毕至
余安徒掠2022-06-20 10:55:24 | 回复
看这个页面的源代码:点开一个笑话查看全文,你会发现每一个都有一个?.html按下f12查看其源代码,按照其布局发现 :每个笑话对应其中一个<li>标签,分析得每个笑话展开全文的网址藏在href当中,我们只需要获取href就能得到笑话的网址通过以上代码,成功获得第一页所有笑话的网址后缀:简
世味悸初2022-06-20 12:01:06 | 回复
当中,我们只需要获取href就能得到笑话的网址通过以上代码,成功获得第一页所有笑话的网址后缀:简单分析笑话页面html内容后,接下来获取一个页面全部笑话的内容:学习群:643692991效果:
拥嬉青朷2022-06-20 02:42:13 | 回复
的网址通过以上代码,成功获得第一页所有笑话的网址后缀:简单分析笑话页面html内容后,接下来获取一个页面全部笑话的内容:学习群:643692991效果:
寻妄笑惜2022-06-20 03:45:24 | 回复
笑话的网址后缀:简单分析笑话页面html内容后,接下来获取一个页面全部笑话的内容:学习群:643692991效果:
柔侣木緿2022-06-20 11:47:52 | 回复
都有一个?.html按下f12查看其源代码,按照其布局发现 :每个笑话对应其中一个<li>标签,分析得每个笑话展开全文的网址藏在href当中,我们只需要获取href就