1、免费小说网站:http://book.zongheng.com/,我们获取的文字信息就来源于该网站
2、requests模块,用于http形式请求访问网页
3、BeautifulSoup模块,用于解析获取到的网页内容
首先利用requests模块获取网页源码,通过BeautifulSoup模块进一步筛选获得文本内容
如需将获取内容输入到本地文件,可自行利用with...open操作
import requests from bs4 import BeautifulSoup url = 'http://book.zongheng.com/chapter/897468/58575172.html'resp = requests.get(url = url)html = resp.text soup = BeautifulSoup(html,"html.parser")try:for i in range(50):print(soup.find_all('p')[i].string)except:pass
Copyright © 2023 leiyu.cn. All Rights Reserved. 磊宇云计算 版权所有 许可证编号:B1-20233142/B2-20230630 山东磊宇云计算有限公司 鲁ICP备2020045424号
磊宇云计算致力于以最 “绿色节能” 的方式,让每一位上云的客户成为全球绿色节能和降低碳排放的贡献者