老师好,请问为什么提取评论的标签不是直接按class_=short,毕竟这个标签是离评论最近的呢?
来源:1-4 BeautifulSoup库入门
慕斯4389000
2020-08-26 23:08:52
from bs4 import BeautifulSoup
import requests
url1 = 'https://movie.douban.com/subject/1291548/'
headers = {'user-agent': 'my-app/0.0.1'}
r = requests.get(url=url1, headers=headers)
print(r.text)
print('\n-----------------------------------------------------------------')
soup = BeautifulSoup(r.text,'html.parser')
print(soup.prettify())
print('\n-----------------------------------------------------------------')
print(soup.title.text)
print(soup.find_all(class_='short')) #提取全部评论
print("=========================")
#提取每一条评论
for comment in soup.find_all(class_='short'):
print(comment.text)
3回答
兰宁ln
2020-11-19
用class_=short提取出来的只有页面显示的四条吧?更多短评里的没有了
DeltaF
2020-08-28
可以的,效率更高更好
Quicklock
2020-08-27
我觉得没有远近之分吧,能提取到都行,如果能好简洁优雅地方式提取就再好不过了。
相似问题