老师好,请问为什么提取评论的标签不是直接按class_=short,毕竟这个标签是离评论最近的呢?

来源:1-4 BeautifulSoup库入门

慕斯4389000

2020-08-26 23:08:52

from bs4 import BeautifulSoup
import requests
url1 = 'https://movie.douban.com/subject/1291548/'
headers = {'user-agent': 'my-app/0.0.1'}
r = requests.get(url=url1, headers=headers)
print(r.text)

print('\n-----------------------------------------------------------------')
soup = BeautifulSoup(r.text,'html.parser')
print(soup.prettify())

print('\n-----------------------------------------------------------------')
print(soup.title.text)

print(soup.find_all(class_='short')) #提取全部评论
print("=========================")
#提取每一条评论
for comment in soup.find_all(class_='short'):
   print(comment.text)

写回答

3回答

兰宁ln

2020-11-19

用class_=short提取出来的只有页面显示的四条吧?更多短评里的没有了

0

DeltaF

2020-08-28

可以的,效率更高更好

0

Quicklock

2020-08-27

我觉得没有远近之分吧,能提取到都行,如果能好简洁优雅地方式提取就再好不过了。

0

人人都能学的数据分析

从0开始学数据分析,未来互联网各岗位的标配技能,产品经理、运营经理、技术人员人人必备,人人必会的的实用技能

1402 学习 · 1133 问题

查看课程