2-2作业

来源：2-2 连续获取多个页面信息

慕少6430021

2021-04-20 23:45:33

不是下面这样么?

相关代码：

#!/usr/bin/env python
# -*- coding: utf-8 -*-

# @Time : 2021/4/20 22:20
# @Author : shanjun.li
# @File : 7.6连续获取多个页面信息.py
# @Desc :
# 访问网页获取信息
from bs4 import BeautifulSoup
import requests

# headers
headers_all ={'user-agent':'my-app/0.0.1 '}
#获取网页信息
url_250 = "https://movie.douban.com/top250"
# response_chumen = requests.get(url=url_250,headers=headers_all)
# html_doc = response_chumen.text
print("\n------------------\n")

# 跳转页面 ?start=225&filter=
#我先访问url连接，加上参数 0,25,50~225
cur_page = 0
max_page = 225
movie_links = []
movie_names = []
while cur_page <= max_page:
url = url_250+"?start="+cur_page.__str__()+"&filter="
cur_page += 25
response = requests.get(url=url, headers=headers_all)
soup = BeautifulSoup(response.text,'html.parser')
for ele in soup.find_all(class_="hd"):
movie_names.append(ele.find(class_="title").string)
movie_links.append(ele.find('a',href=True).attrs['href'])
print(url)

for name,link in zip(movie_names,movie_links):
print(name,":",link)

写回答

1回答