Mail.ruПочтаМой МирОдноклассникиВКонтактеИгрыЗнакомстваНовостиКалендарьОблакоЗаметкиВсе проекты

Парсинг сайта(название и описание)

Ariadlif Ученик (106), на голосовании 6 часов назад
Я хочу получить название манги и и её описание
 import requests 
from bs4 import BeautifulSoup as BS
import xlsxwriter


page = 1

rek = ('https://xn--80aaig9ahr.xn--c1avg')
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36'}
data = [['Наименование', 'Описание']]


def get_sol(url):
res1 = requests.get(url, headers)
return BS(res1.text, 'html.parser')



while True:
res = requests.get("https://xn--80aaig9ahr.xn--c1avg/manga?page=" + str(page),
"&content=manga&categories=63&count_chapters_gte=20&count_chapters_lte=5000")
soup = BS(res.text, 'html.parser')
headlines = soup.find_all('a', class_='Vertical_card__Qez7E')


if(len(headlines)):
for cat in headlines:
name = cat.text
subcategories = get_sol(rek + cat['href'])
for manga in subcategories:
title = manga.find('div', class_='Typography_body1__YTqxB').find(text=True).strip()
data.append([name, title])
page += 1
else:
break


with xlsxwriter.Workbook('manga.xlsx') as workbook:
worksheet = workbook.add_worksheet()

for row_num, info in enumerate(data):
worksheet.write_row(row_num, 0, info)
Выскакивает ошибка не понимаю в чем проблема.
line 31, in <module> title = manga.find('div', class_='Typography_body1__YTqxB').find(text=True).strip() ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ TypeError: find() takes no keyword arguments
Голосование за лучший ответ
Rotspawn Мудрец (15949) 1 месяц назад
Попробуй исправить на:
for cat in headlines:
name = cat.text.strip()
subcategories = get_sol(rek + cat['href'])
manga_items = subcategories.find_all('div', class_='Typography_body1__YTqxB')

for manga in manga_items:
title = manga.text.strip()
data.append([name, title])
AriadlifУченик (106) 1 месяц назад
Спасибо
Похожие вопросы