Код для задачи на Python

sergeyglobal Ученик (123), открыт 1 месяц назад

import requests
from bs4 import BeautifulSoup
from openpyxl import load_workbook

# URL страниц с вакансиями
urls = [
" https://nn.hh.ru/vacancy/91993250?query=Bi+аналитик&hhtmFrom=vacancy_search_list ",
" https://nn.hh.ru/vacancy/94508889?query=bi-анализ&hhtmFrom=vacancy_search_list "
]

# Отправляем GET-запросы
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'
}

data = []

for url in urls:
response = requests.get(url, headers=headers)
if response.status_code == 200:
soup = BeautifulSoup(response.text, 'html.parser')
vacancy_title = soup.find('h1', {'data-qa': 'vacancy-title'}).text.strip()
vacancy_description = soup.find('div', {'class': 'vacancy-description'}).text.strip()
vacancy_requirements = soup.find('div', {'data-qa': 'vacancy-description'}).text.strip()
data.append([vacancy_title, vacancy_description, vacancy_requirements])

# Открываем существующий файл Excel
xlsx_file_path = "C:\\Users\\serge\\Documents\\vacancieees_data.xlsx"
wb = load_workbook(xlsx_file_path)
ws = wb.active

# Получаем номер последней строки в файле Excel
last_row = ws.max_row

# Записываем данные в ячейки
for row_data in data:
last_row += 1
ws.cell(row=last_row, column=1).value = row_data[0] # Название вакансии
ws.cell(row=last_row, column=2).value = row_data[1] # Описание вакансии
ws.cell(row=last_row, column=3).value = row_data[2] # Требования к кандидатам

# Сохраняем книгу Excel
wb.save(xlsx_file_path)
print("Данные сохранены в файл", xlsx_file_path)

0 ответов

Похожие вопросы