Top.Mail.Ru
Ответы
Аватар пользователя
6лет
Изменено
Аватар пользователя
Аватар пользователя
Аватар пользователя
Программирование
+4

Помогите разобраться, почему при парсинге сайта на Python, возвращает не тот html-код, что при просмотре через браузер?

import requests

burl = 'https : / / betcity .ru /ru /live /soccer'
(ссылку в нормальном виде не даёт опубликовать сайт)
def get_html(url):
r = requests.get(url)
return r.text
print (get_html(burl))

Так вот код при просмотре через браузер отличается от того, что получаю при парсинге. Есть подозрение, что дело вот здесь
You have disabled javascript. For proper operation of the site you need to enable it in your browser settings.
У Вас отключён JavaScript. Для корректной работы сайта необходимо его включить в настройках браузера.

По дате
По рейтингу
Аватар пользователя
Новичок
6лет

Видимо это защита от парсинга. Попробуйте поменять User-Agent на поискового бота 'User-Agent: Mozilla/5.0 (compatible; YandexBot/3.0; +http://yandex.com/bots)'