Top.Mail.Ru
Ответы

Чтение данных сайта.

Я хочу написать небольшую программку, допустим, для сравнения новых сведений о кредитах.2 сайтов банки ру и сравни ру. Вопрос: как мне постоянно обновлять страницу и поулучать именно нужные данные? Не превращая всю страницу в текстовый формат, а потом разбирая её по частям. Поискал в интернете в основном говорят: переведите в текстовый формат, ищите нужную информацию и дальше по отправлению данных, можно ли как-то автоматизировать этот процесс сразу получая нужные данные и не нагружая Компьютер постоянно открытыми вкладками.

По дате
По рейтингу
Аватар пользователя
Новичок

Для начала узнать, есть ли у этих сайтов готовые API для получения данных сторонними клиентами. И если есть, использовать именно их.

Если API нет, нажать в браузере F12 и посмотреть, как именно страницы этих сайтов взаимодействуют со своими серверами. Вполне возможно, что передаётся совсем не свёрстанный HTML, а данные в JSON.

После того как разберёшься в том, как именно данные запрашиваются и отдаются, реализуешь в своей программе (посредством cURL или аналогичной библиотеки) обращения к серверам этих сайтов, имитирующие логику работы браузерного кода.