В целом книга полезна, но даёт довольно скромную информацию. И в самой книге написано, и в целом преподносится, что нас научат парсить динамические сайты и вызывать скрипты JS. Эт ложь, немного расскажут про Ajax сайты, что есть запросы, которые можно изучить и тогда...При этом я ожидал хотя бы описания парсинга сложных сайтов через консоль, что отслеживать, вот примеры - нет такого. Простые случаи вам прям дотошно расскажут, но не такие сложные детали. Спойлер - в книге просто посоветуют селениум. Сомнительно, но тоже можно использовать. Расскажут, как парсить ворд, csv, немного про многоточность и многопроцессность...Нет, в целом, это очень интересно и полезно для общего развития, но мы тут вроде как должны сайты парсить?! А википедии парсить можно и из википедии научиться. Если вы новичок и только хотите научиться парсингу, то подойдёт и будет интересно. Если ваша цель именно улучшить навыки парсинга и найти новые фичи - проходите мимо. Прям если коротко, то по стеку технологии книги советы : знать как работать с БД, selenium webdriver, немного затронут многопоточку...и всё в целом)
Umfang 336 seiten
2018 Jahr
Современный скрапинг веб-сайтов с помощью Python (pdf + epub)
Über das Buch
Если программирование напоминает волшебство, то веб-скрапинг – это очень сильное колдунство. Написав простую автоматизированную программу, можно отправлять запросы на веб-серверы, запрашивать с них данные, а затем анализировать их и извлекать необходимую информацию. Новое расширенное издание книги знакомит не только с веб-скрапингом, но и поможет собрать любого вида данные в современном Интернете.
В части I основное внимание уделено механике веб-скрапинга: как с помощью Python запрашивать информацию с веб-сервера, производить базовую обработку серверного отклика и организовать автоматизированное взаимодействие с сайтами. В части II исследованы более специфичные инструменты и приложения, которые пригодятся при любом сценарии веб-скрапинга.
После покупки предоставляется дополнительная возможность скачать книгу в формате epub.
Genres und Tags
Дмитрий Павлов-Теремок, А что вы можете порекомендовать почитать толкового?
Интересная книга!
Открывает окно в мир технологий используемых в скрапинге.
Для полноценного применения представленных решений необходимо конечно же знание в следующих областях: как минимум вы должны быть знакомы с ОС Linux, MySQL и Python.
Изложение материала последовательное и поэтому не вызывает никаких трудностей в восприятии изложенного материала.
В целом доволен результатом, полученным после прочтения. Рекомендую.
Книга дельная, но есть немного устаревшая информация. Однако это не критично, все нюансы легко гуглятся в рунете. Знание линукса не нужны, по крайней мере в первой части книги точно. До второй пока не дошел)
Hinterlassen Sie eine Bewertung
Bewertungen
3