Серия вебинаров

Онлайн-курс «Веб-скрейпинг для журналистов. С программированием и без»

пн 18 января, 13:00 - пт 22 января, 15:00

Команда фонда n-ost вместе с Теплицей социальных технологий, Четвертым сектором и Важными историями приглашает принять участие журналистов и всех интересующихся работой с данными в онлайн-курсе «Веб-скрейпинг для журналистов. С программированием и без». Онлайн-курс пройдет 18-22 января. 

О курсе

Практически ни одно расследование не обходится без сбора данных. Не всегда данные представлены в виде готовых таблиц. Иногда они сверстаны в виде HTML-страниц. Собирать такие данные вручную тяжело и долго.

Решить задачу помогает веб-скрейпинг – автоматический сбор данных со страниц сайта. Собирать данные можно с помощью сторонних сервисов или программирования. Об этих способах мы и поговорим на курсе.

Ведущие курса

Алеся Мароховская,редакторка дата-отдела издания «Важные истории»

Михаил Данилович,журналист медиапроекта «Четвертый сектор»

Кому будет полезно

Онлайн-курс будет полезен всем журналистам и тем, кто занимается расследованиями и исследованиями на основе данных, вне зависимости от уровня навыков в программировании.

Курс разделен на две части: на первом вебинаре эксперты расскажут о веб-скрейпинге и его роли в журналистике, а на втором Андрей Дорожный проведет практическое занятие с инструментами, которые позволят обойтись без программирования, когда появилась необходимость получить данные сайта. Остальные два вебинара будут посвящены программированию. 

Как устроен онлайн-курс 

Курс будет состоять из четырех вебинаров и начнется 18 января 2021 г.  Вебинары будут проходить в 13:00 по московскому времени. Курс завершится 22 января. Для участия необходимо зарегистрироваться. Все зарегистрированные участники получат доступ к записям вебинаров.

Темы и даты вебинаров

Вебинар № 1: Веб-скрейпинг для журналиста 

Алеся Мароховская, Андрей Дорожный и Михаил Данилович расскажут о журналистских кейсах, которые получились только благодаря веб-скрейпингу. 

Первый вводный вебинар поможет определить, насколько вам необходимо использовать программирование или вы можете обойтись инструментами, о которых будет рассказывать и показывать Андрей Дорожный на втором вебинаре.

Когда: 18 января в 13:00 МСК.

Длительность: 1 час.

Вебинар № 2: Скрейпинг данных без программирования

Андрей Дорожный расскажет о сервисах, которые помогут журналисту собирать данные с сайтов автоматически и без программирования. Для занятия понадобится браузер Google Chrome или Яндекс браузер. Также необходимо скачать расширения для браузера: первое, второе, третье, четвертое

Когда: 19 января в 13:00 МСК.

Длительность: 2 часа. 

Вебинар № 3: Скрейпинг с Python. Часть 1 

Алеся Мароховская расскажет, как использовать библиотеки BeautifulSoup и Requests, чтобы скрейпить сайты с помощью Python.

Для участия в вебинарах Алеси нужно иметь хотя бы базовые знания языка программирования Python. Также нужно установить Anaconda, чтобы на занятии вы могли использовать Jupyter Notebook (идет в комплекте Анаконды). Ссылка для скачивания.  

Можете использовать и любой другой редактор кода, если вам он кажется более удобным, но на занятии Алеся будет использовать Jupyter Notebook.

Когда: 20 января в 13:00 МСК.

Длительность: 3 часа. 

Вебинар № 4: Скрейпинг с Python. Часть 2 

Алеся Мароховская расскажет, как использовать библиотеку Selenium для более сложных случаев скрейпинга с помощью Python. 

Для участия вам понадобится все тот же Jupyter Notebook (или другой редактор кода). Также вам нужно будет скачать или обновиться до самой последней версии браузера Chrome. И скачать такую же версию Chrome Driver по ссылке. Обязательно убедитесь, что у браузера и Driver одинаковые версии.

Когда: 22 января в 13:00 МСК.

Длительность: 3 часа. 

Где учимся

Вебинары пройдут в сервисе Zoom. Ссылку на подключение и подробности курса организаторы вышлют зарегистрированным слушателям. Вопросы по курсу вы можете задать Алисе Цветковой по почте [email protected] или телеграм @itisalise