Материалы курса «Как не дать себя обмануть и научиться анализировать данные»

3 вебинара о том, как читать и писать про данные

Команда Теплицы публикует конспект с онлайн-курса о том, как читать и писать про данные. Участники курса вместе с data-аналитиком и разработчиком Сергеем Устиновым разобрались, какие ловушки, манипуляции и ошибки прячутся в инфографике, различных отчетах и данных. А также узнали, как такие ловушки находить и убирать из своих собственных работ.

Вебинар № 1: Толкование данных, или Как не дать себя обмануть

На первом вебинаре эксперт рассказал о том, как интерпретировать материалы в медиа, как верно считывать то, о чем говорит автор, и о чем могут рассказать наборы данных и инфографика. Сергей Устинов показал примеры инфографики, сделанной на основе данных по COVID-19. И наглядно объяснил, насколько по-разному можно интерпретировать один и тот же набор данных и на что следует обращать внимание при изучении материалов в медиа.

Если мы один набор данных раздадим тысяче человек, то по итогу получим тысячу разных статей. Из одного набора данных каждый человек сможет сделать множество совершенно разных выводов. Перед нами стоит задача понять, почему так происходит, и натренировать нашу насмотренность на аномальные признаки в таких статьях.

Сергей Устинов,

data-аналитик и разработчик

Презентация вебинара.

Вебинар № 2: Как инфографика может ввести в заблуждение

Второй вебинар был посвящен визуализации данных. Эксперт объяснил, какие виды графиков лучше подходят для визуализации тех или иных данных, а какие могут исказить картину до неузнаваемости. Тип шкалы, цвета, размеры и подписи — все это влияет на восприятие и интерпретацию инфографики. Разобрались, как не запутать и не обмануть читателя.

Принципы создания грамотной инфографики

  • Очень важно придумать такой заголовок, который кратко и емко доносит информацию, не путая читателя.
  • Не существует одного универсального типа графика для всех наборов данных. Выбирать тип графика следует в зависимости от того, на чем нужно поставить акцент. Определить, какой именно нужен график, поможет постер от Александра Богачева.
  • Неверное распределение шкалы или слишком необычная визуализация может запутать читателя. Не стоит использовать слишком сложную визуализацию.
  • Одна картинка — одна идея. Большое количество сюжетов в одной инфографике перегружают материал, в итоге меньше читателей им заинтересуются.
  • Источник данных — возможность проверить и воспроизвести информацию. Когда указаны источники данных и методология анализа, растет доверие к материалу.

Старайтесь делать инфографику таким образом, чтобы она могла существовать отдельно от текста вашего материала. Вы должны понимать, что читатели могут распространять ваш материал частями. Добавляйте источники, заголовок и авторство в самой инфографике. Так увеличивается виральность вашего материала.

Сергей Устинов,

data-аналитик и разработчик

Презентация вебинара.

Вебинар № 3: Как понимать данные и описывать их

На третьем вебинаре Сергей Устинов поделился, как рассказать о том, что нам показывают данные, как не ввести читателей в заблуждение с помощью неправильно выбранных гипотез. А также рассказал, как понять, что данные сфальсифицированы.

Как можно оценить материал

  • Важно всегда проверять источник данных и смотреть, нет ли конфликта интересов.
  • Надо смотреть на то, каким методом были собраны данные.
  • Необходимо внимательно смотреть на аномальные участки на графиках и «задавать вопросы» графикам.
  • Некоторые наборы данных могут не иметь какой-то важной части информации, что может полностью изменить картину всей аналитики. На это следует обращать внимание и учитывать при дальнейшем анализе.
  • С помощью неправильно подобранной гипотезы или формулы можно полностью перевернуть реальную картину набора данных.
  • Проверка данных через сравнение — самый действенный способ оценить достоверность данных.

Презентация вебинара.