Графики: выбор между анализом и коммуникацией

График с инструкцией
График с инструкцией
«Хоро­шая гра­фи­ка застав­ля­ет чита­те­ля уви­деть имен­но ту инфор­ма­цию, кото­рую хотел доне­сти до него автор», – пишет в сво­ей кни­ге «Graph design for the eye and mind» Сте­фен Кос­слин (Stephen Kosslyn). Но что такое хоро­ший гра­фик, и суще­ству­ет ли раз­ни­ца меж­ду гра­фи­ком для ана­ли­за дан­ных и гра­фи­ком для ком­му­ни­ка­ции?

Часто гра­фи­ки, осно­ван­ные на дан­ных, пред­на­зна­че­ны не для того, что­бы ана­ли­зи­ро­вать, а для того, что­бы опи­сы­вать то, что явля­ет­ся их содер­жа­ни­ем. Но что имен­но пре­вра­ща­ет гра­фи­ки в инстру­мент для ком­му­ни­ка­ции? И могут ли ана­ли­ти­че­ская и опи­са­тель­ная функ­ция гра­фи­ка быть раз­де­ле­ны или кон­тро­ли­ро­вать­ся авто­ра­ми?

Аналитические и описательные графики

Суще­ству­ет непре­рыв­ная связь меж­ду ана­ли­ти­че­ской и опи­са­тель­ной функ­ци­я­ми гра­фи­ков
В 1979 году Сте­фен Фьен­берг (Stephen Fienberg) в сво­ей рабо­те “Graphical methods in statistics” фор­ма­ли­зу­ет идею о функ­ци­о­наль­ном кон­ти­ну­у­ме меж­ду ана­ли­ти­че­ским и опи­са­тель­ным гра­фи­ка­ми, явля­ю­щи­ми­ся про­ти­во­по­лож­ны­ми пре­де­ла­ми дан­но­го кон­ти­ну­у­ма. Таким обра­зом, суще­ству­ет непре­рыв­ная связь меж­ду ана­ли­ти­че­ской и опи­са­тель­ной функ­ци­я­ми гра­фи­ков: не суще­ству­ет исклю­чи­тель­но ана­ли­ти­че­ских или исклю­чи­тель­но опи­са­тель­ных гра­фи­ков. Кро­ме того, один и тот же гра­фик может иметь раз­лич­ные функ­ции: быть источ­ни­ком инфор­ма­ции для чита­те­лей и инстру­мен­том для иссле­до­ва­ния и ана­ли­за для авто­ра.

Но, тем не менее, в зави­си­мо­сти от типа гра­фи­ка, он может быть эффек­тив­нее исполь­зо­ван для ана­ли­за или опи­са­ния. Напри­мер, линей­ные гра­фи­ки – самые попу­ляр­ные, соглас­но Эдвар­ду Таф­ти (Edward Tufte), – и гисто­грам­мы, как пра­ви­ло, исполь­зу­ют­ся для того, что­бы опи­сы­вать. То же самое мож­но ска­зать и о кру­го­вых диа­грам­мах.

Точеч­ные же диа­грам­мы, наобо­рот, выхо­дят за рам­ки опи­са­ния и дают чита­те­лю воз­мож­ность ана­ли­зи­ро­вать дан­ные на иссле­до­ва­тель­ском уровне.

Такие гра­фи­ки поз­во­ля­ют «видеть то, что может про­ис­хо­дить за пре­де­ла­ми уже опи­сан­но­го» [Cleveland and McGill, 1984]. Дру­ги­ми сло­ва­ми, это ско­рее ана­ли­ти­че­ские гра­фи­ки.

Неза­ви­си­мо от фор­мы, гра­фи­ки, кото­рые исполь­зу­ют­ся вме­сто таб­лиц, носят в основ­ном опи­са­тель­ную функ­цию
В то вре­мя, как фор­ма пред­став­ле­ния инфор­ма­ции опре­де­ля­ет ее слож­ность, это не един­ствен­ный фак­тор, вли­я­ю­щий на пози­цию гра­фи­ка в кон­ти­ну­у­ме «ана­ли­ти­че­ский» – «дескрип­тив­ный». Неза­ви­си­мо от фор­мы, гра­фи­ки, кото­рые исполь­зу­ют­ся вме­сто таб­лиц, носят в основ­ном опи­са­тель­ную функ­цию [Tukey, 1988]. Тип и коли­че­ство инфор­ма­ции, пред­став­лен­ной на гра­фи­ке, так­же вли­я­ет на воз­мож­ность его ана­ли­за.

Суще­ству­ет раз­ни­ца меж­ду визу­аль­ны­ми эле­мен­та­ми гра­фи­ка (напри­мер, линии гра­фи­ка), зна­чи­мы­ми дан­ны­ми, выде­лен­ны­ми на гра­фи­ке (напри­мер, дета­ли, каса­ю­щи­е­ся одной точ­ки), и всем набо­ром дан­ных, кото­рый исполь­зо­вал­ся для созда­ния гра­фи­ка. Все эти ком­по­нен­ты и их пред­став­ле­ние варьи­ру­ют от гра­фи­ка к гра­фи­ку.

Пример гистограммы Источник: Wikimedia Commons
При­мер гисто­грам­мы Источ­ник: Wikimedia Commons

На гисто­грам­мах обыч­но пред­став­лен базо­вый набор инфор­ма­ции, и они, как пра­ви­ло, эффек­тив­но исполь­зу­ют­ся в теле­ви­зи­он­ном веща­нии, иссле­до­ва­тель­ских про­ек­тах, докла­дах и ста­тьях. Гисто­грам­мы явля­ют­ся одним из самых про­стых спо­со­бов визу­а­ли­за­ции дан­ных, и для пони­ма­ния содер­жа­ния таких гра­фи­ков, как пра­ви­ло, не тре­бу­ет­ся мно­го вре­ме­ни.

С дру­гой сто­ро­ны, в ана­ли­ти­че­ских гра­фи­ках содер­жит­ся боль­ше дан­ных, кото­рые чита­те­лям необ­хо­ди­мо изу­чить для пони­ма­ния пред­став­лен­ной инфор­ма­ции. По сло­вам Таф­ти, они «поощ­ря­ют чита­те­ля срав­ни­вать раз­ные дан­ные» – ана­ли­зи­ро­вать вза­и­мо­связь точек, линий и обла­стей гра­фи­ка.

Гра­фи­ки упро­ща­ют про­цесс ком­му­ни­ка­ции с чита­те­ля­ми, но пло­хой дизайн лег­ко может сде­лать дан­ные непо­нят­ны­ми и их зна­че­ние не оче­вид­ным даже для самых вни­ма­тель­ных чита­те­лей.

Гра­фик дол­жен давать чита­те­лям воз­мож­ность сфор­ми­ро­вать свое соб­ствен­ное мне­ние и под­ни­мать новые вопро­сы по дан­ной тема­ти­ке. Это основ­ная при­чи­на, по кото­рой гра­фи­ки долж­ны нести функ­цию ком­му­ни­ка­ции – что­бы доне­сти инфор­ма­цию от авто­ра к чита­те­лю, вызы­вать инте­рес, содей­ство­вать появ­ле­нию ново­го зна­ния.

Инструменты

С пони­ма­ни­ем потен­ци­а­ла гра­фи­ков в пред­став­ле­нии дан­ных ста­ли появ­лять­ся соот­вет­ству­ю­щие инстру­мен­ты для созда­ния гра­фи­ков. В насто­я­щий момент суще­ству­ет мно­же­ство раз­лич­ных ста­ти­сти­че­ских про­грамм, гра­фи­че­ских редак­то­ров и веб-при­ло­же­ний, поз­во­ля­ю­щих быст­ро созда­вать гра­фи­ки. О них мож­но подроб­но узнать в ста­тье «Набор инстру­мен­тов для постро­е­ния гра­фи­ков, блок-схем и диа­грамм» на Хаб­ра­ха­б­ре.

При этом осо­бое вни­ма­ние уде­ля­ет­ся воз­мож­но­сти изме­нять визу­аль­ный вид гра­фи­ка: про­пор­ции и пози­ции. Имен­но визу­аль­ное пред­став­ле­ние вли­я­ет на вос­при­я­тие, и одна и та же инфор­ма­ция может быть вос­при­ня­та по-раз­но­му в зави­си­мо­сти от гра­фи­ка. Напри­мер, сжав вре­мя на гра­фи­ке, мож­но полу­чить более дра­ма­ти­че­скую кар­ти­ну цено­вых изме­не­ний.

Сжатие графика
Сжа­тие гра­фи­ка

Таким обра­зом, эффек­тив­ность гра­фи­ка зави­сит от раз­ных состав­ля­ю­щих, а не толь­ко от типа гра­фи­ка: это соче­та­ние логи­ки, эсте­ти­ки и зна­че­ния. Это­го мож­но добить­ся, во-пер­вых, исполь­зуя раз­лич­ные ста­ти­сти­че­ские мето­ды ана­ли­за дан­ных для полу­че­ния зна­чи­мо­го сооб­ще­ния, а во-вто­рых, при­ме­няя эсте­ти­че­ские эле­мен­ты для при­вле­че­ния чита­те­лей и созда­ния для них неко­то­рой под­сказ­ки, как имен­но читать дан­ные.

гра­фик дол­жен «заста­вить чита­те­ля в первую оче­редь думать о содер­жа­нии, а не о мето­до­ло­гии, гра­фи­че­ском дизайне, тех­но­ло­гии или чем-то еще»

В резуль­та­те все­го это­го гра­фик дол­жен «заста­вить чита­те­ля в первую оче­редь думать о содер­жа­нии, а не о мето­до­ло­гии, гра­фи­че­ском дизайне, тех­но­ло­гии или чем-то еще», счи­та­ет Таф­ти. Так­же дан­ные, пред­став­лен­ные на гра­фи­ке, долж­ны быть важ­ны­ми и инте­рес­ны­ми, как для авто­ра, так и для чита­те­лей: «если дан­ные скуч­ные, у вас непра­виль­ные дан­ные» [Tufte, 1983].

Перегруженность информацией и подготовка читателя

Коли­че­ство дан­ных на гра­фи­ке – это, без­услов­но, выбор авто­ра, но нуж­но пом­нить о том, что, в целом, гра­фи­ки, содер­жа­щие мно­го дан­ных, выгля­дят более надеж­ны­ми. Но даже неза­ви­си­мо от коли­че­ства дан­ных гра­фик может ока­зать­ся слож­ным для вос­при­я­тия, если чита­тель видит такой тип гра­фи­ка впер­вые [Kosslyn 2006]. В таких слу­ча­ях, когда исполь­зу­ют­ся не самые рас­про­стра­нен­ные типы гра­фи­ков, име­ет смысл не пере­гру­жать гра­фик дан­ны­ми. Дан­ные мож­но добав­лять на гра­фик после того, как ауди­то­рия запом­ни­ла такой спо­соб пред­став­ле­ния инфор­ма­ции. После это­го дан­ный тип гра­фи­ка мож­но исполь­зо­вать для отоб­ра­же­ния более слож­ных дан­ных. Если же сра­зу нуж­но отоб­ра­зить на гра­фи­ке боль­шой набор дан­ных или это еди­нич­ный слу­чай, то луч­ше при­бег­нуть к зна­ко­мым всем типам гра­фи­ков, напри­мер, гисто­грам­ме или кру­го­вой диа­грам­ме.

Име­ет гра­фик зна­че­ние или нет – напря­мую зави­сит от спо­соб­но­сти чита­те­ля его понять и его зна­ком­ства с кон­крет­ным типом гра­фи­ка (что силь­но отли­ча­ет­ся у раз­ных людей). Таким обра­зом, эффек­тив­ность гра­фи­че­ско­го спо­со­ба пред­став­ле­ния инфор­ма­ции свя­за­на с гра­фи­че­ской гра­мот­но­стью обще­ства. То, что опре­де­лен­ные типы гра­фи­ков хоро­шо зна­ко­мы боль­шин­ству людей, может стать отправ­ной точ­кой для авто­ров: они могут начи­нать с про­стых гра­фи­ков, посте­пен­но добав­ляя более слож­ные эле­мен­ты. Здесь при­хо­дит­ся стал­ки­вать­ся с поис­ком балан­са меж­ду тра­ди­ци­ей и инно­ва­ци­ей: ценой инно­ва­ций в гра­фи­ках явля­ет­ся их эффек­тив­ность, но посто­ян­ное исполь­зо­ва­ние зна­ко­мых всем типов ведет к стаг­на­ции.

Ком­про­мис­сом в этой ситу­а­ции будет посте­пен­ное вве­де­ние новых эле­мен­тов, что ува­жи­тель­но к чита­те­лям, кото­рые не долж­ны чув­ство­вать себя ни умствен­но отста­лы­ми, ни так, как буд­то их застав­ля­ют ста­но­вить­ся ана­ли­ти­ка­ми дан­ных.

Ины­ми сло­ва­ми – инно­ва­ции нуж­ны, но в уме­рен­ных дозах. Не сле­ду­ет так же слиш­ком увле­кать­ся слож­ны­ми и абстракт­ны­ми пред­став­ле­ни­я­ми дан­ных, кото­рые созда­ют фети­ши в инфо­гра­фи­ке и пред­став­ля­ют собой инфо­гра­фи­че­ский нар­цис­сизм.

Один из спо­со­бов вве­де­ния инно­ва­ций – это пред­став­ле­ние новых гра­фи­че­ских форм в сопро­вож­де­нии подроб­ных инструк­ций, объ­яс­ня­ю­щих мето­ды созда­ния гра­фи­ка и то, как его сле­ду­ет читать.

График с инструкцией
Гра­фик с инструк­ци­ей

Так же инфо­гра­фи­ку мож­но рас­смат­ри­вать с дар­ви­нист­ской точ­ки зре­ния: если опре­де­лен­ный гра­фик про­шел испы­та­ние вре­ме­нем и стал попу­ляр­ным, воз­мож­но, он явля­ет­ся луч­шим спо­со­бом пред­став­ле­ния дан­но­го типа инфор­ма­ции.

Выбор графика

При выбо­ре типа гра­фи­ка, наи­бо­лее под­хо­дя­ще­го к име­ю­щим­ся дан­ным, нуж­но учи­ты­вать три фак­то­ра: соот­вет­ствие кон­тек­сту, в кото­ром будет нахо­дить­ся гра­фик, – обра­зо­ва­ние и куль­тур­ный уро­вень потен­ци­аль­ных чита­те­лей.

Напри­мер, гисто­грам­ма – один из самых рас­про­стра­нен­ных типов гра­фи­ков для боль­ших дан­ных, хотя кру­го­вая диа­грам­ма может выпол­нять ту же функ­цию. Но, соглас­но эмпи­ри­че­ским иссле­до­ва­ни­ям, то, поче­му один тип гра­фи­ков более попу­ляр­ный, – это не толь­ко вопрос вку­са, но и во мно­гом зави­сит от эффек­тив­но­сти гра­фи­ка.

Клив­ленд и Мак­Гилл (Cleveland и McGill) в сво­ем иссле­до­ва­нии про­де­мон­стри­ро­ва­ли, что кру­го­вая диа­грам­ма застав­ля­ет чита­те­лей силь­нее оши­бать­ся в оцен­ке раз­ни­цы меж­ду дву­мя пред­став­лен­ны­ми груп­па­ми дан­ных, чем гисто­грам­ма. Чита­те­ли посто­ян­но недо­оце­ни­ва­ли раз­ни­цу меж­ду сек­то­ра­ми кру­го­вой диа­грам­мы, в то вре­мя как иска­же­ние в вос­при­я­тии было незна­чи­тель­ным, когда дан­ные были пред­став­ле­ны в виде поло­сок гисто­грам­мы.

Круговая диаграмма и гистограмма
Кру­го­вая диа­грам­ма и гисто­грам­ма

Пра­ви­ло, общее для всех гра­фи­ков, – визу­аль­ное вос­при­я­тие долж­но быть настоль­ко про­стым, насколь­ко это воз­мож­но. Цве­та и гра­ди­ен­ты, исполь­зу­е­мые вме­сто гео­мет­ри­че­ских осо­бен­но­стей гра­фи­ка (длин­на, объ­ем и т.д.) уве­ли­чи­ва­ют риск иска­же­ния вос­при­я­тия [Cleveland and McGill, 1984].

Таким обра­зом, исполь­зо­ва­ние гра­фи­ков, соот­вет­ству­ю­щих име­ю­щим­ся дан­ным и кон­крет­ной ситу­а­ции, помо­жет сде­лать про­цесс ком­му­ни­ка­ции наи­бо­лее эффек­тив­ным.

Источники:

  1. Kosslyn S.M. Graph design for the eye and mind, Oxford University Press, 2006.
  2. Fienberg S.E. Graphical methods in statistics, The American Statistician, Vol. XXXIII, No. 4, p. 165–178, American Statistical Association, 1979.
  3. Tufte E.R. The visual display of quantitative information, Graphics Press, 1983.
  4. Tukey J.W. Some graphics and semigraphics displays, in Cleveland W. S., The collected works of John W. Tukey, p. 37–62, Pacific Grove, Wadsworth & Brooks, 1988.
  5. Tufte E.R. Envisioning information, Graphics Press, 1990.
  6. Kosslyn S.M. Graphics and human information processing, Journal of the American Statistical Association, Vol. LXX, No. 391, p. 499–512, 1985.
  7. Cleveland W.S. and McGill R. Graphical perception: theory, experimentation, and application to the development of graphical methods, Journal of the American Statistical Association, No. 79, p. 531–554, 1984.