Friends Don't Let Friends как не надо визуализировать данные

03 Sep, 2025

Знакомо ли вам чувство, когда после часов работы над графиком остаётся ощущение, что он «какой-то не такой»? Проект Chenxin Li собрал коллекцию самых распространённых ошибок в визуализации данных — тех, что регулярно проскакивают даже в научных публикациях.

Почему этот проект стоит внимания

Созданный исследователем из Университета Джорджии, этот репозиторий — не просто список запретов, а подробное руководство по осмысленной визуализации. Каждый пример сопровождается:

  • Наглядными сравнениями «до» и «после»
  • Объяснением, почему конкретный подход проблематичен
  • Альтернативными вариантами представления данных

Пример исправления графика

Топ-5 антипаттернов, которые стоит знать каждому

1. Столбчатые диаграммы для сравнения средних

Классика жанра: две группы с одинаковым средним, но разным распределением выглядят идентично на bar plot. Решение — использовать графики, показывающие распределение: violin plots, box plots или просто точки с джиттером.

2. «Грибные полянки» из графиков

Когда в многофакторном эксперименте рисуют десятки однотипных столбчатых диаграмм (автор называет это «bar plot meadow»), читателю приходится продираться сквозь них как через густой лес. Гораздо эффективнее — продуманная группировка данных и фасетные графики.

Пример улучшенной визуализации

3. Цветовые шкалы-обманки

Библиотеки визуализации часто предлагают красочные градиенты по умолчанию, но:

  • Красно-зелёные шкалы бесполезны для 6% мужчин с дальтонизмом
  • Радужные градиенты плохо переводятся в ч/б
  • Неочевидные цветовые переходы могут искажать восприятие данных

Решение — использовать проверенные палитры типа viridis.

4. Круговые диаграммы и их коварные родственники

Автор предлагает радикальное решение: «Friends Don't Let Friends Make Pie Charts». Человеческий глаз плохо сравнивает углы и площади, поэтому сегменты круга — не лучший способ показать пропорции. Ещё хуже — концентрические кольца, где внешние сегменты автоматически кажутся больше внутренних.

5. «Спящие» тепловые карты

Тепловая карта без переупорядочивания строк и столбцов часто выглядит как случайный шум. Простая перестановка элементов по сходству может выявить скрытые паттерны.

Тепловая карта до и после

Кому пригодится этот проект

  • Научным сотрудникам, готовящим публикации — избежите типичных ошибок в статьях
  • Data scientist'ам — улучшите читаемость отчётов
  • Преподавателям статистики — наглядные примеры для студентов
  • Разработчикам дашбордов — узнаете принципы осмысленной визуализации

Как использовать репозиторий

Проект содержит R-скрипты для воспроизведения всех примеров. Для работы понадобятся:

install.packages("rmarkdown")
install.packages("ggplot2")
# И другие зависимости из скриптов

Каждый пример сопровождается кодом, который можно адаптировать под свои данные.

Этот проект — как внимательный коллега, который вовремя останавливает вас фразой «Друг не позволит другу сделать плохой график». 6800 звёзд на GitHub подтверждают: проблема актуальна, а решения — работают.

Главный урок: прежде чем выбрать тип визуализации, спросите себя — что именно вы хотите показать? Разницу средних? Распределение? Относительные пропорции? Ответ определит оптимальный формат.

P.S. Автор обещает пополнять коллекцию — стоит следить за обновлениями!