Friends Don't Let Friends как не надо визуализировать данные
Знакомо ли вам чувство, когда после часов работы над графиком остаётся ощущение, что он «какой-то не такой»? Проект Chenxin Li собрал коллекцию самых распространённых ошибок в визуализации данных — тех, что регулярно проскакивают даже в научных публикациях.
Почему этот проект стоит внимания
Созданный исследователем из Университета Джорджии, этот репозиторий — не просто список запретов, а подробное руководство по осмысленной визуализации. Каждый пример сопровождается:
- Наглядными сравнениями «до» и «после»
- Объяснением, почему конкретный подход проблематичен
- Альтернативными вариантами представления данных

Топ-5 антипаттернов, которые стоит знать каждому
1. Столбчатые диаграммы для сравнения средних
Классика жанра: две группы с одинаковым средним, но разным распределением выглядят идентично на bar plot. Решение — использовать графики, показывающие распределение: violin plots, box plots или просто точки с джиттером.
2. «Грибные полянки» из графиков
Когда в многофакторном эксперименте рисуют десятки однотипных столбчатых диаграмм (автор называет это «bar plot meadow»), читателю приходится продираться сквозь них как через густой лес. Гораздо эффективнее — продуманная группировка данных и фасетные графики.

3. Цветовые шкалы-обманки
Библиотеки визуализации часто предлагают красочные градиенты по умолчанию, но:
- Красно-зелёные шкалы бесполезны для 6% мужчин с дальтонизмом
- Радужные градиенты плохо переводятся в ч/б
- Неочевидные цветовые переходы могут искажать восприятие данных
Решение — использовать проверенные палитры типа viridis.
4. Круговые диаграммы и их коварные родственники
Автор предлагает радикальное решение: «Friends Don't Let Friends Make Pie Charts». Человеческий глаз плохо сравнивает углы и площади, поэтому сегменты круга — не лучший способ показать пропорции. Ещё хуже — концентрические кольца, где внешние сегменты автоматически кажутся больше внутренних.
5. «Спящие» тепловые карты
Тепловая карта без переупорядочивания строк и столбцов часто выглядит как случайный шум. Простая перестановка элементов по сходству может выявить скрытые паттерны.

Кому пригодится этот проект
- Научным сотрудникам, готовящим публикации — избежите типичных ошибок в статьях
- Data scientist'ам — улучшите читаемость отчётов
- Преподавателям статистики — наглядные примеры для студентов
- Разработчикам дашбордов — узнаете принципы осмысленной визуализации
Как использовать репозиторий
Проект содержит R-скрипты для воспроизведения всех примеров. Для работы понадобятся:
install.packages("rmarkdown")
install.packages("ggplot2")
# И другие зависимости из скриптов
Каждый пример сопровождается кодом, который можно адаптировать под свои данные.
Этот проект — как внимательный коллега, который вовремя останавливает вас фразой «Друг не позволит другу сделать плохой график». 6800 звёзд на GitHub подтверждают: проблема актуальна, а решения — работают.
Главный урок: прежде чем выбрать тип визуализации, спросите себя — что именно вы хотите показать? Разницу средних? Распределение? Относительные пропорции? Ответ определит оптимальный формат.
P.S. Автор обещает пополнять коллекцию — стоит следить за обновлениями!