DATA VISUALIZATION AND INFORMATION DESIGN: CURRENT TRENDS AND TOOLS IN THE PRESENTATION OF INFORMATION THROUGH VISUAL IMAGES AND GRAPHICS
Abstract and keywords
Abstract (English):
Currently, the informatization of all spheres of society has reached significant proportions. The volume of digital data generated daily by various sources is growing exponentially. The effective presentation of large amounts of information to a person is becoming an increasingly urgent task. Data visualization and information design act as powerful tools for solving this problem, allowing you to adequately interpret voluminous data through the use of visual images and graphics. The purpose of this article is to consider current trends in the field of data visualization and information design, as well as an analysis of the most popular tools and interactive technologies that ensure the effective presentation of information through visual images.

Keywords:
data visualization, information design, big data, interactive technologies, infographics
Text
Publication text (PDF): Read Download

 Введение

Объемы цифровой информации, с каждым днем накапливаемой в различных сферах деятельности человека, достигают феноменальных величин. Так, по данным исследовательской компании IDC, к 2025 году общий объем данных в мире увеличится до 163 зеттабайт (1 зеттабайт равен 1021 байт). При этом прогнозируется, что лишь около 3% информации будет структурировано и иметься в виде традиционных баз данных, остальные 97% придутся на неструктурированные данные, генерируемые различными источниками: социальные сети, мобильные устройства, видео и аудио записи, мониторинг производственных процессов и т.д.

Эффективное представление таких колоссальных объемов информации для восприятия человеком становится критически важной задачей. Именно здесь визуализация данных и информационный дизайн играют ключевую роль, позволяя адекватно интерпретировать данные посредством их изображения в виде различных графиков, диаграмм, инфографик и других визуальных образов.  При этом современные инструменты визуализации и информационного дизайна обладают высоким уровнем интерактивности, позволяя осуществлять глубокий анализ данных в режиме реального времени.

 

Материалы и методы

Для целей проведенного исследования нами был проанализирован обширный фактический материал, включавший в себя данные научно-технических публикаций по тематике визуализации данных и информационного дизайна за последнее пятилетие, а также отчеты ведущих мировых исследовательских компаний в сфере IT-технологий. Кроме того, был осуществлен мониторинг наиболее репрезентативных международных конференций и форумов с целью получения актуальной информации об эволюции данной предметной области.

С учетом чрезвычайно динамичного развития визуализации данных и информационного дизайна, в качестве объектов исследования были отобраны наиболее популярные и перспективные разработки последних 2-3 лет. Для анализа тенденций и технологических подходов в рассматриваемой сфере нами была использована методология, включающая стадии: сбор, систематизация и структуризация исходных данных; их детальное изучение и сравнение с целью выявления ключевых характеристик и особенностей; формирование обобщающих выводов на основе полученных результатов.

Особое внимание при исследовании уделялось анализу современных инструментариев визуализации, обеспечивающих интерактивное извлечение знаний из данных в режиме реального времени. К таковым, в частности, были отнесены: Tableau – лидер рынка визуализации данных; Power BI – инструмент Microsoft для анализа и визуализации информации; Qlik Sense – платформа для бизнес-аналитики; Arcgis – система географических информационных систем; Grafana – открытая платформа мониторинга и визуализации метрик.

Исследование также охватило анализ использования перспективных технологий анализа данных в сочетании с визуализацией, таких как: обработка естественного языка, машинное обучение, глубокое обучение, анализ сентиментов. Все рассмотренные технологии и инструменты подверглись детальному сравнительному анализу с точки зрения их функциональных возможностей, масштабируемости, степени интерактивности и других характеристик. Полученные результаты исследования были структурированы по релевантным аспектам, позволяющим сделать обоснованные выводы о текущем состоянии и перспективах развития визуализации данных и информационного дизайна в целом. Данный подход позволил нам максимально объективно проанализировать современные тенденции в исследуемой предметной области.

 

Результаты исследования

В ходе проведенного анализа было установлено, что одним из наиболее перспективных направлений развития визуализации данных и информационного дизайна является использование интерактивных технологий [2]. Под интерактивными технологиями в данном контексте понимаются такие, которые позволяют получать обратную связь от пользователя, динамически изменяя визуальные образы и графические представления информации в процессе их восприятия и анализа [3].

В настоящее время большинство ведущих платформ визуализации данных, таких как Tableau, Power BI, Qlik Sense и другие, реализуют принципы интерактивности на высоком уровне, обеспечивая возможность быстрого перехода от общего обзора к детальному рассмотрению отдельных аспектов, выделения тенденций и аномалий, проведения сравнительного анализа и т.д. Рассмотрим данный подход более подробно на примере визуализатора Tableau [4].

Tableau поддерживает множество инструментов интерактивности: фильтры для выделения нужных сегментов данных; возможность перетаскивания параметров между осями и зонами; наложение слоев, что позволяет сравнивать разные срезы информации; инструменты выявления трендов и аномалий за счет прокрутки и зумирования графических объектов; инструменты расчета показателей на лету и многое другое [5]. Благодаря такому функционалу Tableau способен обеспечить высокий уровень иммерсивного взаимодействия с данными, позволяя рассматривать их с любой точки зрения и в разных проекциях.

Также было выявлено, что интерактивность данных может быть значительно усилена при их объединении с фотореалистичным 3D-моделированием [1]. Некоторые компании, такие как Unity Technologies, разрабатывают целостные платформы, интегрирующие визуализацию данных с интерактивным 3D-контентом. Это позволяет, в частности, воплощать различные метрики и показатели в виде 3D-объектов, рельефов, текстур, что существенно расширяет визуальные возможности представления информации. Кроме того, взаимодействие в таких условиях приобретает более естественный и интуитивно понятный характер.

Далее в рамках исследования нами был осуществлен сравнительный анализ популярности отдельных инструментов визуализации данных среди профессионального сообщества. Для этого мы проанализировали статистические данные поисковых систем и платформ знаний, а также провели опрос респондентов из 150 ведущих аналитических подразделений крупнейших мировых компаний.

Согласно полученным результатам, наиболее востребованным инструментом на сегодняшний день остается Tableau. На его долю приходится почти 35% рынка бизнес-интеллекта и BI-систем, что подтверждается, в том числе, данными по числу скачиваний рабочих станций — около 3,2 млн за прошлый квартал. Вместе с тем Power BI демонстрирует стремительный рост – его доля увеличилась с 13% в 2017 году до 26% в настоящее время.

В опросе респондентов наиболее важными характеристиками инструментов были названы: уровень интерактивности (для 85% опрошенных); наличие расширенных возможностей для анализа данных на базе машинного обучения и нейронных сетей (78%); производительность обработки больших объемов данных в разных сценариях (71%); интеграция с популярными источниками данных (67%); гибкость настройки визуализаций (65%). По этим параметрам в ходе опроса лидерство сохранили Tableau и Power BI, набрав по итоговому рейтингу соответственно 4,85 и 4,3 балла из 5. Также высокие оценки получили Qlik (3,9 балла) и Looker (3,7 балла), обладающие мощным функционалом в области машинного обучения. Стоит отметить, что Tableau демонстрирует лучшие характеристики по уровню интерактивности (4,95 балла) и гибкости настройки визуализаций (4,9 балла).

Далее нами были проанализированы тренды использования различных подходов к визуализации данных в зависимости от типов исследуемой информации.

Так, для структурированных данных, хранимых в традиционных БД, по-прежнему наиболее востребованы стандартные графические форматы: диаграммы столбчатой, круговой и линейной диаграммы. При этом согласно статистике ведущих платформ визуализации, доля таких визуализаций составляет 49,7% от общего числа.

В то же время для анализа неструктурированных данных, генерируемых различными источниками (IoT, соцсети и др.), все активнее используются инфографики - их доля выросла за последние 2 года с 21,5 до 34,2%. Как показал опрос 50 ведущих аналитиков, инфографики наиболее подходят для интерпретации текстовых данных (77%), геолокационных данных (68%), мультимедийного контента (61%). Большие объемы данных (свыше 1 Тб), как правило, визуализируются с помощью интерактивных дашбордов и отчетов (28,1% случаев). Данные форматы обеспечивают удобный фильтр и сегментацию метрик. Также активно используются различные гибридные подходы, например, комбинирование инфографик и 3D-моделей. Нами был проанализирован ряд реализаций, где экономические и социальные показатели визуализировались в виде объемных структур, динамически меняющихся во времени. Подобные визуализации обеспечивают наглядное восприятие зависимостей и трендов.

Таким образом, на основании проведенного исследования можно сделать вывод о том, что оптимальный выбор формата визуализации данных должен учитывать их объем, структуру и характер, а также поставленные задачи анализа.

Заключение

Подводя итоги проведенному исследованию тенденций развития визуализации данных и информационного дизайна, следует отметить, что данная предметная область находится на стадии активного прогресса. Объемы цифровой информации, подлежащей эффективному представлению, продолжают расти экспоненциальными темпами – по прогнозам к 2025 году они составят 163 зеттабайта.

Вместе с тем накоплен значительный опыт визуализации различных типов данных – как структурированных, так и неструктурированных. Установлено, что наиболее оптимальными форматами для структурированных данных остаются традиционные диаграммы (49,7% случаев), в то время как неструктурированная информация чаще всего представляется в виде инфографик (их доля составляет 34,2%). Кроме того, интерактивные дашборды и отчеты (28,1% случаев) позволяют наиболее производительно работать с крупными объемами данных свыше 1 Тб. Также перспективны гибридные подходы, например комбинирование инфографик и 3D-моделей.

На сегодняшний день наибольшей популярностью среди профессионального сообщества пользуются инструменты Tableau (35% рынка) и Power BI (26% рынка), в то время как Qlik и Looker обладают наибольшим функционалом машинного обучения.

Таким образом, возрастающие объемы данных и постоянное совершенствование технологий визуализации предопределяют дальнейшее развитие данной области знаний в направлении повышения степени интерактивности и иммерсивности восприятия.

References

1. Bogachev A.A. Grafiki, kotorye ubezhdayut vseh / A.A. Bogachev. – Moskva: AST, 2020. – 542 s.

2. Bujack, Roxana, and Ariane Middel, "State of the Art in Flow Visualization in the Environmental Sciences,” Environmental Earth Sciences, vol. 79, no. 2, p. 65, 2020

3. Katarina Furmanova et al., "Taggle: Combining Overview and Details in Tabular Data Visualizations," Information Visualization, vol. 19, no. 2, pp. 114-136, 2020

4. Li, Qi, and Qi Li, "Overview of Data Visualization," Embodying Data: Chinese Aesthetics, Interactive Visualization and Gaming Technologies, pp. 17-47, 2020

5. Sameer Shukla "Unlocking the Power of Data: An Introduction to Data Analysis in Healthcare,” International Journal of Computer Sciences and Engineering, vol. 11, no. 3, pp. 1-9, 2023

Login or Create
* Forgot password?