Роль методов визуализации учебной информации в обучении. Технология визуализации учебной информации

ВИЗУАЛИЗАЦИЯ РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТАЛЬНЫХ ИССЛЕДОВАНИЙ

(Томск, Томский политехнический университет)

Введение. Область применения и возможности численного экспериментов растут вместе с развитием вычислительной техники. Увеличиваются сложности и многообразие решаемых задач. Огромный объём получаемой в ходе эксперимента информации требует адекватных способов её представления. Вместо массивов числовых данных и простых графиков всё шире используются наглядные визуальные образы, облегчающие полноценное и своевременное осмысление получаемых результатов.

Визуализация данных – задача, с которой сталкивается в своей работе любой исследователь. К задаче визуализации данных сводится проблема представления в наглядной форме данных эксперимента или результатов теоретического исследования. Традиционные инструменты в этой области – графики и диаграммы – плохо справляются с задачей визуализации, когда возникает необходимость изобразить более трех взаимосвязанных величин. С другой стороны, существует мощнейший инструмент изображения информации, привязанной к географической сетке координат. Это очень быстро развивающийся сегодня арсенал ГИС-технологий (ГИС – геоинформационные системы). К сожалению, как только исчезает подложка для изображения информационных слоев – географическая карта – все методы ГИС остаются не у дел.

Основные принципы визуализации информации. Для оптимального отображения информации в приводится ряд рекомендаций, которые могут быть использованы при разработке подсистем визуализации:

1. Состав и форма отображаемой информации, а также задачи и цели подсистемы визуализации определяются целями и задачами системы. В информационные модели должны быть представлены только те свойства отношения, связи управляемых объектов, которые существенны и имеют определенное функциональное значение. Объем, состав, форма предъявленной информации должна соответствовать как решаемым задачам, так и психофизиологическим возможностям человека.

2. Модель должна быть наглядной, т. е. оператор должен иметь возможность воспринимать сведения быстро и без кропотливого анализа. Таким образом, модель может давать наглядное представление о пространственном расположении объектов, что означает быть геометрически подобной их действительному расположению. В этом случае оператор будет иметь наглядное представление о таких свойствах управляемых объектов, как расстояние между ними, их принадлежность к какой-либо территориальной группе и т. п.

Достоинства наглядных моделей заключаются в том, что процесс восприятия такой же, как процесс восприятия реального объекта. Основная задача при разработке наглядных информационных моделей заключается в определении признаков, которые целесообразно отобразить наглядно и в допустимой степени схематизации. Но наглядность информационных моделей не всегда легко достижима, так как нередки случаи, когда объекты управления не обладают наглядными признаками. В этих случаях приходится решать задачи, близкие к тому, что в методологии науки определяется как визуализация понятий. Информационные модели, построенные по данному принципу, называются абстрактными, Достоинства абстрактных моделей заключается в том, что они отображают свойства объекта, которые недоступны непосредственному наблюдателю.

3. Достижением легкой воспринимаемости отображаемой информации обеспечивается правильной организацией ее структуры. Это означает, что в информационной модели должны быть представлены не коллекция или пара сведений, так или иначе упорядоченных, а находящиеся к определенном и очевидном взаимодействии. Одним из средств достижения оптимальной структуры является хорошая компоновка информационной модели. В этом смысле разработка отображения на экране представляет собой задачу в какой-то степени эквивалентную задаче хорошей компоновки картины.

4. Важнейшим психическим процессом при слежении за сложными динамическими образами является антиципация , т. е. возможность прогнозирования развития ситуации оператором, для обеспечения которой следует наглядно графически отображать изменения параметров. Данное положение обеспечивается, если при проектировании информационной модели предусмотрено:

Отображение конкретных изменений свойств элементов ситуации, которые происходят при их взаимодействии. В этих случаях изменения свойств отдельных элементов воспринимаются не изолированно, а в контексте ситуации в целом. Более того, изменение свойств одного элемента воспринимается как симптом изменения ситуации в: целом;

Отображение динамических отношений управляемых объектов. При этом связи и взаимодействия информационной модели должны отображаться в развитии;

Отображение конфликтных отношений, в которые вступают элементы ситуации.

5. Компоновка информации на экране должна учитывать, что горизонтальные движения глаз совершаются наиболее легко и быстро. Скорость движения глаз по кривым зависит от формы, и с помощью выбора формы можно варьировать время фиксации взгляда в той или иной области экрана. В местах расположения наиболее важных данных для процесса управления помещают структурные элементы, при движении по которым снижается скорость движения глаз.

Кодирование информации формой. Наиболее информативным обозначением тождественности информации является кодирование данных формой. Известно, что время декодирования и период латентной реакции на предметное изображение минимально по сравнению с другими методами кодирования (среднее время реакции на предмет – 0,4с, на цветное изображение – 0,9с, время фиксации взгляда па простых геометрических фигурах – 0,18мс, на буквах и цифрах – 0,3мс).

Основное значение при восприятии формы человеком имеет отношение "фигура-фон". Данное отношение имеет несколько видов описания:

Фигура имеет форму, фон относительно бесформен, фигура имеет характер вещи, фон же выглядит как неоформленный материал;

Фигура имеет, тенденцию выступать вперед, фон - отступать назад, фон кажется непрерывно продолжающимся позади фигуры;

Фигура производит большее впечатление, чем фон и легче запоминается.

В психологии эмпирически выявлены некоторые принципы организации поля сигналов, пользуясь которыми можно влиять на отношение "фигура-фон".

1. Чем меньшую замкнутую площадь занимает какая-либо конфигурация, тем больше тенденция именно этому изображению выступать в роли фигуры.

2. В качестве фигуры, прежде всего, выделяются замкнутые конфигурации.

3. Симметричные конфигурации легче воспринимаются как фигуры, чем конфигурации ассиметричные.

4. В том случае, когда поле изображения заполнено однородными элементами, фигуру образуют те из них, которые пространственно расположены ближе друг к другу.

5. Если поле изображения заполнено разнородными элементами, то фигура образуется, прежде всего, теми из них, которые имеют сходство по форме или цвету.

6. Если те или иные элементы перемещаются по полю изображения в одном направлении и с одинаковой скоростью, то именно они выделяются как фигура.

7. Если расположить часть элементов в определенном порядке, то можно создать у наблюдателя установку, которая повлияет на восприятие остальных элементов.

Решающий момент выделения фигуры из фона имеет восприятие контура. Именно восприятие контура обеспечивает возможность дифференцированного восприятия формы, известного единства строения, пропорций и взаимосвязи частей. При восприятии контура наиболее информативными являются точки, в которых происходит резкое изменение направления линий.

Чем сильнее контраст между фоном и фигурой, тем легче и быстрее происходит выделение фигуры. Контур любой фигуры - это комбинации элементарных форм: прямая линия, угол и т. д. Вырез в фигуре или контуре различается лучше, чем выступ. Достаточно хорошо глаз воспринимает также величины углов. Чем сложнее контур фигуры, чем больше информации получает при восприятии человек. Процент ошибки опознания для симметричных фигур меньше, чем для несимметричных. Но при этом необходимо учитывать, что на сложном фоне правильность опознании контуров уменьшается. При кодировании данных формой используются следующие типы или методы: числом точек, линий, величиной площади фигуры, пространственной конфигурации изображения.

Кодирование числом точек используется для обозначения числа объектов в группе или числа групп; при этом можно вместо точек использовать простые геометрические фигуры. Человек без счета может определить количество точек, расположенных в случайном порядке, если их не более пяти. Если же количество точек больше пяти, то число ошибок опознании резко увеличивается. Группировка точек в определенные схемы увеличивает точность оценки их количества. Если точки предъявляются на фоне других групп, сходных по структуре, то опознавание таких конфигураций резко понижается.

Размер или область, занятая какой-то конфигурацией, также может эффективно представлять значение данных, хотя подобно длине это плохая размерность стимула для кодирования тождественности данных. Эффективное разрешение при кодировании размером меньше, чем при кодировании длиной, потому что для кодирования размером требуется большая область отображения в пересчете ни единицу данных. Однако, такое кодирование оказывает большой психологический эффект. Достаточно хорошо идентифицируется 4-5 градаций фигур но площади. Использование изображений объемных тел нецелесообразно, так как при оценке величины человек обычно ориентируется на площадь фигуры, а не на ее объем. При сравнении с некоторыми эталонами, находящимися в информационном поле оператора, точность оценки величины площади фигуры резко возрастает. Кроме всего сказанного можно добавить, что само изменение площади фигуры несет в себе некоторую информацию, а размещение изображения в определенном месте поля зрения оператора может нести определенную смысловую нагрузку.

Представление информации в виде образов. Наиболее эффективным и несущим наибольший объем информации является представление данных в виде образов или картин. Восприятие человека устроено гак, что его мозг, взаимодействуя с внешним миром, воспринимая и осмысливая поступающую информацию, настраивается на определенные образы или эталоны, которые легко, без необходимого приспособления и тренировки, воспринимаются им и требуют дополнительного кодирования.

Основными преимуществами метода образного кодирования являются:

Возможность согласования большого потока информации с пропускной способностью сенсорных анализаторов человека;

Значительное сокращение объема ненужной информации;

Существенное снижение необходимости в априорных сведениях об изучаемом объекте;

Компактность в отношении занимаемой площади; .

Широкие возможности перестройки для обслуживания объектов различного назначения.

Поскольку человек - существо социальное, то наибольшее значение для него приобретают контакты с другими людьми. Это приводит к тому, что человек обучается распознавать огромное количество лиц. По выражению лица, мимике мы мгновенно определяем эмоциональнее состояние человека, но на ряду с основными эмоциональными состояниями мы различаем десятки их оттенков. Причем малейшие изменения. Этим определяется высокая информативность как самого лица, так и его выражения. Эта информативность лица передается в фотографиях, рисунках, карикатурах и т. д.

Анализ графической информации базируется на способности индивида интуитивно находить сходство и различия в объектах, при этом особенно хорошо запоминаются и распознаются черты лица. Указанные особенности человеческого восприятия эффективно используются в диаграммах "лица Чернова". Каждый объект представляет собой схематичное изображение лица, определенным чертам которого (ширине лица, длине носа, изгибу бровей, форме рта и т. д.) соответствуют относительные значения выбранных переменных (рис 1).

Рис.1. Примеры визуализации информации с помощью алгоритма Чернова.

Область применения системы лица разнообразна, но особенно перспективным является применение подобной системы для отображения медицинской информации, поскольку ряд физиологических характеристик человека непосредственно проявляется в чертах лица. Так по лицу можно с большой вероятностью правильно определить возраст человека, наличие избыточного веса, эмоциональное состояние, пол и т. п. Использование таких прямых ассоциаций резко сокращает время декодирования, т. е. перехода от изображения к исходному кодируемому значению параметра. Применение компьютерной графики, для синтеза изображения лиц из физиологических данных позволяет получать физиологический портрет испытуемого в прямом смысле этого слова.

Визуализация экспериментальных данных, представленных в виде числовых таблиц. В медико-психологических исследованиях результаты эксперимента часто представлены в виде числовых таблиц. Методы визуализации такого рода информации основаны, как правило, на переходе от многомерной к двумерной системе координат (метод главных компонент , методы структурного упорядочения, предложенные с соавторами ).

Рассмотрим алгоритм формирования координат объектов в методе начального упорядочения .

Для оценки рассогласования структур в RL и R2 вычисляется матрица взаимных расстояний dnk между элементами Xn и Xk из выборки X:

В n-й строке такой матрицы записаны расстояния от некоторого n-го элемента Xn до всех остальных (N-1) элементов множества https://pandia.ru/text/78/605/images/image004_27.gif" width="48" height="29 src="> до некоторого k-го элемента. Любую n-ю строку матрицы DN(X) можно рассматривать как результат упорядочения элементов относительно n-го элемента Xn путем отображения этого множества на числовую ось действительных чисел . Задавая на оси положение n-го элемента и принимая его за начало отсчета (точку Yn, координата которой на оси равна нулю), можно упорядочить образы выборки X на оси относительно n-го элемента, используя в качестве меры упорядочения расстояние от элемента Xn до всех остальных (N-1) элементов. Из точки Yn https://pandia.ru/text/78/605/images/image005_23.gif" width="23" height="24 src=">) построим перпендикулярно к оси другую числовую ось при этом k-й элемент выборки X расположим в точке пересечения осей https://pandia.ru/text/78/605/images/image008_14.gif" width="23" height="24 src=">.gif" width="48" height="29 src=">, подобно тому как это было осуществлено для оси . Координаты элементов на оси представляют собой расстояния от k-го элемента до всех остальных (N-1) элементов и позволяют судить о группируемости векторов около вектора Xk..gif" width="23" height="24 src="> определят некоторую псевдоплоскость . оценки и мониторинга психофизиологического состояния беременных женщин .

Эффективность данного метода зависит от “хорошего” выбора строк матрицы DN(X), который не должен быть совсем случаен. Выбор близких в RL элементов Xn и Xk в качестве центров упорядочения остальных (N-1) элементов на осях и нерационален, так как не дает существенно новой информации об упорядоченности выборки X, так что необходимо выбирать элементы X, относительно удаленные друг от друга. Поэтому в качестве центров упорядочения нами были выбраны «эталонный» объект и объект, имеющий наихудшие параметры (рис. 2).

Заключение. Суть приведенных методов - пути решения проблемы рационального обобщения и повышения наглядности отображаемой информации с целью создания оптимальных и комфортных условий труда оператора, с целью высвобождения его для решения задач высших уровней управления объектом или общей оценки задачи и условий функционирования на данном этапе принятия решений.

Результаты междисциплинарных исследований позволяют уверенно утверждать, что визуализация является одним из наиболее перспективных направлений повышения эффективности методов анализа и представления информации.

В работе представлены различные подходы к визуализации результатов экспериментальных социальных и медико-психологических исследований.

Работа выполнена при финансовой поддержке РГНФ (проект № в) и РФФИ (проект № а).

ЛИТЕРАТУРА

1. Зиновьев многомерных данных. - Красноярск: Изд. Красноярского государственного технического университета, 2000. - 180 с.

2. Современные методы представления и обработки биомедицинской информации: учебное пособие / Томский политехнический университет; Сибирский государственный медицинский университет; Под ред. ; . - Томск: Изд-во ТПУ, 2004. - 336 с.

3. , . Современные методы когнитивной визуализации многомерных данных - Томск: Некоммерческий фонд развития региональной энергетики, 2007. - 216 с.

4. , Эммануэль В. Информационные технологии в медико-биологических исследованиях. – СПб: Питер, 2003. – 528 с.

5. , . Аналитические исследования в медицине, биологии и экологии: учебное пособие - М. : Высшая школа, 2003. - 279 с.

6. , Шаропин система выявления групп риска среди беременных женщин //Информатика и системы управления, 2008, - № 2(16). - c. 22-23

Данная статья написана представителем компании DevExpress и опубликована в блоге на ХабраХабре.

Медицинские исследователи установили, что если в инструкции к лекарству находится только текст, человек усваивает из нее лишь 70% информации. Если же в инструкцию добавить картинки, человек усвоит уже 95%.

Очевидно, что человек предрасположен обрабатывать именно визуальную информацию. Помимо прекрасной обработки нашим мозгом, визуализация данных имеет несколько преимуществ:

  • Акцентирование внимания на разных аспектах данных


С помощью графиков можно легко обратить внимание читателя на красные показатели.

  • Анализ большого набора данных со сложной структурой
  • Уменьшение информационной перегрузки человека и удерживание его внимания
  • Однозначность и ясность выводимых данных
  • Выделение взаимосвязей и отношений, содержащихся в информации


На графике легко можно заметить важные данные.

Эстетическая привлекательность


Эстетически привлекательные графики делают подачу данных эффектной и запоминающейся.

Эдвард Тафти, автор одних из лучших книг по визуализации, описывает ее как инструмент для показа данных; побуждения зрителя задуматься о сути, а не методологии; избежания искажения того, что должны сказать данные; отображения многих чисел на небольшом пространстве; показа большого набора данных связным и единым целым; побуждения зрителя сравнивать фрагменты данных; служения достаточно четким целям: описанию, исследованию, упорядочиванию или украшению ().

Как правильно использовать визуализацию данных?

Успех визуализации напрямую зависит от правильности ее применения, а именно от выбора типа графика, его верного использования и оформления.


60% успеха визуализации зависит от выбора типа графика, 30% - от его правильного использования и 10% - от его верного оформления.

Правильный тип графика

График позволяет выразить идею, которую несут данные, наиболее полно и точно, поэтому очень важно выбрать подходящий тип диаграммы. Выбор можно осуществить по алгоритму:

Цели визуализации - это реализация основной идеи информации, это то, ради чего нужно показать выбранные данные, какого эффекта нужно добиться - выявления отношений в информации, показа распределения данных, композиции или сравнения данных.


В первом ряду показаны графики с целями показа отношений на данных и распределения данных, а во втором ряду целями являются показ композиции и сравнения данных.

Отношения в данных - это то, как они зависят друг от друга, связь между ними. С помощью отношений можно выявить наличие или отсутствие зависимостей между переменными. Если основная идея информации содержит фразы «относится к», «снижается/повышается при», то нужно стремиться показать именно отношения в данных.
Распределение данных - то, как они располагаются относительно чего-либо, сколько объектов попадает в определенные последовательные области числовых значений. Основная идея при этом будет содержать фразы «в диапазоне от x до y», «концентрация», «частотность», «распределение».

Композиция данных - объединение данных с целью анализа общей картины в целом, сравнения компонентов, составляющих процент от некоего целого. Ключевыми фразами для композиции являются «составило x%», «доля», «процент от целого».

Сравнение данных - объединение данных, с целью сравнения некоторых показателей, выявление того, как объекты соотносятся друг с другом. Также это сравнение компонентов, изменяющихся с течением времени. Ключевые фразы для идеи при сравнении - «больше/меньше чем», «равно», «изменяется», «повышается/понижается».

После определения цели визуализации требуется определить тип данных. Они могут по своему типу и структуре быть очень разнородными, но в самом простом случае выделяют непрерывные числовые и временные данные, дискретные данные, географические и логические данные. Непрерывные числовые данные содержат в себе информацию зависимости одной числовой величины от другой, например графики функций, такой как y=2x. Непрерывные временные содержат в себе данные о событиях, происходящих на каком-либо промежутке времени, как график температуры, измеряемой каждый день. Дискретные данные могут содержать в себе зависимости категорийных величин, например график количества продаж товаров в разных магазинах. Географические данные содержат в себе различную информацию, связанную с местоположением, геологией и другими географическими показателями, яркий пример - это обычная географическая карта. Логические данные показывают логическое расположение компонентов относительно друг друга, например генеалогическое древо семьи.


Графики непрерывных числовых и временных данных, дискретных данных, географических и логических данных.

В зависимости от цели и данных можно выбрать наиболее подходящий им график. Лучше всего избегать разнообразия ради разнообразия и выбирать по принципу «чем проще, тем лучше». Только для специфичных данных использовать специфичные типы диаграмм, в остальных же случаях хорошо подойдут самые распространенные графики:

  • линейный (line)
  • с областями (area)
  • колонки и гистограммы (bar)
  • круговая диаграмма (pie, doughnut)
  • полярный график (radar)
  • точечный график (scatter, bubble)
  • карты (map)
  • деревья (tree, mental map, tree map)
  • временные диаграммы (time line, gantt, waterfall).

Линейные диаграммы, графики с областями и гистограммы могут содержать в одном аргументе для одной категории несколько значений, которые могут быть как абсолютными (тогда к таким видам графикам прибавляется приставка stacked), так и относительными (full stacked).


График со stacked значениями и с full stacked

При выборе подходящего графика можно руководствоваться следующей таблицей, составленной на основе этой диаграммы и :


Правильное использование графика

Важно не только верно выбрать тип графика, но и правильно его использовать:

  • Не нужно нагружать график большим количеством информации. Оптимальное количество разных типов данных, категорий - это не более 4-5, иначе же целесообразнее разделить такую диаграмму на несколько штук.


Такой график можно сравнить со спагетти и лучше разделить на несколько диаграмм.

Верно выбрать шкалу и ее масштаб для графика. Для гистограмм и графиков с областями предпочтительнее начинать шкалу значений с нуля. Постараться не использовать инвертированные шкалы - это очень часто вводит зрителя в заблуждение относительно данных.


Неверная шкала отрицательно влияет на восприятие данных. В первом случае некорректно выбран масштаб, во втором шкала инвертирована.

  • Для круговых диаграмм и графиков, где показан процент от общей доли, сумма значений всегда должна составлять 100%.
  • Для лучшего восприятия данных информацию на оси лучше упорядочить - либо по значениям, либо по алфавиту, либо по логическому смыслу.

Правильное оформление графика

Ничто так не радует глаз, как правильно оформленные графики, и ничто так не портит диаграммы, как наличие графического «мусора». Основные принципы оформления:

  • использовать палитры похожих, не ярких цветов, и постараться ограничиться набором из шести штук
  • вспомогательные и второстепенные линии должны быть простыми и не бросающимися в глаза


Вспомогательные линии на графике не должны отвлекать внимание от основной идеи данных.

  • там, где возможно, использовать только горизонтальные надписи на осях;
  • для графиков с областями предпочтительнее использовать цвет с прозрачностью;
  • для каждой категории на графике использовать свой цвет.

Выводы

Визуализация - мощный инструмент донесения мыслей и идей до конечного потребителя, помощник для восприятия и анализа данных. Но как и все инструменты, ее нужно применять в свое время и в своем месте. В противном случае информация может восприниматься медленно, а то и некорректно.


На графиках изображены одни и те же данные, слева показаны основные ошибки визуализации, а справа они исправлены.

При умелом применении визуализация данных позволяет сделать материал впечатляющим, нескучным и запоминающимся.

"Говорят, один рисунок стоит тысячи слов, и это действительно так, но при условии, что рисунок хороший." Боумена

С возрастанием количества накапливаемых данных, даже при использовании сколь угодно мощных и разносторонних алгоритмов Data Mining, становится все сложнее "переваривать" и интерпретировать полученные результаты. А, как известно, одно из положений Data Mining - поиск практически полезных закономерностей. Закономерность может стать практически полезной, только если ее можно осмыслить и понять.

В 1987 году по инициативе ACM SIGGRAPH IEEE Computer Society Technical Committee of Computer Graphics, в связи с необходимостью использования новых методов, средств и технологий данных, были сформулированы соответствующие задачи направления визуализации.

К способам визуального или графического представления данных относят графики, диаграммы, таблицы, отчеты, списки, структурные схемы, карты и т.д.

Визуализация традиционно рассматривалась как вспомогательное средство при анализе данных, однако сейчас все больше исследований говорит о ее самостоятельной роли.

Традиционные методы визуализации могут находить следующее применение:

представлять пользователю информацию в наглядном виде;

компактно описывать закономерности, присущие исходному набору данных;

снижать размерность или сжимать информацию;

восстанавливать пробелы в наборе данных;

находить шумы и выбросы в наборе данных.

Визуализация инструментов Data Mining

Каждый из алгоритмов Data Mining использует определенный подход к визуализации. В предыдущих лекциях мы рассмотрели ряд методов Data Mining. В ходе использования каждого из методов, а точнее, его программной реализации, мы получали некие визуализаторы, при помощи которых нам удавалось интерпретировать результаты, полученные в результате работы соответствующих методов и алгоритмов.

Для деревьев решений это визуализатор дерева решений, список правил, таблица сопряженности.

Для нейронных сетей в зависимости от инструмента это может быть топология сети, график изменения величины ошибки, демонстрирующий процесс обучения.

Для карт Кохонена: карты входов, выходов, другие специфические карты.

Для линейной регрессии в качестве визуализатора выступает линия регрессии.

Для кластеризации: дендрограммы, диаграммы рассеивания.

Диаграммы и графики рассеивания часто используются для оценки качества работы того или иного метода.

Все эти способы визуального представления или отображения данных могут выполнять одну из функций:

являются иллюстрацией построения модели (например, представление структуры (графа) нейронной сети);

помогают интерпретировать полученный результат;

являются средством оценки качества построенной модели;

сочетают перечисленные выше функции (дерево решений, дендрограмма).

Визуализация Data Mining моделей

Первая функция (иллюстрация построения модели), по сути, является визуализацией Data Mining модели. Существует много различных способов представления моделей, но графическое ее представление дает пользователю максимальную "ценность". Пользователь, в большинстве случаев, не является специалистом в моделировании, чаще всего он эксперт в своей предметной области. Поэтому модель Data Mining должна быть представлена на наиболее естественном для него языке или, хотя бы, содержать минимальное количество различных математических и технических элементов.

Таким образом, доступность является одной из основных характеристик модели Data Mining. Несмотря на это, существует и такой распространенный и наиболее простой способ представления модели, как "черный ящик". В этом случае пользователь не понимает поведения той модели, которой пользуется. Однако, несмотря на непонимание, он получает результат - выявленные закономерности. Классическим примером такой модели является модель нейронной сети.

Другой способ представления модели - представление ее в интуитивном, понятном виде. В этом случае пользователь действительно может понимать то, что происходит "внутри" модели. Таким образом, можно обеспечить его непосредственное участие в процессе.

Такие модели обеспечивают пользователю возможность обсуждать ее логику с коллегами, клиентами и другими пользователями, или объяснять ее.

Понимание модели ведет к пониманию ее содержания. В результате понимания возрастает доверие к модели. Классическим примером является дерево решений. Построенное дерево решений действительно улучшает понимание модели, т.е. используемого инструмента Data Mining.

Кроме понимания, такие модели обеспечивают пользователя возможностью взаимодействовать с моделью, задавать ей вопросы и получать ответы. Примером такого взаимодействия является средство "что, если". При помощи диалога "системапользователь" пользователь может получить понимание модели.

Теперь перейдем к функциям, которые помогают интерпретировать и оценить результаты построения Data Mining моделей. Это всевозможные графики, диаграммы, таблицы, списки и т.д.

Примерами средств визуализации, при помощи которых можно оценить качество модели, являются диаграмма рассеивания, таблица сопряженности, график изменения величины ошибки.

Диаграмма рассеивания представляет собой график отклонения значений, прогнозируемых при помощи модели, от реальных. Эти диаграммы используют для непрерывных величин. Визуальная оценка качества построенной модели возможна только по окончанию процесса построения модели.

Таблица сопряженности используется для оценки результатов классификации. Такие таблицы применяются для различных методов классификации. Они уже использовались нами в предыдущих лекциях. Оценка качества построенной модели возможно только по окончанию процесса построения модели.

График изменения величины ошибки . График демонстрирует изменение величины ошибки в процессе работы модели. Например, в процессе работы нейронных сетей пользователь может наблюдать за изменением ошибки на обучающем и тестовом множествах и остановить обучение для недопущения "переобучения" сети. Здесь оценка качества модели и его изменения может оцениваться непосредственно в процессе построения модели.

Примерами средств визуализации, которые помогают интерпретировать результат, являются: линия тренда в линейной регрессии, карты Кохонена, диаграмма рассеивания в кластерном анализе.

Методы визуализации

Методы визуализации, в зависимости от количества используемых измерений, принято классифицировать на две группы :

представление данных в одном, двух и трех измерениях;

представление данных в четырех и более измерениях.

Представление данных в одном, двух и трех измерениях

К этой группе методов относятся хорошо известные способы отображения информации, которые доступны для восприятия человеческим воображением. Практически любой современный инструмент Data Mining включает способы визуального представления из этой группы.

В соответствии с количеством измерений представления это могут быть следующие способы:

одномерное (univariate) измерение, или 1-D;

двумерное (bivariate) измерение, или 2-D;

трехмерное или проекционное (projection) измерение, или 3-D.

Следует заметить, что наиболее естественно человеческий глаз воспринимает двухмерные представления информации.

При использовании двух- и трехмерного представления информации пользователь имеет возможность увидеть закономерности набора данных:

его кластерную структуру и распределение объектов на классы (например, на диаграмме рассеивания);

топологические особенности;

наличие трендов;

информацию о взаимном расположении данных;

существование других зависимостей, присущих исследуемому набору данных.

Если набор данных имеет более трех измерений, то возможны такие варианты:

использование многомерных методов представления информации (они рассмотрены ниже);

снижение размерности до одно-, двухили трехмерного представления. Существуют различные способы снижения размерности, один из них - факторный анализ - был рассмотрен в одной из предыдущих лекций. Для снижения размерности и одновременного визуального представления информации на двумерной карте используются самоорганизующиеся карты Кохонена.

Представление данных в 4 + измерениях

Представления информации в четырехмерном и более измерениях недоступны для человеческого восприятия. Однако разработаны специальные методы для возможности отображения и восприятия человеком такой информации.

Наиболее известные способы многомерного представления информации:

параллельные координаты;

∙ "лица Чернова";

лепестковые диаграммы.

Параллельные координаты

В параллельных координатах переменные кодируются по горизонтали, вертикальная линия определяет значение переменной. Пример набора данных, представленного в декартовых координатах и параллельных координатах, дан на рис. 16.1 . Этот метод представления многомерных данных был изобретен Альфредом Инселбергом (Alfred Inselberg) в 1985 году.

Которая занимается проектированием пользовательских интерфейсов. В общих чертах Юрий рассказывает о набирающих в последнее время популярность дизайнерских методиках — визуализации и инфографике, о сферах их применения и классификации, процессе создания, инструментах и примерах из практики.

Тема визуализации информации и инфографики регулярно всплывает при работе, да и в целом интересна как практика проектирования и дизайна. Хотя мы в компании работаем над веб-системами, где большинство задач решается стандартными средствами конструирования вроде форм или информационных блоков, иногда требуется емко и компактно подать большое количество информации. Часто это достаточно специфичные задачи, на продумывание интерфейса которых уходит немало времени. Правда, и задачи эти — одни из самых интересных.

У практики отображения информации в графическом виде много синонимов, но в последнее время чаще всего используются два: визуализация данных и инфографика. Существуют эти подходы уже достаточно давно , литературы по этому поводу написано много (среди наиболее известных авторов и дизайнеров: Edward Tufte, Stephen Few, Ben Fry), но в первую очередь интересно, где и как используется инфографика.

Применение

Сейчас существует множество интересных примеров визуализации, но многие из них — скорее объекты искусства, чем практически полезные носители информации. И для тех, и для других можно выделить следующие области использования:

Статистика и отчеты

Самодостаточный жанр, когда данные за некий период времени показываются вместе. Например, статической картинкой в приложении к отчету или настраиваемым графиком в сервисе статистики, с возможностью изменения параметров его отображения.

Справочная информация

Дополнение к основному тексту, наглядно иллюстрирующее его упоминаемыми данными. Скажем, дать общее представление о динамике одного из показателей, либо отобразить какой-то процесс и его этапы; может быть — показать структуру некого явления.

Интерактивные сервисы

Продукты и проекты, в которых инфографика является частью функциональности. Так, в качестве средства навигации по сервисам со сложным workflow может выступать диаграмма процесса. Почти все, что связано с работой с картами и вовсе редко обходится без смешения инфографики и интерактивности, не говоря уже о специализированных системах вроде диспетчерских и большей части компьютерных игр.

Иллюстрации

Не совсем чистый жанр — скорее, использование практик и подходов красивого отображения данных для создания самостоятельных иллюстраций. Они несут некий смысл, но это не основная их задача — основной ценностью является качество исполнения.

Эксперименты и искусство

Визуализация данных без особого практического смысла, скорее в качестве экспериментов или инсталляций. Чаще всего это сложные и громоздкие изображения, которые сложно «прочитать» бегло — объем данных и взаимосвязей между ними таков, что нужно разбираться с картинкой по частям; либо просто абстрактные изображения, автоматически сгенерированные. В последнее время направление все более популярно и периодически выходит за рамки компьютерной графики — например, в виде графиков-скульптур.

(внимание! более 9 мегабайт)

Классификация

Набор инструментов визуализации достаточно обширен — от простейших линейных графиков до сложных отображений множества связей. Разбить их можно на несколько типов:

Графики

Показывают зависимость данных друг от друга. Строятся по осям X и Y, хотя могут быть и трехмерными.

Линейный график (line chart, area chart)

Наиболее распространенный случай. Объединяет линией набор точек, соответствующих значениям по осям. Например, ежедневная посещаемость сайта за месяц. Может показывать сразу несколько наборов данных — например, статистику просмотров для 3 наиболее популярных страниц.

График рассеивания (scatterplot)

Показывает распределение ограниченного набора точек, соответствующих значениям по осям. Между точек часто рисуется выравнивающая кривая — она наглядно показывает закономерности среди значений. Например, связь между стажем работы и производительностью труда среди 50 сотрудников компании (просто соединить полученные точки в виде линейного графика нельзя — и смысл искажается, и линия будет дерганой).

Диаграммы сравнения

Показывают соотношения набора данных. Во многих случаях строятся вокруг осей, хотя и необязательно.

Столбиковая диаграмма (bar chart)

Показывает один или несколько наборов данных, сравнивая их между собой. Существует два варианта отображения в случае нескольких наборов: либо в виде нескольких стоящих рядом столбиков, либо в виде одного, но поделенного внутри в соответствии с долями значений. Например, ежегодная прибыль трёх компаний за последние 5 лет или их доли рынка за это же время.

Круговая диаграмма (pie chart)

Отображает процент, занимаемый каждым значением внутри набора данных, в виде разбитого на части круга. Например, доли рынка сотовых операторов. Может отображать сразу несколько наборов данных — в этом случае диаграммы наложены друг на друга, причем каждая из них меньше предыдущей. Например, доли рынка сотовых операторов за последение 3 года.

Площадная диаграмма (bubble chart)

Смесь графика и диаграммы — по двум осям расставлен набор точек, соответствующий значениям. При этом сами точки не соединены и имеют различную величину, которая задается третьим параметром. Например, сравнение количества купленных товаров, общей стоимости покупки и величины общего бюджета покупателя.

Кольцевая диаграмма (ring chart)

Показывает процент от максимального количества, которое занимает одно из значений в наборе данных, в виде частично закрашенного кольца. Например, количество завоеванных на чемпионате медалей относительно максимального. Часто используется сразу несколько таких диаграмм, сравнивающих разные значения.

Диаграмма разброса (span chart)

Показывает минимальную и максимальную величину значений внутри набора данных в виде урезанной столбиковой диаграммы. Начало столбика лежит не на горизонтальной оси, а в точке минимального значения по вертикали. Например, разброс стоимости квадратного метра жилья в разных районах города.

Лепестковая диаграмма (radar chart)

Сравнивает величины нескольких значений, каждая из которых соответствует точке на оси. Количество осей соответствует количеству значений, а точки объединены линями. Например, сравнение рентабельности каждого из 8 направлений деятельности компании.

Облако тегов (tag cloud)

Сравнивает ключевые слова или фразы (значения), содержащиеся внутри фрагмента текста (набора данных), задавая каждому из них свой размер шрифта. Размер шрифта зависит от величины параметра. Например, 25 самых часто упоминаемых в газетах слов за декабрь 2008 года.

Тепловая диаграмма (heat map)

Сравнивает значения внутри набора данных, закрашивая их одним из цветов в заранее выбранном спектре. Основой является изображение или другая диаграмма, на которой расставлены значения. Цвет зависит от величины параметра и чаще всего накладывается в виде пятен. Например, элементы главной страницы сайта, по которым пользователи кликают чаще всего.

Деревья и структурные диаграммы

Показывают структуру набора данных и взаимосвязи между его элементами.

Дерево (tree)

Показывает иерархию набора данных, в которой элементы являются родительскими или дочерними по отношению друг к другу. Выстраивается в виде соединенных линиями узлов, как правило, сверху вниз. Узел обычно отображается кругом или прямоугольником. Например, карта сайта.

Ментальная карта (mind map)

Показывает состав и структуру явления или понятия в виде дерева, в котором каждый узел имеет один или несколько дочерних элементов. Это частный случай дерева, с той разницей, что ветви расходятся из узла, расположенного в центре изображения. Например, конспект книги по управлению проектами, который отражает ее содержание и основные понятия.

Формализованные структурные диаграммы

Показывают состав и структуру системы или ее части в виде карточек, которые описаны с разной степенью детализации и связаны друг с другом как родительские и дочерние.
Отображается в стандартизованном виде — например, с помощью UML (Unified Modeling Language) или IDEFIX (Integration Definition for Information Modeling). Например, все сущности, необходимые для работы одного из модулей программной системы.

Диаграмма Венна-Эйлера (Venn/Euler diagram)

Показывает отношения между значениями набора данных в виде накладывающихся друг на друга кругов (чаще всего трёх). Область, в которой пересекаются все круги, показывает общее между ними. Например, пересечением соблюдения сроков, бюджета и поставленных задач является успех проекта.

Плоское дерево (tree map)

Показывает иерархию набора данных, в которой элементы являются родительскими или дочерними по отношению друг к другу. Отображается в виде набора вложенных прямоугольников, каждый из которых является ветвью дерева, а находящиеся внутри него — дочерними элементами и ветвями. Прямоугольники различаются по размеру в зависимости от параметра и имеют цвет, который задается другим параметром. Например, детальная структура бюджета компании, в котором цветом показан процент изменения каждого пункта по сравнению с предыдущим годом.

Само по себе понятие является достаточно многогранным, существует несколько определений в зависимости от того, о каком поле деятельности идет речь. Целью визуализации является Это означает, что данные должны исходить от чего-то абстрактного или, по крайней мере, не быть очевидными сразу. Визуализация объектов исключает фотосъемку и это превращение из невидимого в видимое.

Визуализация данных

Визуализация информации - это процесс представления абстрактных деловых или научных данных в виде изображений, которые могут помочь в понимании смысла данных. Что такое визуализация информации? Это понятие можно определить как сопоставление дискретных данных и их визуальное представление. Это определение не охватывает все аспекты визуализации информации, такие как статическая, динамичесая (анимация) и наиболее актуальная на сегодняшний день интерактивная визуализация. Помимо различий между интерактивной визуализацией и анимацией, самая полезная категоризация основывается на научной визуализации, которая обычно осуществляется при помощи специализированного программного обеспечения. Важная роль отводится наглядности в образовательной сфере. Это очень полезно, когда речь идет о преподавании тем, которые трудно представить без конкретных примеров, например, строение атомов, которые слишком малы, чтобы можно было их изучить без дорогостоящего и сложного в использовании научного оборудования. Визуализация позволяет проникнуть в любой мир и представить себе то, что, казалось бы, представить невозможно.

3D-визуализация

Программное обеспечение помогает конструкторам и специалистам цифрового маркетинга создавать визуальное изображение продукта, проекта или виртуальных прототипов в формате 3D. Визуализация предоставляет разработчикам инструменты, которые могут расширить передовые Визуализация с помощью визуальных образов является эффективным способом общения. Зрительное представления является одним из лучших способов коммуникации с потенциальными клиентами. Эффективное общение позволяет тратить больше времени на улучшение своих проектов и продуктивное взаимодействие. Визуализация 3D представляет собой технику создания объемных изображений, диаграмм или анимации.

Использование визуализации в науке

Сегодня визуализация имеет постоянно расширяющийся ассортимент приложений в области науки, образования, техники, интерактивных мультимедиа, медицины и многих других. Свое применение нашла визуализация также в области компьютерной графики, наверное, одном из самых важных событий компьютерного мира. Развитие анимации также способствует продвижению визуализации. Использование визуализации для представления информации - это не новое явление. Она была использована в картах, научных рисунках на протяжении более тысячи лет. Компьютерная графика с самого начала использовалась для изучения научных проблем. Большинство людей знакомы с цифровой анимацией, например, в виде представления метеорологических данных во время сводки погоды по телевидению. Телевизор также предлагает версию научной визуализации, когда он показывает прорисованные с помощью компьютерных программ и анимированных реконструкций дорог или аварий самолета. Некоторые из самых интересных примеров, созданных компьютером, включают изображение реального космического корабля в действии, в пустоте далеко за пределами Земли или на других планетах. Динамические формы визуализации, такие как образовательные анимации или графики, имеют потенциал для повышения качества обучения, так как системы визуализации меняются с течением времени.

Ключ к достижению поставленных целей

Что такое важный инструмент личностного развития. Подобно тому как мотивирующие аффирмации могут помочь сосредоточиться на достижении своих целей, то же самое можно сделать и с помощью визуализации или мысленных образов. Хотя методы визуализации в этом смысле стали очень популярны в качестве средства для развития личности с конца семидесятых и в начале восьмидесятых, люди использовали ментальные образы для осуществления своих желаний еще в древности.

Творческий инструмент

Что такое визуализация? Это использование воображения для создания ментальных образов того, чего мы хотим в нашей жизни. Вместе с фокусированием и эмоциями она становится сильным творческим инструментом, который помогает в достижении желаемой цели. При правильном использовании это может привести к самосовершенствованию, хорошему здоровью и различным достижениям, например, в карьере. В спорте ментальные образы как средства визуализации часто используются спортсменами для повышения своих навыков. Использование визуализации как техники неизменно приводит к гораздо лучшей производительности и результатам. Это также справедливо и в бизнесе, и в жизни.

Как это работает?

Визуализация, или воображение, работает на физиологическом уровне. Нейронные связи, возникающие в мозгу, иначе говоря, мысли, могут стимулировать нервную систему точно так же, как реальное событие. Такого рода "репетиции", или прогонка определенных событий в голове, создают нейронные колебания, которые заставят мышцы делать то, что от них требуется. Взять, например, тех же спортсменов. На время спортивных соревнований важным является не только исключительные физические навыки, но и четкое понимание игры и определенный психологический и эмоциональный настрой. Для большей эффективности, как и любой другой навык, воображение необходимо регулярно тренировать. Без чего является невозможной визуализация? Уроки развития воображения включают в себя важные элементы, а именно ментальные образы релаксации, реалистичность и систематичность.

Когда использовать визуализацию?

Зрительное наблюдение успешных результатов своей деятельности можно проводить абсолютно по любому поводу. Многие используют визуализацию для оживления своих целей. Многие спортсмены, актеры и певцы достигают чего-то сначала в своих умах, а затем только в реальности. Это помогает сосредоточиться и устранить некоторые предварительные страхи и сомнения. Это своеобразная разминка или репециция, которую можно проводить перед важным и волнительным событием. Визуализация - это прекрасный инструмент для подготовки, который неизменно приводит к повышению уровня производительности.

Как осуществляется процесс визуализации?

Можно пойти куда-нибудь в тихое и уединенное место, где вас никто не побеспокоит, закрыть глаза и думать о цели, настрое, поведении или навыках, которые вы хотите приобрести. Сделайте несколько глубоких вдохов и расслабьтесь. Старайтесь визуализировать предмет или ситуацию так четко и во всех подробностях, как это возможно. Эмоции и чувства при этом также играют большую роль, старайтесь прочувствовать то, чего хочется больше всего на свете. Практиковать упражнение стоит, по крайней мере, дважды в день примерно по 10 минут каждый раз и упорствовать до тех пор, пока не добьетесь успеха. Немаловажно также поддерживать и хорошее настроение на протяжении всего процесса.

Преимущества визуализации

Систематическая визуализация модели своего желания поможет лучше ориентироваться на пути достижения поставленных целей, будет вдохновлять и мотивировать, повысит настроение с помощью позитивных, приятных изображений и избавит от негативных эмоций. В жизни и в работе успех начинается с цели. Это может быть потеря веса, повышение по службе, избавление от вредных привычек, начало собственного бизнеса. Большие или маленькие цели дают важный ориентир. Они как компас - помогают двигаться в правильном направлении. Визуализация была описана еще Аристотелем более 2000 лет тому назад. Великий мыслитель своего времени описал этот процесс такими словами: "Во-первых, должен быть определенный, ясный, практический идеал, цель или задача. Во-вторых, есть необходимые средства для их достижения: мудрость, деньги, средства и методы. В-третьих, самое главное - это научиться управлять всеми необходимыми средствами для достижения желаемого результата".

Видеть - значит верить

Обычно происходит так: не поверю, пока не увижу. Прежде чем поверить в достижимость цели, сначала нужно иметь об этом визуальное представление. Техника создания мысленного образа будущего события дает возможность представить желаемые результаты и прочувствовать радость от их достижения. Когда это происходит, человек мотивируется и приобретает готовность добиваться своей цели.
Стоит помнить, что это не хитрый трюк, не просто мечты и надежды на будущее. Скорее, визуализация - это хорошо разработанный метод повышения эффективности, которым пользуются успешные люди в самых разных областях. Исследования показывают, что визуализация повышает спортивные показатели за счет улучшения мотивации, координации и концентрации. Это также помогает в релаксации и позволяет уменьшить страх и тревогу.

Почему визуализация работает?

По данным исследований, в которых использовались снимки мозга, запечатлевшие работу визуализации, можно сделать вывод о том, что нейроны в мозгу, эти электрически возбудимые клетки, которые передают информацию, интерпретируют образы в качестве эквивалента реальных жизненных действий. Мозг генерирует импульс, это создает новые нейронные пути — скопления клеток в нашем мозге, которые работают вместе, чтобы воссоздать воспоминания или поведенческие шаблоны. Все это происходит без физической активности, но таким образом мозг как бы программирует сам себя на успех. Огромным плюсом силы визуализации является то, что она доступна абсолютно для всех людей.

Неразрывная связь между умом и телом

Визуализация является психической практикой. С ее помощью мощно задействуются естественные силы разума. Мы можем использовать силу разума, чтобы стать успешными во всех сферах нашей жизни. Психологические методики учат нас, как использовать воображение, чтобы представить себе конкретные вещи, которые мы хотим иметь в нашей жизни. Весьма замечательно то, что наши мысли влияют на нашу реальность.

Ученые доказали, что мы используем всего 10% от общего потенциала нашего мозга, и это в лучшем случае. Можно ли научиться более эффективно использовать наши природные способности? Системы визуализации представляют собой неразрывные биологические связи между умом и телом, а также связь между умом и реальностью. Если мы научимся использовать воображение и визуализацию в правильном направлении, то она может стать чрезвычайно мощным средством для получения того, что мы хотим в нашей жизни. Важно научиться использовать силу нашего разума совместно с творческими подходом, который помогает раскрыть и развить скрытые таланты и возможности.