Топологический анализ данных

Топологический анализ данных

Топологический анализ данных — новая область теоретических исследований для задач анализа данных (Data mining) и компьютерного зрения.

Основные вопросы:

  1. Как из низкоразмерных представлений получать структуры высоких размерностей;
  2. Как дискретные единицы складываются в глобальные структуры.

Человеческий мозг легко строит представление об общей структуре по частным данным низких размерностей. Ему, например, не составляет труда получить трехмерную форму объекта по плоским изображениям в каждом глазу. Создание общей структуры также производится при объединении дискретных во времени фрагментов в непрерывный образ. Так, например, телевизионное изображение технически является массивом отдельных точек, который, однако, воспринимается как единая сцена.

Основной метод топологического анализа данных:

  1. Замена набора элементов данных некоторым семейством симплициальных комплексов в соответствии с параметром близости.
  2. Анализ этих топологических комплексов с помощью алгебраической топологии, а конкретно новой теорией устойчивых гомологий.
  3. Перекодировка устойчивой гомологии набора данных в параметризованную версию чисел Бетти, далее называемую штрихкодом.

Содержание

Облако точек

Данные часто представлены множеством точек в Евклидовом пространстве En, форма которого отражает описываемый данными феномен..

Реальные трехмерные объекты могут представляться в виде облака точек. Например лазером отмечаются отдельные точки и их неструктурированный набор служит представлением объекта в компьютере. Облаком точек считается любой (возможно зашумленный) набор точек в En или проекций точек в более низкой размерности.

В компьютерной графике и статистике есть различные методы построения прообразов по проекциям. Топологический анализ данных предназначен для пространств высоких размерностей или слишком искривленных чтобы создавать по ним плоские проекции.

Для преобразования облака точек в метрическом пространстве в целостный объект точки используются в качестве вершин графа ребрам которого приписаны расcтояния, затем граф превращается в симплициальный комплекс и изучается средствами алгебраической топологии.

Устойчивая гомология

См. также

Ссылки



Wikimedia Foundation. 2010.

Игры ⚽ Поможем написать курсовую

Полезное


Смотреть что такое "Топологический анализ данных" в других словарях:

  • Вычислительная топология — или алгоритмическая топология дисциплина, находящаяся на пересечении топологии, вычислительной геометрии и теории вычислительной сложности. Её основными задачами являются создание эффективных алгоритмов для решения топологических проблем и… …   Википедия

  • метод — метод: Метод косвенного измерения влажности веществ, основанный на зависимости диэлектрической проницаемости этих веществ от их влажности. Источник: РМГ 75 2004: Государственная система обеспечения еди …   Словарь-справочник терминов нормативно-технической документации

  • ГОСТ Р 52438-2005: Географические информационные системы. Термины и определения — Терминология ГОСТ Р 52438 2005: Географические информационные системы. Термины и определения оригинал документа: 57 (топологический) оверлей: Наложение двух или более полигональных объектов, в результате которого образуется новый слой, состоящий… …   Словарь-справочник терминов нормативно-технической документации


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»