Матрица расстояний

Матрица расстояний

Матрица расстояний - это квадратная матрица типа "объект-объект" (порядка n) содержащая в качестве элементов расстояния между объектами в метрическом пространстве.
Свойства матрицы являются отражением свойств самих расстояний[1]:

  1. симметричность относительно диагонали, т.е.  d_{ij} = d_{ji} ;
  2. отражение свойства тождественности расстояния d(i,j)=0 \Leftrightarrow i = j в матрице расстояний проявляется в наличии 0 по диагонали матрицы, т.к. расстояние объекта с самим собой очевидно равно 0, а также в наличии нулевых значений для абсолютно сходных объектов;
  3. значения расстояний в матрице всегда неотрицательны d(i,j)\geqslant 0

В общем виде матрица выглядит так:

 \begin{bmatrix}
  0 & \cdots & d_{1j} & \cdots & d_{1n} \\
  \vdots & \cdots & \vdots & \cdots & \vdots \\
  d_{i1} & \cdots & d_{ij} & \cdots & d_{in} \\
  \vdots & \cdots & \vdots & \cdots & \vdots \\
  d_{n1} & \cdots & d_{nj} & \cdots & 0 \\
\end{bmatrix}


В широком смысле расстояния являются отражением такого понятия как различие, что двойственно понятию сходства, а элементы матрицы различия (в общем виде - матрицы дивергенций) двойственны элементам матрицы сходства (в общем виде - матрицы конвергенций). Связь между мерой сходства и мерой различия можно записать как:  F = 1 - K , где F - мера различия; K - мера сходства. Следовательно, все свойства мер сходства можно экстраполировать на соответствующие им меры различия с помощью простого преобразования и наоборот.
Визуально отношения между объектами можно представить с помощью графовых алгоритмов кластеризации. В общем, можно сказать, что расстояния используются намного чаще чем меры сходства: их чаще реализуют в статистических программах (Statistica, SPSS и др.) в модуле кластерного анализа.

Расстояния

Известно[2], что существует обобщённая мера расстояний предложенная Германом Минковским:

 d_{ij} = \left [ \sum_{k=1}^n \left | x_{ik} - x_{jk} \right | ^p  \right ] ^{1 \over p} .


В вышеуказанное семейство расстояний входит:

Существуют используемые расстояния и вне данного семейства. Наиболее известным является расстояние Махаланобиса.
Также интересно, в качестве удачной иллюстрации связи мер сходства и различия, расстояние Юрцева, двойственное мере сходства Браун-Бланке[5]:

 F_{Yu} = 1 - K_{B-B} =   1 - \frac{n(A \cap B)}{max(n(A),n(B))} = \frac{n(A) + n(B) - 2n(A \cap B)+ |n(A) - n(B)|}{n(A) + n(B) - |n(A) - n(B)|} .

Литература и примечания

  1. Шрейдер Ю.А. Что такое расстояние? - М.: Физматлит, 1963. – 76 с.
  2. Ким Дж.-О., Мьюллер Ч.У., Клекка У.Р., Олдендерфер М.С., Блэшфилд Р.К. Факторный, дискриминантный и кластерный анализ. – М.: Финансы и статистика, 1989. – 215 с.
  3. Sokal R.R., Sneath P.H.A. Principles of numerical taxonomy. – San Francisco: London: Freeman, 1963. – 359 p.
  4. Godron M. Quelques applications de la notion de fréqence en écologie végétale // Oecol. Plant. 1968. V. 3. № 3. P. 185-212.
  5. Сёмкин Б.И. К методике анализа разновеликих множеств в сравнительной флористике // Комаровские чтения. Вып. LVI. 2009. C. 170-185.

Wikimedia Foundation. 2010.

Игры ⚽ Поможем написать курсовую

Полезное


Смотреть что такое "Матрица расстояний" в других словарях:

  • Матрица мер конвергенции — матрица содержащая в качестве элементов меры сходства объектов. Матрица отражает попарное сходство объектов. Сходство является показателем, измеренном в порядковой шкале и, следовательно, возможно лишь определение отношений вида: больше , меньше… …   Википедия

  • Матрица Грама — Определителем Грама системы векторов e1, e2, ..., en в евклидовом пространстве называется определитель матрицы Грама этой системы: где …   Википедия

  • Порождающая матрица — В области математики и теории информации линейный код  это важный тип блокового кода, использующийся в схемах определения и коррекции ошибок. Линейные коды, по сравнению с другими кодами, позволяют реализовывать более эффективные алгоритмы… …   Википедия

  • Проверочная матрица — В области математики и теории информации линейный код  это важный тип блокового кода, использующийся в схемах определения и коррекции ошибок. Линейные коды, по сравнению с другими кодами, позволяют реализовывать более эффективные алгоритмы… …   Википедия

  • Задача коммивояжёра — Оптимальный маршрут коммивояжёра через 15 крупнейших городов Германии. Указанный маршрут является самым коротким из всех возможных 43 589 145 600. Задача коммивояжёра (англ. Travelling salesman problem, TSP) (коммивояжёр …   Википедия

  • МОДЕЛИРОВАНИЕ СТАТИСТИЧЕСКОЕ — представление или описание некоторого феномена или системы взаимосвязей между явлениями посредством набора переменных (показателей, признаков) и статистических взаимосвязей между ними. Цель М.С. (как и любого другого моделирования) представить… …   Социология: Энциклопедия

  • Обучение без учителя — (англ. Unsupervised learning, самообучение, спонтанное обучение)  один из способов машинного обучения, при решении которых испытуемая система спонтанно обучается выполнять поставленную задачу, без вмешательства со стороны… …   Википедия

  • Кластерный анализ — Для улучшения этой статьи по математике желательно?: Проставив сноски, внести более точные указания на источники. Исправить статью согласно стилистическим правилам Википедии. Переработать офо …   Википедия

  • Задача о коммивояжере — Задача коммивояжёра (коммивояжёр  бродячий торговец) является одной из самых известных задач комбинаторной оптимизации. Задача заключается в отыскании самого выгодного маршрута, проходящего через указанные города хотя бы по одному разу с… …   Википедия

  • Задача о коммивояжёре — Задача коммивояжёра (коммивояжёр  бродячий торговец) является одной из самых известных задач комбинаторной оптимизации. Задача заключается в отыскании самого выгодного маршрута, проходящего через указанные города хотя бы по одному разу с… …   Википедия


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»