Поисковый индекс

Поисковый индекс

Индексирование, совершаемое поисковой машиной — процесс сбора, сортировки и сохранения данных с целью облегчить быстрый и точный поиск информации. Дизайн индекса включает междисциплинарные понятия из лингвистики, когнитивной психологии, математики информатики и физики. Альтернативное название для этого процесса в контексте поисковых машин, разработанных, чтобы искать веб-страницы в Интернете, является индексацией Сети.

Популярные движки сосредотачиваются на полнотекстовой индексации в онлайне, документов естественного языка[1]. Мультимедийные документы, такие как видео и аудио[2] и графика[3][4] также могут участвовать в поиске.

Метапоисковые машины переиспользуют индексы других поисковых сервисов и не хранят локальный индекс, в то время как основанные на скешированных страницах поисковые машины надолго хранят как индекс, так и корпусы. В отличие от полнотекстовых индексов, частично-текстовые сервисы ограничивают глубину индексации, чтобы уменьшить размер индекса. Большие сервисы, как правило, выполняют индексацию в предопределенных временных рамках из-за необходимого времени и обработки затрат, в то время как поисковые машины, основанные на агентах, строят индекс в масштабе реального времени.

Содержание

Индексация

Цель использования индекса — в повышении скорости поиска релевантных документов по поисковому запросу. Без индекса поисковая машина должна была бы сканировать каждый документ в корпусе, что потребовало бы большого количества времени и вычислительной мощности. Например, в то время, как индекс 10 000 документов может быть опрошен в пределах миллисекунд, последовательный просмотр каждого слова в 10 000 больших документов мог бы занять часы. Дополнительное хранилище, требуемое для хранения индекса, а также значительное увеличение времени, требуемого для его обновления, являются компромиссом за экономию времени при поиске информации.

Факторы, учитываемые при дизайне индекса

Примечания

  1. Clarke, C., Cormack, G.: Dynamic Inverted Indexes for a Distributed Full-Text Retrieval System. TechRep MT-95-01, University of Waterloo, February 1995.
  2. Stephen V. Rice, Stephen M. Bailey. Searching for Sounds. Comparisonics Corporation. May 2004. Verified Dec 2006
  3. Charles E. Jacobs, Adam Finkelstein, David H. Salesin. Fast Multiresolution Image Querying. Department of Computer Science and Engineering, University of Washington. 1995. Verified Dec 2006
  4. Lee, James. Software Learns to Tag Photos. MIT Technology Review. November 09, 2006. Pg 1-2. Verified Dec 2006. Commercial external link

Ссылки


Wikimedia Foundation. 2010.

Игры ⚽ Нужно решить контрольную?

Полезное


Смотреть что такое "Поисковый индекс" в других словарях:

  • Поисковый маркетинг — Эта статья или раздел нуждается в переработке. Пожалуйста, улучшите статью в соответствии с правилами написания статей. Поисковый маркетинг ( …   Википедия

  • Поисковый спам — (спамдексинг или веб спам)  сайты и страницы в Интернете, созданные с целью манипуляции результатами поиска в поисковых машинах  в конечном счёте, для обмана пользователя. Основные виды Не имеющие отношения к содержимому страницы, но… …   Википедия

  • Индекс цитируемости — поисковый рейтинг сайта или отдельной страницы, который выводится по результатам анализа количества и качества входящих и исходящих ссылок. Обычно наибольший вес придается входящим ссылкам с сайтов, которые посвящены той же тематике и достигли… …   Финансовый словарь

  • Поисковый оптимизатор — Запрос «SEO» перенаправляется сюда. Cм. также другие значения. Не следует путать с (англ. search engine optimization, SEO) комплекс мер для поднятия позиций сайта в поисковых систем по определенным запросам пользователей. Обычно, чем выше позиция …   Википедия

  • классификационный индекс — Поисковый образ, построенный средствами классификационного информационно поискового языка. ГОСТ 7.74 [7.14] …   Словарь по информации, библиотечному и издательскому делу

  • классификационный индекс — 3.5.1 классификационный индекс (notation): Индекс УДК, отражающий содержание документа в оптимальной степени, согласно принятой методике индексирования. Источник …   Словарь-справочник терминов нормативно-технической документации

  • Классификационный индекс — поисковый образ, построенный средствами классификационного информационно поискового языка. См. также: Классификационные индексы Поисковые образы Информационные классификационные системы Финансовый словарь Финам …   Финансовый словарь

  • классификационный индекс — Поисковый образ, построенный средствами классификационного информационно поискового языка. [ГОСТ 7.74 96] Тематики информационно поисковые языки …   Справочник технического переводчика

  • Поисковая оптимизация — У этого термина существуют и другие значения, см. Оптимизация. Поисковая оптимизация (англ. search engine optimization, SEO)  комплекс мер для поднятия позиций сайта в результатах выдачи поисковых систем по определенным запросам… …   Википедия

  • Статистика запросов — Что ещё искали со словом «Википедия» 45926 показов в месяц. википедия 45296 сайт википедия 289 энциклопедия википедия 248 языки википедия 75 россия википедия 69 википедия история 62 русская википедия 62 Пример отчёта Яндекса по статистике …   Википедия


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»