к Интернет банкам данных   к оглавлению   эволюция WEB  

Информационно-поисковые языки

Информационно-поисковые языки являются основными компонентами информационно-поисковых систем, с помощью которых, в частности, реализуются интерфейсы между пользователями и системами.

В отличие от реляционных СУБД, у систем полнотекстового поиска не существует стандартизированного языка запросов. У каждой системы этого типа существует свой способ задания критериев поиска.

Очень часто языки запросов ИПС приближенны к SQL, однако каждой из поисковых систем присущий ряд индивидуальных особенностей, связанных с такими моментами, как:

- интерпретация операций, задающих порядок расположения слов в тексте (операций контекстной близости);

- вычисление уровня релевантности найденных документов запросам для представления результатов поиска;

- применение нестандартных для реляционных СУБД функций, например, таких как нахождение документов по принципу подобия содержания, построение дайджестов из фрагментов документов, сниппетов (от англ. snippet – фрагмент, отрывок), включаемых поисковыми системами в списки найденных документов и т.п.

В различных полнотекстовых информационно-поисковых системах применяются различные архитектурные решения, охватывающие структуры данных, алгоритмы их обработки, методы организации поиска. Вместе с тем, у современных информационно-поисковых систем много общих свойств, например, все из них обеспечивают поиск хотя бы по одному слову, большинство подобных систем реализуют грамматический поиск как результат применения лингвистического анализа (например, в русскоязычных системах Апорт, Яндекс и Рамблер по терму из запроса “человек” находятся не только словоизменения “человека”, “человеку”, но и множественное число – “люди”). Большинство из современных систем способны реализовывать контекстный поиск фразы, заключенной в кавычки (Google, Alltheweb, AltaVista, Яндекс и т.п.), поиск с использованием булевых операторов AND, OR и NOT, а также возможностью указания скобок для группирования термов и операторов. Функции контекстной близости в свое время получили наибольшее развитие в системе Lycos, где были реализованы с помощью четырех операторов: ADJ, NEAR, FAR и BEFORE.

В самой популярной в мире системе Google используется достаточно лаконичный набор операторов (www.googleguide.com), основные из которых - это конъюнкция (подразумевается по умолчанию, система выдает документы, содержащие все слова запроса), дизъюнкция (OR) и отрицание (-).

Отдельно рассматривается возможность поиска по параметрам документов, которая чаще всего позволяет ограничивать диапазон поиска значениями URL, дат, заголовков. В большей части систем выйти на возможность поиска по параметрам можно из режима расширенного поиска.

В Google, например, обеспечивается поиск по сайту ("site:"), определение ссылок на сайт ("admission site:"), поиск по ценам, например "DVD player $150..250", странам, датам, доменам и т.п. Во многих системах обеспечивается поиск не только по данным в формате HTML, но и в форматах PDF, RTF, DOC (MsWord), PS.

В последнее время получили распространение адаптивные интерфейсы уточнения запросов, чаще всего реализованные путем применения методов кластерного анализа к результатам первичного поиска. Появилось такое понятие, как метод "папок поиска" (Custom Search Folders), объединяющее множество подходов, общее в которых - попытка сгруппировать результаты поиска и представить группы наиболее связанных документов (кластеры) в удобном для пользователей виде.

Например, в поисковых серверах Vivisimo (www.vivisimo.com), Mooter (www.mooter.com) или Nigma (www.nigma.ru) применяется визуальный подход к представлению результатов поиска путем группирования релевантных документов по категориям. В другом поисковом сервере iBoogie (www.iboogie.com) результаты поиска отображаются в виде, близком к экрану проводника Windows. Слова и словосочетания в так называемых “информационных портретах”, применяемых, например, в корпоративных информационно-аналитических системах Галактика Zoom и InfoStream, также позволяют адаптивно уточнять первичные запросы.

к Интернет банкам данных   к оглавлению   эволюция WEB  

Знаете ли Вы, что, как не тужатся релятивисты, CMB (космическое микроволновое излучение) - прямое доказательство существования эфира, системы абсолютного отсчета в космосе, и, следовательно, опровержение Пуанкаре-эйнштейновского релятивизма, утверждающего, что все ИСО равноправны, а эфира нет. Это фоновое излучение пространства имеет свою абсолютную систему отсчета, а значит никакого релятивизма быть не может. Подробнее читайте в FAQ по эфирной физике.

НОВОСТИ ФОРУМА

Форум Рыцари теории эфира


Рыцари теории эфира
 10.11.2021 - 12:37: ПЕРСОНАЛИИ - Personalias -> WHO IS WHO - КТО ЕСТЬ КТО - Карим_Хайдаров.
10.11.2021 - 12:36: СОВЕСТЬ - Conscience -> РАСЧЕЛОВЕЧИВАНИЕ ЧЕЛОВЕКА. КОМУ ЭТО НАДО? - Карим_Хайдаров.
10.11.2021 - 12:36: ВОСПИТАНИЕ, ПРОСВЕЩЕНИЕ, ОБРАЗОВАНИЕ - Upbringing, Inlightening, Education -> Просвещение от д.м.н. Александра Алексеевича Редько - Карим_Хайдаров.
10.11.2021 - 12:35: ЭКОЛОГИЯ - Ecology -> Биологическая безопасность населения - Карим_Хайдаров.
10.11.2021 - 12:34: ВОЙНА, ПОЛИТИКА И НАУКА - War, Politics and Science -> Проблема государственного терроризма - Карим_Хайдаров.
10.11.2021 - 12:34: ВОЙНА, ПОЛИТИКА И НАУКА - War, Politics and Science -> ПРАВОСУДИЯ.НЕТ - Карим_Хайдаров.
10.11.2021 - 12:34: ВОСПИТАНИЕ, ПРОСВЕЩЕНИЕ, ОБРАЗОВАНИЕ - Upbringing, Inlightening, Education -> Просвещение от Вадима Глогера, США - Карим_Хайдаров.
10.11.2021 - 09:18: НОВЫЕ ТЕХНОЛОГИИ - New Technologies -> Волновая генетика Петра Гаряева, 5G-контроль и управление - Карим_Хайдаров.
10.11.2021 - 09:18: ЭКОЛОГИЯ - Ecology -> ЭКОЛОГИЯ ДЛЯ ВСЕХ - Карим_Хайдаров.
10.11.2021 - 09:16: ЭКОЛОГИЯ - Ecology -> ПРОБЛЕМЫ МЕДИЦИНЫ - Карим_Хайдаров.
10.11.2021 - 09:15: ВОСПИТАНИЕ, ПРОСВЕЩЕНИЕ, ОБРАЗОВАНИЕ - Upbringing, Inlightening, Education -> Просвещение от Екатерины Коваленко - Карим_Хайдаров.
10.11.2021 - 09:13: ВОСПИТАНИЕ, ПРОСВЕЩЕНИЕ, ОБРАЗОВАНИЕ - Upbringing, Inlightening, Education -> Просвещение от Вильгельма Варкентина - Карим_Хайдаров.
Bourabai Research - Технологии XXI века Bourabai Research Institution