Опис пошукової системи nigma

Матеріал з Вікі ЦДУ
Версія від 13:11, 13 листопада 2008; Олійник Артем (обговореннявнесок)

(різн.) ← Попередня версія • Поточна версія (різн.) • Новіша версія → (різн.)
Перейти до: навігація, пошук

вкажіть повну назву

NIGMA.RU - интеллектуальная поисковая система

вкажіть URL головної сторінки

http://www.nigma.ru/

Загальний опис системи, її особливості

Описание проекта

Многие поисковые системы основаны на хорошо известных методах и алгоритмах, разработанных еще до появления Интернет. Общая задача информационного поиска в Интернет состоит в том, чтобы найти документы, соответствующие информационной потребности пользователя. Еще десять лет назад проблем с поиском необходимой информации у пользователя Интернет не возникало. Однако, с течением времени ситуация изменилась и теперь мы даже не всегда понимаем, какой необходимо сделать запрос для поиска нужной информации. Следовательно, необходимо изменить постановку задачи поиска и разработать новые методы обработки полученных данных с целью сужения области поиска.

Одним из методов, позволяющих пользователю найти нужную информацию в Интернете, является кластеризация полученных документов. Системы, обеспечивающие кластеризацию документов на английском языке, были реализованы западными специалистами несколько лет назад. Подобный алгоритм работает и для поиска документов на русском языке. Преимущество интеллектуальной поисковой системы Nigma.ru состоит в том, что ее алгоритм ищет документы с учетом русской орфографии, объединяет результаты, полученные с разных поисковых систем, использует запросы пользователей для улучшения качества кластеризации и счетчики для сортировки результатов поиска, а также корректирует возможные ошибки.


История создания

Дата рождения проекта Nigma.ru - 12 апреля 2005 года. Примерно за год до этой знаменательной даты родилась идея создания поисковой системы с новым методом обработки и анализа полученных данных - методом кластеризации.

Создатель проекта - Виктор Лавренко - ранее работавший в компании Mail.ru, являющейся признанным лидером российского Интернета и с успехом прошел путь от технического директора до вице-президента компании по стратегии и финансам. В середине 2004 года Виктор обратился с предложением о совместной работе над созданием поисковой системы к студенту 5-го курса факультета вычислительной математики и кибернетики МГУ (а ныне аспиранту и преподавателю) Владимиру Чернышову. Первые полгода они занимались "самообразованием", знакомились с технической литературой и публикациями.

Активная работа по созданию принципиально новой поисковой системы началась в начале 2005 года - и продолжается по сей день. Название - Nigma (один из трех родов пауков семейства Dictunidae) - появилось очень просто: во-первых, оно короткое и запоминающееся, во-вторых, нам нужна была аналогия с Сетью, Всемирной Паутиной - то есть, Интернетом. На момент появления Nigma.ru в проекте участвовало 3 человека. Сегодня работает уже 15 человек.


Наявність каталогу, посилання на каталог

Особливості мови запитів

Опишіть як в пошуковій системі реалізовані команди мови запитів

Как искать в Нигме

Для улучшения качества поиска можно использовать специальные символы (операторы), которые укажут поисковой системе, что с некоторыми словами запроса нужно работать особым образом.

Обычные запросы (без операторов) Когда вы выполняете обычный запрос из нескольких слов, поисковая система пытается найти в первую очередь страницы, содержащие наибольшее количество слов из запроса. То есть, на первых местах в списке выведенных результатов будут стоять страницы, на которых есть максимальное количество слов из запроса. К примеру, на запрос розовая пантера сначала будут выведены страницы, содержащие фразу «розовая пантера», затем страницы, на которых есть оба слова — «розовая» и «пантера», уже не относящиеся друг к другу.

Операторы AND и + По умолчанию считается, что слова разделенные пробелами - это то же самое, что слова, разделенные оператором "+", или оператором "AND" — все три формы запросов эквивалентны (a AND b - нас интересует и слово "a" и слово "b"). Например, запросы розовая пантера, розовая+пантера и розовая AND пантера для поисковой системы будут неотличимы.

Оператор OR Иногда некоторые слова запроса для вас эквиваленты, например "скачать" и "download", тогда можно указать поисковой системе при помощи оператора "OR" между этими словами, что достаточно найти страницы с любым из этих слов. Будут найдены страницы, на которых есть хотя бы одно из слов. Примеры: бегемот OR гиппопотам, музыка mp3 (скачать OR download)

Оператор "" Если вы хотите найти страницы, на которых встречается заданная фраза, в запросе заключите ее в кавычки. Это может быть полезным, например при поиске какого-нибудь стихотворения или текста песни по известной строчке. Сравните результаты: "мороз и солнце - день чудесный" и мороз и солнце - день чудесный Фраза, заключенная в кавычки, ищется целиком без изменения порядка слов и без учета словоформ, то есть находятся только точные вхождения этой фразы.

Оператор - Иногда в результатах на некоторые запросы выдается не только нужная Вам информация, но и много другой. Например, по запросу "окна роста" будут выданы как результаты об агитационных плакатах советских времен, так и об одноименной фирме, занимающейся производством окон. Допустим, нам нужно найти информацию о плакатах. Ненужные результаты можно отфильтровать при помощи оператора "-", поставленного перед тем словом, которое Вы хотите исключить из результатов поиска. Уточним запрос окна роста при помощи оператора "-": окна роста -пвх -производство -виа

Оператор site Если требуется найти страницы, удовлетворяющие запросу и находящиеся на определенном сайте, добавьте к запросу оператор "site:адрес_сайта". Можно искать по нескольким сайтам сразу. По запросу: nigma site:www.habrahabr.ru будут найдены страницы с сайта www.habrahabr.ru, содержащие слово «nigma». А по запросу: новости site:lenta.ru site:utro.ru будут найдены новости, с двух сайтов. Можно уточнить адрес сайта до поддоменов, например такой запрос: новости site:auto.utro.ru задает поиск только по указанному поддомену (auto.utro.ru), результаты с других поддоменов будут проигнорированы.

Сложные запросы Скобки позволяют группировать слова запроса для применения к ним оператора. Например: микроволновая печь samsung (руководство OR документация) слова "руководство" и "документация" объединены скобками для того, чтобы оператор OR применялся только к ним.

Можливості розширеного пошуку

Опишіть можливості розширеного пошуку

Розширений пошук в nigma зображений на малюнку нижче:

Расширенный поиска в nigma.jpg


--Олійник Артем 17:13, 12 ноября 2008 (EET)