Главная » Участники » Шалимов Петр Юрьевич
Руководитель проекта Семантикус 6 лет назад
Четыре страницы результатов поиска, больше половины синтаксический мусор

Синтаксический мусор – результаты выдачи поиска, имеющие существенные смысловые расхождения с запросной фразой при совпадении слов в запросе и найденном документе. При этом найденные результаты могут иметь достаточно высокую синтаксическую релевантность, и находится в первых позициях поиска,  но иметь отличный от запросной фразы смысл. Ранее Семантикус (semanticus.ru)проводил испытания двух наиболее популярных поисковых систем на синтаксический мусор: семантический фильтр, сравнение и оценка первых страниц синтаксических поисковых систем, исследование на три шага в глубину. Настоящее исследование…

(подробнее...)
Семантический поиск: вопросы эффективности

Современные синтаксические поисковые машины выдают результаты поиска практически мгновенно.  Промежуток времени, с момента ввода запроса, до получения пользователем результатов работы поисковой системы, будет называться временем отклика То. Вот параметры эффективности для фразы «муж украл у бывшей жены своего ребенка и перевез его через границу» в поисковой системе В: результатов примерно 155 000 (0,62 сек.). Временем отклика в данном случае можно считать 0,62 сек. Несмотря на то, что результатов 155 000 (в другой системе 5000000), пользователь получил для изучения страницу, и именно с получения…

(подробнее...)
Семантический фильтр. Исследование на три шага в глубину.

     Три шага в глубину означает, что оценка и анализ качества полученных информационных материалов проводится по трем первым страницам листинга одной из поисковых систем. Материалы мгновенной регистрации результатов поиска приведены.       Сравниваются три первые страницы поисковой системы В. Используется расчет II уровня. Протоколы расчета семантического расстояния показаны на следующем рисунке. http://www.semanticus.ru/draw/w_filt3.png       Анализ протокола расчета будет сводиться в первую очередь к определению количества мусора (категории далеко и очень далеко). Первая страница – мусора 50%,…

(подробнее...)
Семантический фильтр. Сравниваются и оцениваются первые страницы популярных поисковиков.

Достаточно стандартная ситуация: человек занимается информационным поиском, вводит строку запроса в поисковой машине, получает кучу ссылок. Поисковая машина рапортует: х - количество сотен тысяч (или миллионов) найденных страниц. Человек начинает просматривать по аннотациям, по ссылкам и результат низкий. Самое интересное, что ищется то, что ранее нужный материал был найден и очень быстро, но не сохранен.  А куда он денется, подумал человек: введу эту фразу в этот же поисковик и результат гарантирован. Нет. Поисковый сервис (база данных и программы поиска) живет своей жизнью. Добавление (изменение)…

(подробнее...)
Семантический поиск при нулевой релевантности

  Синтаксическое соответствие (в информационном поиске) фразы запроса и документа - совпадения слов запросной фразы и слов документа. Можно применять не русское слово релевантность, и под ним понимать не только совпадение слов, но их частотность. Можно почитать и про алгоритмы определения релевантных документов, и про многое другое, но если слов фразы нет в искомом документе, то и соответствие нулевое. А между тем мысль есть и в запросной фразе и в документе. И эти мысли могут быть очень близкие, несмотря на различные формы их синтаксического выражения. Семантический поиск, реализованный в Семантикус…

(подробнее...)
1
Семантические расстояния на службе семантического поиска

  Семантический поиск – нахождение информации по смыслу. Человек, после прочтения содержимого текста, может отнести его к определенной глобальной  группе тем: об автомобилях, природе, технологиях, медицине. А в зависимости от интеллекта конкретного человека, имеющихся у него  знаний, и к более конкретной  локальной группе: ремонт трансмиссии автомобиля, поведение насекомых, кардиология. Более того, человек способен определять «близость по смыслу» текстовых документов. В зависимости от интеллекта, уровня эрудиции, конкретного человека может быть определена и субъективная мера близости по смыслу.…

(подробнее...)
RU, Брянск
http://semanticus.ru/, Руководитель проекта Семантикус
Телекоммуникация и связь

 

Проект Семантикус (http://semanticus.ru) предоставляет новый подход к проблеме семантического поиска информации в сети Интернет.

Отличие проекта Семантикус заключается в вычислении семантического расстояния между фразой запроса и документом, найденным синтаксической поисковой системой. Результаты поиска ранжируются по семантическому расстоянию, имеют количественную и вербальную характеристику степени «близости по смыслу» запросной фразе.

Существует возможность фильтровать по смыслу найденные  результаты, повышать эффективность поисковых мероприятий, реализовывать автоматизацию поиска.