Написать нам







Создаем сочные сайты!
+7 (499) 649-30-72
Написать нам
Создание сайтов






СОЗДАНИЕ САЙТОВ У НАС — ЭТО КАЧЕСТВО И РАЗУМНАЯ ЦЕНА. УБЕДИТЕСЬ САМИ!

ЗВОНИТЕ:
+7 (495) 974-15-75

Все статьи

Яндекс. Запуск нового поискового алгоритма — «Анадырь». Ой! «Арзамас»!

04.04.2009

Игра в города продолжается: Магадан - Находка - Анадырь...

В прочем, разработчики Яндекса решили переименовать новый алгоритм поисковой системы в Арзамас. Видимо, из-за того, что названия города на мягкий знак нет ;).

«Арзамас»

Снятие омонимии

Яндекс научился еще лучше понимать русский язык, разрешая неоднозначности слов в запросах.

Как известно, знание русской морфологии позволяет поиску Яндекса находить больше полезных ответов. Если вы спросили [реконструкция Маяковской], мы покажем также страницу со словами [станция Маяковская открылась после реконструкции]. Но русский язык — тонкий, сложный и неоднозначный. Тем, кто ищет [фото львов], могут быть нужны как фотографии животных, так и фотографии города Львова. Человек может уточнить свое высказывание, добавив к нему одно или несколько слов: [фото африканских львов] или [фото город львов]. Теперь эти уточнения наш поиск научился понимать.

Мы реализовали алгоритм снятия омонимии, позволяющий во многих случаях определить, какое слово имеется в виду, и предлагаем в ответ только документы с формами нужного слова. По запросу [фото африканских львов] пользователь получит в ответ документы со словами «лев», «льва», «льву», но не получит документы, где встречаются лишь слова «Львова» или «Львову».

Как мы научили машину отличать, когда речь идет о животных, а когда — о городах? Алгоритм снятия омонимии основан на анализе данных запросов наших пользователей, учитывает частоту слов в Интернете и их сочетаемость, а также опирается на лексическую статистику слов из Национального корпуса русского языка — академического проекта, разрабатываемого при поддержке Яндекса. При анализе неоднозначного запроса мы выбираем наиболее частотную модель. Выбор в пользу наиболее вероятной конструкции помогает понять, что «день рыбака» — это не призыв, а праздник, а «платья придворных дам» — не обещание поделиться одеждой.

А любимый наш вопрос — тот, на который мы знаем целых два правильных ответа. Звучит он так: «Сколько голов у Павлюченко?»

Учитываем регион пользователя

Теперь поиск Яндекса учитывает регион пользователя. Начиная с «Арзамаса», результаты поиска по одному и тому же запросу могут быть разными в разных регионах.

Пользователи часто спрашивают Яндекс о людях и компаниях из их региона, локальных событиях и местах, сайтах и услугах. Например, среди самых часто задаваемых запросов в Челябинске и Ростове-на-Дону 14 % «локальных», в Уфе — 24 %, а во Владивостоке — 29 %. Ранжирование с учетом региона поможет поиску дать более точный ответ на вопрос пользователя.

Движение в эту сторону поиск начал давно — с 2006 года в Яндексе работает автоматическая геоклассификация сайтов, еще раньше появилась возможность ограничить поиск сайтами из своего региона (в расширенном поиске или взведя галочку под поисковой строкой). Но теперь Яндекс пытается сам определить, важен ли регион в каждом конкретном случае. И, конечно, у нас были и будут колдунщики, дающие локальные для пользователя ответы из Карт, Адресов, Афиши, Погоды и Новостей.

Как «Арзамас» понимает, что какие-то результаты должны быть локальными? Регион пользователя определяется по IP-адресу. При желании пользователь может указать свой регион вручную. В ранжировании стали учитываться факторы, позволяющие понять, что данная страница важна пользователям именно «своего» региона. Причем мы попытались сделать это решение максимально общим, не зависящим ни от какого региона конкретно.

Для ряда регионов — и список их будет расти — мы используем специально настроенную формулу ранжирования. Сейчас индивидуальная формула есть для Москвы, Санкт-Петербурга и российского регионального поиска, а также для некоторых стран СНГ.

С выходом «Арзамаса» мы начали учитывать в подсказке об опечатках настройку языка браузера при определении языка запроса в сложных случаях.

Сообщения о заражении сайтов

Яндекс начал оповещать веб-мастеров о том, что на страницах их сайтов обнаружен код, который может нанести ущерб посетителям. Его выполнение приводит, как правило, к заражению вирусами, присоединению компьютеров к бот-сетям, краже паролей и других личных данных.

Опасный элемент может появиться на сайте и без ведома его владельца. Проявления кода могут долгое время оставаться незамеченными. Выявить вредоносный элемент часто можно только при детальном изучении кода сайта. Яндекс проверяет сайты на наличие в них опасных элементов, используя технологии своего партнера — компании Sophos ®.

О том, как вредоносный код попадает на сайты и как его найти, можно прочитать в разделе «Помощь». Сразу после его удаления можно запросить перепроверку сайта. Однако, если на сайте был обнаружен такой код, необходимо не только найти и удалить его, но и устранить проблему в системе безопасности компьютера и сайта.

Картинки над результатами веб-поиска

Ежедневно Яндекс отвечает пользователям на более чем 50 миллионов запросов. Эти запросы очень разнообразны и нередко лучшим ответом на них являются не веб-документы, а изображения. По таким запросам (мы называем их картиночными) Яндекс начал показывать картинки над результатами веб-поиска. Например, по запросу портрет Юрия Гагарина пользователи сразу видят портреты космонавта:
Результаты картиночного поиска по запросу портрет Юрия Гагарина

Картинки в результатах поиска показывались и раньше: с 2001 года после запуска сервиса Яндекс.Картинки справа от результатов веб-поиска пользователи стали получать картиночный ответ на свой запрос. Но далеко не по всем запросам можно найти соответствующие изображения. Поэтому нам было важно показать те из них, которые дают самый полезный ответ, и сделать эти изображения более заметными среди результатов поиска.

Некоторые виды информации, такие как схемы (например, схемы вышивания) и карты (например, физическая карта Европы), интересны, прежде всего, в виде изображений. Также нашим пользователям нравятся фотографии известных людей: Оксана Акиньшина, Анджелина Джоли и исторических персонажей: Александр Невский, Иван Грозный. Многим любопытно узнать, как выглядят известные памятники архитектуры: Тадж Махал, Мачу-Пикчу и интересные места на Земле: рисунки пустыни Наска или за ее пределами: кольца Сатурна. И, наконец, красивые виды и чудеса природы просто приятно созерцать, и теперь они тоже украшают результаты поиска.  Например, это весна, тюльпаны или закат. Мы постарались удовлетворить эту потребность и помочь тем, кто еще не пришел искать в Яндекс.Картинки.

Как определить, что по запросу пользователь хотел увидеть именно картинки?

  • Если в запросе есть слова-маркеры, например, «фото» или «картинки», то в большинстве случаев ищется изображение: [фото машин], [картинка слона] (но не всегда: например, по запросу [курсы фото] ищутся адреса и сайты компаний, обучающих искусству фотографии). С помощью маркеров выделяется небольшой класс картиночных запросов — менее 10 % от их общего количества.
  • Популярные запросы, которые относительно часто ищут в Картинках, но редко в веб-поиске.
  • Запросы, по которым пользователи переходили с веб-поиска на поиск картинок. Выяснилось, что по таким запросам есть два устойчивых паттерна поведения. Пользователи либо быстро уходят по ссылкам на сайты с понравившимися им картинками, либо долго задерживаются на картиночном поиске, рассматривая и выбирая интересующие их изображения. Это третий способ определения картиночных запросов.

Сами изображения проходят строгий автоматический отбор для того, чтобы попасть в колдунщик над результатами поиска. Одним из критериев является релевантность текстового описания картинки заданному запросу. Имеет значение и размер изображения: маленькие картинки не представляют интереса для большинства пользователей.

Иногда случается так, что по картиночным запросам Яндекс.Картинки уступают право ответа другим сервисам Яндекса. Например, по запросу [карта Москвы] в Картинках есть много хороших изображений карт, а по запросу [открытка к 8 марта] — много красивых открыток, но вместо изображений над результатами поиска показываются ответы сервисов Яндекс.Карты и Яндекс.Открытки. Они не только дополняют ответ изображением, но и предоставляют много полезной информации и возможностей.

В итоге мы выделили хорошие картиночные запросы, по которым показываем изображения над результатами поиска. Сейчас они показываются по 2 % запросов, и мы продолжаем работать над тем, чтобы сделать ответ Яндекса пользователям более полным и качественным.


Источник: «Ваш МАСТЕР» по материалам «Яндекс.Поиск»

Ещё рекомендуем прочитать:

В Москве в восьмой раз вручили «Премию Рунета»
Издательство "Эксмо" судится с "Яндексом" из-за ссылок на пиратские библиотеки
Microsoft.WebMatrix - платформа для создания сайтов
Facebook проведет IPO в 2012 году
Firefox впервые опередил Internet Explorer по популярности

Внимание!
Цитирование авторских материалов допускается только при условии прямой гиперссылки на «Introweb.ru»!


К списку статей



+7 (495) 974-15-75