В прошлых статьях я рассказывал о PageRank – базовом алгоритме определения авторитетности веб-страниц, который стал основой успеха Google. Хотя для большинства людей с высшим образованием это не новость, все-таки скажем в дополнение, что идея определения авторитетности по количеству цитирований далеко не нова. Пейдж и Брин просто адаптировали ее к конкретной задаче создания алгоритма для поисковой машины. Изначально же индекс цитирования как база данных с информацией по ссылкам между статьями появился еще в 19-м веке. Более точные количественные расчеты авторитетности ученых, статей и журналов (импакт-фактор) появились в 1960-х годах – и их можно называть общими терминами «индекс цитируемости», «фактор популярности» и так далее. Они отличаются по методикам расчета, но общий смысл примерно одинаков.

Совсем недавно, в двадцатых числах января, прошло, возможно, последнее публичное обновление показателя PR (PageRank). Google построил всю свою поисковую империю на этом – теперь уже классическом – алгоритме. В стэнфордских работах основателей компании, Брина и Пейджа, впервые появляется идея применить ссылочное ранжирование для решения задачи определения релевантности документа запросу.

Сухие цифры: консолидированная выручка «Яндекса» в 2010 году составила 410 миллионов долларов, Google – 29 321 миллионов долларов. Хотя выручка (объем продаж) – еще далеко не чистая прибыль, уровень издержек IT-компаний одного профиля можно признать сравнимым.

Когда в Рунете было 10 000 сайтов, простой поиск по совпадению ключевых слов и ранжирование отсеянных страниц по базовым показателям авторитетности (аналогичным классическому алгоритму Page Rank) вполне удовлетворял пользователей. Качество выдачи даже при таком относительно примитивном подходе было приемлемым. Но взрывной рост количества страниц (документов) и приемов манипуляции известными факторами ранжирования привели к выбиванию с рынка поиска игроков, не сумевших найти более продвинутое решение. Среди отечественных разработок достаточно вспомнить Aport и Rambler – они потеряли лояльность пользователей в рекордно короткие сроки из-за мусора и спама в SERP.

Однако Яндексу удалось преодолеть кризис: технологии компании пошли по пути стремительного увеличения количества обрабатываемых факторов, что позволило поддерживать качество выдачи. А 17 ноября 2009 года, с внедрением алгоритма «Снежинск», подход к ранжированию перевернулся с ног на голову. Раньше формула расчета релевантности документов была жесткой. Соотношение важности ее коэффициентов определялось изначально, на теоретических выкладках, а затем подстраивалось и «подкручивалось» – это и были апдейты алгоритма...
Читать »Поисковые системы – по сути, являют собой огромные базы данных, в которых хранятся сохраненные копии документов и страниц. Специальные программы (поисковые боты или роботы) «ходят» по просторам Интернета, ищут новые документы и сохраняют копии документов базе данных поисковой системы.
Читать »Гугл изменил раздел руководства по оптимизации сайтов для веб-мастеров, поместив наверху страницы голубое поле, на коем размещена ссылка на информацию о том, как оптимизировать интернет-сайт под браузер Chrome и сделать его в максимальной степени "Chrome-friendly".
Советы по оптимизации под свой браузер к тому же возникли на ряде страниц поддержки для веб-мастеров, в т.ч., на странице о [...]
Если прямо отвечать на поставленный вопрос, то тут же же становится ясно, что ответов может оказаться предостаточно. Не отбрасывая в сторону лирику: page rank - домен верхнего уровня в Пуэрто-Рико, латинское сокращение для элемента Празеодима и так называемые "public relations". Хотя нас с Вами интересует прежде всего расшифровка Pr, которая является одним из важных понятий [...]
Читать »
Руководящее окружение корпорации Google и главные лица компании (Лари Пейдж и Серёга Брин) в сотрудничестве с ведущими Seo специалистом Эриком Шмидтом заработали в прошлом году 1$.
Читать »