Написано и
придумано Крисом
Райдингсом (Chris Ridings),
владельцем
www.searchenginesystems.net
Переведено на русский язык
и прокомментировано Александром
Садовским,
digits.ru
Этот
документ раскрывает мое
понимание и точку зрения
на алгоритм PageRank в Google.
Для тех, кто не знает меня:
я разрабатываю поисковые
системы на заказ. Поэтому
мне присуще
программистское понимание
алгоритмов поисковых
систем, как они работают,
что они могут делать, а что
нет. Из-за этого я способен
сделать немало выводов о
том, как работает PageRank. Я
верю, что информация в
данном документе
настолько точна, насколько
возможно. Никто не знает
наверняка детали PageRank,
исключая саму Google. Не
стесняйтесь спрашивать о
выводах, которые вы не
можете понять; с помощью
общения мои предположения
могут стать более
корректными. Пишите,
пожалуйста, мне на
chris@searchenginesystems.net свои
вопросы и комментарии.
Достаточно предисловий,
приступим к тому, чему
посвящен этот документ —
к PageRank!
Что
такое PageRank в Google?
PageRank —
это метод Google для
измерения «важности»
страницы. Когда все
другие факторы, такие как
тэг Title и ключевые слова
учтены, Google использует
PageRank, чтобы
откорректировать
результаты так, что более
«важные» сайты поднимутся
соответственно вверх на
странице результатов
поиска пользователя.То
есть, порядок ранжирования
в Google работает следующим
образом:
Найти все страницы,
соответствующие ключевым
словам поиска.
Отранжировать
соответственно
«страничным факторам»,
таким, как ключевые слова.
Учесть текст ссылок на
страницы.
Откорректировать
результаты данными PageRank.
Как
определяется PageRank?
Теория Google
гласит, что если Страница A
ссылается на страницу B, то
Страница А считает, что
Страница B — важная
страница. Текст ссылки
не используется в PageRank.
( В отличии от ТИЦ Яндекса,
где учитывается текст
ссылки. Прим. Полиграфыча.)
PageRank также влияет на
важность ссылок на
страницу. Если на страницу
указывают много важных
ссылок, то ее ссылки на
другие страницы также
становятся более важными.
Насколько
важен PageRank?
Значимость
каждого отдельного
фактора в алгоритмах
поисковой системы зависит
от качества информации,
которое он обеспечивает.
Поэтому имеет смысл
вначале взглянуть на это
качество.
Когда Гугл был лишь
крохотным Гугленком в
подгузниках, можно было с
уверенностью сказать, что
ссылка была точным
признаком рекомендации.
Однако, в настоящее время
это больше не так по двум
очень важным причинам:
Интернет существенно
изменился. Ссылка сегодня
это, скорее, лишь связанный
сайт, лицензионное
требование или ответная
услуга (как перекрестные
ссылки), чем истинная
рекомендация.
Как только вы создадите
поисковую машину, которая
рассматривает ссылки как
рекомендации, люди начнут
пытаться воздействовать
на ссылки. Как только они
станут воздействовать на
них, ссылки перестанут
быть рекомендациями.
Поэтому надежность
информации,
обеспечиваемой ссылками,
не обязательно хороша, и
она постоянно уменьшается.
Это является причиной
низкой и все время
уменьшающейся важности
PageRank в алгоритме
ранжирования Google.
Тем не менее, у PageRank есть
одно реабилитирующие его
свойство. На него трудней
влиять, чем на любой другой
фактор ранжирования. Это
означает, что у PageRank есть
возможность дать вам
преимущество перед
конкурентами, когда он
использован в комбинации с
другими приемами
оптимизации для поисковых
машин. Однако, я
предупреждаю вас: тут нет
коротких путей. Для
эффективного
использования PageRank вам
нужно будет понять его
полностью, иначе есть
шансы, что вы будете
тратить ваше время зря.
Основные
факты о PageRank
Для
понимания оставшейся
части этого документа, вам
нужно знать несколько
фактов о PageRank.
PageRank — это число,
характеризующее
исключительно голосующую
способность всех входящих
ссылок на страницу и то,
как сильно они рекомендуют
эту страницу.
Каждая уникальная
страница сайта,
проиндексированная Google,
имеет вес PageRank.
Люди часто ошибаются,
думая о весе сайта, который
на самом деле является
весом главной страницы
этого сайта.
Внутренние ссылки сайта
учитываются при расчете
веса PageRank для
других страниц сайта.
PageRank независим,
он не принимает во
внимание текст ссылок и
т. д. Конечно, они связаны,
но говорить, что это одно и
то же, это все равно что
говорить, будто тэг Title то
же самое, что ключевые
слова в тексте.
Крис не
упомянул партнерские
программы магазинов, а
также широко
распространенные в
русскоязычном интернете
баннерные сети и счетчики,
сайты которых за счет
обратных ссылок могут
«незаслуженно» иметь
большой вес. [Прим. А. С.]
Крис
употребляет термин «PageRank»
в двух разных смыслах.
Первый — это алгоритм
PageRank. Второй — это
собственно вес страницы,
вычисленный на основании
данного алгоритма. Это
связано с тем, что «page rank»
означает «ранг страницы»,
то есть вес, и в английском
тексте нет смысла
повторять слово дважды. Но
в русском переводе это не
очевидно, поэтому, чтобы
избежать путаницы, в
дальнейшем, где это будет
необходимо, во втором
смысле будет
использоваться термин
«вес страницы» или «вес
PageRank». [Прим. А. С.]
Автор подразумевает, что
каждая страница, ссылаясь
на другую страницу,
«голосует» за нее.
Голосующая способность
тем больше, чем больше вес
PageRank у ссылающейся
страницы. [Прим. А. С.]
Поисковая
система Апорт вычисляет
вес PageRank для каждой
страницы, но учитывает
только одну ссылку с
каждого домена второго
уровня. То есть даже если
на ваш сайт указывают 100
ссылок с разных сайтов на
хостинге narod.ru (site1.narod.ru,
site2.narod.ru и т. д.), то Апорт
все равно зачтет их как
одну ссылку. [Прим. А. С.]
Поскольку Апорт уже
фактически выпал (на 2006
год) из линейки ведущих
поисковиков - про него
можно забыть. Тем более,
что его выставили на
продажу. (Прим.
Полиграфыча)