Алгоритм PageRank: актуален ли он и как влияет на ранжирование

Автор статьи
Анастасия Осипенко
Авг 16, 2021
12 мин - время чтения

Механика поиска постоянно изменяется и то, что является привычным сейчас, не работало в первые годы существования интернета. Сегодня обратные ссылки — основа для определения авторитетности веб-страниц, но в 1998 году это было революционным предложением. Именно тогда в Google разработали алгоритм PageRank, который делал количество входящих ссылок фактором ранжирования.

Оригинальный патент на алгоритм истек после 20 лет существования. Играет ли какую-то роль в ранжировании PageRank сегодня и какую именно? В этой статье мы анализируем историю алгоритма и его формулу, а также разбираемся, насколько важна оценка ссылочного профиля, начало которой положил PageRank.

Что такое PageRank?

PageRank — алгоритм ранжирования, который оценивает количество и качество ссылок, ведущих на веб-страницы. Инженеры Google Ларри Пейдж и Сергей Брин разработали этот алгоритм в 1998 году — и это был прорыв для функционирования поиска, ведь впервые поисковая система оценивала авторитетность страниц.

Сами инженеры объясняли, что PageRank нацелен «упорядочить веб-пространство» благодаря расстановке сил между страницами. Алгоритм строился с учетом условного «рандомного интернет-пользователя», который переходит с одной страницы на другую, кликая на ссылки. PageRank страницы — вероятность, с которой этот интернет-пользователь перейдет на нее. Оценка рассчитывалась в пределах от 0 до 10: чем она выше, тем выше авторитет страницы.

Распределение PageRank

PageRank — это попытка объективно оценивать страницы в соответствии с субъективным поведением пользователей: это естественно, что чем чаще на страницу ссылаются, тем более она полезна для людей, ищущих информацию. 

Алгоритм также учитывает авторитет ссылающихся источников: чем выше оценка PageRank у определенной страницы, тем больше веса она передаст другой странице, на которую ссылается.

Давайте рассмотрим, как рассчитывается оценка PageRank.

Формула PageRank

Так выглядит оригинальная формула PageRank:

PR(A) = (1-d) + d (PR(T1)/C(T1) + … + PR(Tn)/C(Tn))

Что означают эти переменные:

  • A — анализируемая страница
  • T1…Tn — страницы, ссылающиеся на анализируемую
  • C — количество ссылок на анализируемой странице
  • d — коэффициент затухания, обозначающий вероятность того, что пользователь покинет страницу (обычно равен 0.85)

Исходя из этой формулы, страницы «раздают» свою оценку PageRank другим страницам, на которые ссылаются. Например, источник A с оценкой 5 цитирует B и C. Не беря во внимания другие ссылки, которые могут иметь B и C, эти страницы получают 85% от оценки A (оценка, умноженная на демпинг-фактор), то есть 4.25 вместе и по 2.125 каждая. Если при этом B цитирует D, оценка D будет составлять 85% от 2.125, и так далее.

Пример распределения PageRank

Давайте рассмотрим еще один пример, составленный с помощью симулятора PageRank:

Симулятор PageRank

У страницы 3 самый высокий показатель PageRank, потому что на нее ссылаются больше всего. Соответственно, вес, который она передает 4 и 5 страницам, тоже более высокий. 

Это очень упрощенная и далекая от реальности схема, которая анализирует 5 страниц отдельно от всех остальных, но она показывает, как распределяется оценка PageRank и насколько авторитет ссылающейся страницы важен для передачи ссылочного веса.

То есть PageRank имеет иерархический характер: ссылка с источника с оценкой 8 принесет больше, чем ссылка с источника с оценкой 2. При этом важно и количество: чем больше исходящих ссылок на странице, тем сильнее размывается их вес. Ваша страница может получить более высокий показатель PageRank с менее авторитетной страницы, если на ней в принципе немного ссылок.

Например, у страницы есть бэклинк с источника с оценкой 7, на котором 10 исходящих ссылок, и бэклинк с источника с оценкой 3, на котором размещено только 3 исходящих ссылки. Первый бэклинк принесет PageRank в размере 0.105 (оценка страницы, разделенная на количество ссылок и умноженная на демпинг-фактор), тогда как второй бэклинк принесет 0.15. Но, как правило, как раз самые авторитетные ресурсы ставят меньше внешних ссылок.

Влияние количества исходящих ссылок на PageRank

Панель PageRank в браузере и ссылочные манипуляции

В 2000 году Google добавил в браузеры специальную панель с PageRank и можно было узнать оценку любого сайта. Публичный доступ к оценке привел к манипуляциям и искусственному моделированию PageRank. Сайты старались заполучить побольше ссылок со страниц с высокой оценкой и спрос на покупку ссылок вырос вплоть до создания ссылочных ферм. 

Такое понимание алгоритма PageRank не представляло собой дальновидный SEO-подход, ведь в получении бэклинков важно не только их количество и условное качество ссылающегося ресурса, но и контекст, релевантность и естественность.

Google пытался выявлять и останавливать манипуляции с PageRank и закрыл публично доступную панель в 2016 году. До сих пор существуют сервисы, высчитывающие оценку PageRank и предлагающие сайтам установить бейдж с этой оценкой — но это уже не актуально. Алгоритм до сих пор участвует при ранжировании страниц, но узнать реальную оценку своей или внешней страницы невозможно.

Значение nofollow

Манипулятивные практики получения ссылок были связаны не только с доступностью оценок PageRank. Спамные ссылки в комментариях работали на продвижение сайта — и поисковые системы понимали, что нужно как-то это пресечь. В 2005 году Google и другие поисковики ввели значение nofollow для атрибута rel. Он говорит поисковым ботам не следовать по ссылке, а значит и не передавать ссылочный вес.

На этом манипулятивные техники себя не исчерпали. Сайты начали использовать nofollow, чтобы на фоне ссылок с этим значением остальные ссылки получали больше веса.

Рассмотрим на примере. Источник с оценкой PageRank 5 цитирует 10 страниц, 8 из них — с nofollow. До внедрения этого значения каждая из страниц получила бы 1/10 оценки (0.425 с учетом демпинг-фактора). А с nofollow только 2 страницы (не обозначенные этим значением в атрибуте rel) получат по половине оценки (2.125 с учетом демпинг-фактора). 

Эта схема перестала работать в 2009 году, когда Google исправил механизм PageRank, чтобы ссылки с nofollow не передавали свою часть оценки. Если взять описанный выше пример, то сегодня те же 2 страницы получат не 2.125, а 0.425, то есть PageRank распределяется равномерно на все 10 ссылок, но ссылки с nofollow не передают этот вес.

UGC

Даже с nofollow ссылки, оставляемые в комментариях, представляли проблему. В 2019 году Google добавил новое значение атрибута специально для таких ссылок — UGC (user-generated content), буквально означающий «контент, созданный пользователями». Сейчас многие блоги и форумы автоматически маркируют любые ссылки в комментариях как UGC, а nofollow используется для сознательно проставленных внешних ссылок, об авторитетности которых не хочется сигнализировать поисковикам.

Обновленный алгоритм PageRank

В 2004 году Google опубликовал обновленный патент PageRank, в основе которого лежала модель «рационального интернет-пользователя» и идея о том, что потенциал перехода по ссылке влияет на качество этой ссылки. Например, ссылки, размещенные в первой части контента страницы, или ссылки с понятными и информативными анкорными текстами обычно более заметны для пользователей. Поэтому вероятность перехода по ссылки тоже учитывается при оценке авторитетности страниц.

Кроме того, в 2006 году Google разработал новую систему оценивания авторитетности: определяется несколько ресурсов с самым высоким уровнем доверия (seed pages, буквально «страницы-зерна») и с их учетом оцениваются все остальные страницы в сети.

Новая формула выглядит так: 

∀si ≠ p ∈ P, Ri⁡(p) = d⁢ ∑ q→p⁢ Ri⁡(q) / qout ⁢* w(q→p)

Что означают эти переменные:

  • si — самые авторитетные страницы (seed pages)
  • P — все существующие веб-страницы
  • qout — полустепень исхода страницы q
  • w — вес ссылки (стандартно равен 1)

Пример авторитетной страницы — The New York Times: этот сайт размещает материалы на разные темы, которые интересуют пользователей, и включает полезные исходящие ссылки. Поэтому страницы, на которые такой ресурс ссылается, тоже считаются качественными. 

В соответствии с обновленным алгоритмом, распределение позиций в поиске на основе ссылок происходит в несколько этапов:

  • Система получает определенное количество страниц, открытых к индексированию
  • Система заведомо знает о страницах с самым высоким уровнем доверия
  • Система рассчитывает, насколько далеко от самых авторитетных находятся анализируемые страницы (по исходящим ссылкам)
  • Система определяет позиции в поиске, ставя выше те страницы, которые по кликам находятся ближе к самым авторитетным

Новая формула работает быстрее, потому что не оценивает все взаимосвязи ссылок в совокупности. Хоть оригинальный патент PageRank и утратил свою силу в 2018 году, алгоритм до сих пор используется Google при ранжировании сайтов. В Twitter аналитик Google Джон Мюллер указал на то, что они используют PageRank «среди множества других сигналов».

Что влияет на PageRank?

На оценку PageRank влияют разные факторы:

  • Количество ссылок
  • Ссылочные атрибуты
  • Анкорные тексты
  • Вероятность перехода по ссылке

Теперь давайте разберемся, как грамотно выстраивать свой ссылочный профиль, чтобы сигнализировать поисковым системам о высоком качестве и полезности страниц сайта.

Принципы получения обратных ссылок

Хоть алгоритм PageRank видоизменялся, его суть осталась неизменной с 1998 года: бэклинки работают как голоса в пользу страниц и помогают поисковикам определять авторитетность. Но внешние ссылки, ведущие на определенную страницу, добавляют ей веса при некоторых условиях:

  • Если они релевантны. Релевантность важна в большиснтве SEO-процессов. Поисковым системам не понравится, если ссылки между страницами не будут сигнализировать и семантической связи между ними. Скажем, если страница с кулинарными рецептами получит бэклинк со страницы об автомобилях, такая ссылка не принесет пользы, даже если ссылающийся ресурс очень авторитетный. 
  • Если они сопровождаются органичным анкорным текстом. Переспамленные ключевыми словами анкорные тексты не принесут пользы, а малоинформативные (вроде «здесь») будут менее полезны, чем развернутые. Анкоры должны понятно намекать на информацию, которая находится по ссылке.
  • Если ссылающиеся сайты достаточно авторитетны. Чтобы получать полезные бэклинки, нужно проверять качество ссылающегося домена и конкретной страницы, а также регулярно мониторить, не получает ли сайт спамных ссылок.
  • Если ссылки доступны для поисковых ботов. Чтобы передавать ссылочный вес, ссылки должны быть доступны для краулеров и не закрыты с помощью robots.txt или другого метода.
  • Если они не ведут на страницы с ошибками сервера. Обе страницы — ссылающаяся и та, на которую ведет ссылка, должны иметь 200 код ответа сервера, то есть быть открытыми к индексации. В случае редиректов (3** коды) не все из них передают ссылочный вес: хоть Google и утверждает, что все редиректы передают PageRank, отличные от 301 коды могут не справляться с этой задачей.
  • Если они не препятствуют поисковым ботам следовать по ссылке. Как мы уже сказали, значение nofollow влияет на распределение ссылочного веса, и бэклинк с nofollow менее значимый, чем с follow.
  • Если ссылки видимы на странице. Спрятанные ссылки могут привести к штрафам поисковиков — их нужно выделять цветом или подчеркиванием, чтобы они были заметны, но не выделялись из общего визуального стиля страницы.

PageRank оценивает авторитетность отдельных страниц, а не целых сайтов, поэтому внутренние ссылки так же важны для оценки, как и бэклинки. С помощью перелинковки вы можете направлять ссылочный вес на страницы сайта:

  • Чем больше внутренних ссылок ведут на страницу, тем выше ее PageRank
  • Чем больше ссылок размещено на странице, тем ниже PageRank, который она передает
  • Легко доступные и кликабельные ссылки передают более высокий PageRank
  • Ссылки с nofollow не передают PageRank

В отличие от внутренних, внешние ссылки не влияют на страницы, на которых они размещены. Они помогают поисковикам устанавливать связи между тематически близкими ресурсами, но напрямую не влияют на ссылочный вес и позиции в поиске.

Альтернативные метрики авторитетности

PageRank — первая метрика авторитетности, которая во многом изменила подход к SEO. Эта оценка до сих пор актуальна для Google, хоть мы и не знаем, как именно она влияет на позиции. Что можно сказать с точностью — то, что релевантные ссылки с качественных источников точно полезны и для наращивания авторитета, и для продвижения в органическом поиске.

Другие SEO-метрики, созданные для оценки авторитетности, точно так же опираются на количество и качество обратных ссылок.

Метрики авторитетности, созданные SEO-платформами, основаны на ссылочном профиле. У SE Ranking есть свои оценки — Domain Trust и Page Trust, которые оценивают качество домена или страницы, исходя из количества и качества бэклинков и ссылочных доменов. В инструменте «Анализ конкурентов» вы можете просмотреть оценку Domain Trust и Page Trust для любого сайта:

Оценки Domain Trust и Page Trust

Эти данные также доступны в инструментах «Анализ бэклинков» и «Мониторинг бэклинков», и Domain Trust отдельно отображается в обзорной части «Анализа сайта» наряду с другими доменными метриками. 

Актуален ли PageRank?

Роль ссылок стала основополагающей для механизма ранжирования в Google. Хоть алгоритм PageRank менялся и, казалось бы, терял свою значимость, ссылки всегда были и скорее всего останутся одним из главных факторов ранжирования. В 2016 году аналитики Google указали, что два определяющих фактора — это контент и ссылки, а в 2020-м Джон Мюллер подтвердил, что PageRank до сих пор используется при распределении позиций. 

Можно быть уверенными: работа над ссылочным профилем и грамотная внутренняя перелинковка остаются приоритетными SEO-задачами. Регулярно проверяйте, чтобы структура вашего сайта позволяла легко переходить между страницами, и занимайтесь линкбилдингом, фокусируясь на авторитетных и релевантных вашему сайту ресурсах.

Подпишитесь на наш блог!

Подпишитесь на нашу рассылку, чтобы быть в курсе главных новостей компании, получать эксперные статьи и полезные SEO-советы.

Спасибо!
Ура! Теперь вы подписаны на наш блог!
Пожалуйста, проверьте свой email и подтвердите подписку.