Блог ☯

понедельник, 11 сентября 2017 г.

Как найти и исправить битые ссылки на сайте?

Сегодня я расскажу как найти и исправить битые ссылки на сайте, буду показывать на примере моего блога (econdude.pw), который использует движок blogger (blogspot), хотя это в принципе неважно и будет работать для WP и любой другой CMS.

Битая ссылка это такая ссылка, при переходе по которой сервер отдает ответ «страница не существует или не найдена», код ошибки 404.

Как найти и исправить битые ссылки на сайте?

Есть достаточно можно сервисов проверки битых ссылок, но я использовал программу от netpeaksoftware и расскажу именно про неё. Там проверка сайта на битые ссылки осуществляется бесплатно, триальный период 14 дней.

Если вы хотите найти и исправить битые ссылки онлайн, то можно попробовать siteliner. Правда там функционал немного ограничен.

Ну и еще как вариант, бесплатно посмотреть всё в google search console.

Там идёте в crawl errors (ошибки сканирования) и жмите на каждую 404:

Как найти и исправить битые ссылки на сайте?

Будет примерно вот такое, картинки кликабельны

Мы тут видим "Lined From" - с каких страниц идут ссылки на страницу, которая у вас не существует. Вот как раз они и есть битые и их нужно исправить.

В принципе если у вас 10-20 битых ссылок, вам хватит и google search console, просто если их сотни, пользоваться им не всегда удобно.

Мы поговорим про netpeaksoftware. Когда вы его скачали, авторизировались (можно через Google+) то вбивайте ваш адрес сайта вот сюда:

Как найти и исправить битые ссылки на сайте?

И жмите "Старт"

Можете до этого проверить настройки сканирования и добавить какие-то элементы, я добавил сканирование внешних ссылок.

Ну и вообще стоит сказать, что сервис netpeaksoftware довольно добротный. Он не один такой, но тут всё довольно удобно, красиво и много инструментов. Я не многими пользовался, поэтому честно сравнить не могу, но думаю что тут всё вполне круто.

Сканирование может занять долгое время, у меня программа проверила 7000+ ссылок (на сайте примерно 850 страниц) и процесс занял 21 минуту.

Довольно долго, но тут уж ничего не поделаешь, сайт уже не такой уж и мелкий, а работа над битыми ссылками это тоже не работа на 10 минут, но когда вы всё исправите, вы можете больше к этому годы не возвращаться.

Итак, когда сканирование закончится, жмите фильтр:

Как найти и исправить битые ссылки на сайте?

Далее вы должны выбрать все URL - ссылки, которые выдают код ответа сервера 404. Этот код (404) и означает наличие отсутствия (лол) страницы - страница не найдена.

В фильтре делайте вот так:

Как найти и исправить битые ссылки на сайте?

Логика фильтра - И, включить, код ответа сервера, содержит - 404.

Применяете фильтр и нам показывает только страницы где есть ошибка 404. Сейчас мы получили список несуществующих страниц.

Теперь внимание.

Вам показали все страницы которых не существует, но нам нужно не это, нам нужно найти с каких существующих страниц туда ведут ссылки, это и будут битые ссылки.

Как найти и исправить битые ссылки на сайте?

Выделяем все результаты - все ссылки, которе возвращают 404. Нажимаем один раз на верхнюю и зажав shift листаем в самый низ списка, чтобы выделить все.

Далее сверху находим синюю кнопку "Входящие ссылки НА текущий URL со сканируемого сайта" и жмём её. Нам выводит нужный нам отчёт.

Как найти и исправить битые ссылки на сайте?

Тут мы смотрим на "С URL", ну и анкоры справа смотрите, так проще

Всего у меня вышло 190 битых ссылок, не слабо так, да?

Представляете как всё это вредит.

Люди переходят по таким, а попадают никуда, на 404. Но дело в том, что вчера я удалил 90 статей из 950 в блоге, так-как глобально пересматривал всю философию.

Теперь считаю, что качество важнее количества и что самые плохие статьи в моём случае стоило удалить, если они не получают трафик, если их уже не реанимировать переписыванием (про это писал тут: Хватит писать новые статьи, улучшайте старые!).

Ну и если на статьи не было внешних ссылок.

Тут у меня вышел любопытный конфуз. Так как я удалял плохие и очень старые статьи, то я примерно помнил, какие из них связанны ссылками, поэтому вышло так, что внешние ссылки стояли на 404 с 404. А это не страшно.

Когда вы исправите все ссылки, не забудьте потом в google search console отметить, что вы их починили (marked as fixed), со временем они от туда пропадут.

Пример исправления битых ссылок:

Как найти и исправить битые ссылки на сайте?

Нам нужно смотреть С URL и потом два раза нажимать на ссылку.

Как найти и исправить битые ссылки на сайте?

Вот статья с битой ссылкой, офигительно просто. Никогда так не делайте!

Статью про Навального эту, на которую тут ссылка, я давно удалил.

Шутка анкорной ссылкой это только в Луркоморье можно, не делайте так. Особенно когда статья не по теме. Личной мой случай любопытный, у меня в блоге чётко есть 4 темы и если я к примеру не трогаю статьи про создание игр, которые хорошие, то почти все ссылки там идут именно на такие-же статьи.

Грубо говоря если я выпилил 90 статей тут про политику, то я выдрал как-бы целый кластер, но другие кластеры почти не пострадали. Это круто, но не надо было смешивать кластеры вот такими ссылками. Это ошибка.

Далее мы находим эту статью в нашем блоге или сайте, где есть данная ссылка. В Blogger я думаю вы знаете как искать статьи. Вот тут на всякий случай:

Как найти и исправить битые ссылки на сайте?

Ну и просто сносите эту ссылку. Сейчас думал снести эту статью целиком, но это образует еще больше битых ссылок, а повторно сканировать не хочется.

Поэтому раз уж вы ковыряете старые статьи, это неплохое время их заодно улучшить. Оптимизировать картинки, посмотреть ключевые слова и т.д.

Так-как у меня вышло 190 ссылок, это исправление займёт пару дней, поэтому сделайте экспорт результатов в Excel чтобы к этому можно было вернуться.

Может быть у вас лечение битых ссылок займёт даже неделю, но я думаю это того стоит, хотя тут многое зависит от типа вашего сайта.

Если это какой-то огромный ресурс и там только 1% ссылок битые, при том что там уже сотни тысяч URL, то можете и забить на это.

Вредно когда у вас небольшой сайт или блог среднего размера, вот примерно до 1000 страниц (хотя и 5к страниц можно поковырять).

Можно так-то вообще как-то все эти 404 сделать редиректами, например на какие-то другие статьи по теме, но не знаю хорошо это будет или плохо.

На этом всё, надеюсь я вам помог найти и исправить битые ссылки на сайте.

Ну и урок на будущее, осторожнее ставьте внутренние ссылки на сайте, не перебарщивайте с этим, ставьте только релевантные данной статьи и такие, на которые человеку будет реально полезно нажать. Парочка внутренних ссылок в статье не навредит, но не увлекайтесь. Плюс не забывайте что функцию внутренней перелинковки сейчас во многом исполняют блоки рекомендательного контента, которые делают это с умом.

Другие полезные и интересные статьи про оптимизацию вот тут: