Главная / Оптимизация сайта / Broken link checker — поиск битых ссылок на сайте

Broken link checker — поиск битых ссылок на сайте

Поиск битых ссылок на сайтеВсем привет! Буквально недавно я боролся с вредоносным кодом на своем блоге и смог его победить. Об этом я расскажу в свежем выпуске дайджеста. Во время этой борьбы я решил еще и подчистить свой блог от ненужных элементов, которые тем или иным образом мешали нормальному поисковому продвижению. В этом посте я расскажу Вам о том, как я периодически делаю проверку наличия битых ссылок на сайте с помощью онлайн сервиса Broken link checker. Предлагаю Вам мое простое пошаговое руководство в картинках.

[contents h2 h3]

Что такое битые ссылки

Определение

Битая ссылка — это переход на несуществующие страницы сайта или блога, на документ или картинку. Если посетитель сайта перейдет по этой ссылке, ему браузер покажет сообщение о том, что данный элемент веб-ресусра не найден.

Причины возникновения

Их может быть несколько, но все они говорят о том, что выход на данный документ (страницу, картинку) невозможен из-за его отсутствия. Вот основные причины возникновения битых ссылок для страниц:

  • удаление страницы, на которую ведет ссылка. Обычно получается из-за того, что веб-мастер или удалил этот html-документ (пост на блоге, например), или полностью ликвидировал весь сайт.
  • редизайн сайта. В таком случае часто происходят изменения, которые полностью или частично меняют структуру ресурса (меняются или появляются разделы, создаются новые или частично редактируются старые страницы). Здесь урл страницы не соответствует тому адресу, на который вела битая ссылка (например, из-за укорачивания урла постов блога, удаляя элемент категорий — об этом я рассказывал в одной из своих seo-шпаргалок).
  • банальная опечатка веб-мастреа при прописке урла сайта, на которую планируется ставиться ссылка. Часто бывает из-за того, что в адресе ссылки стоит два http или пропущен один символ.

Последствия

Для посетителей битая ссылка может говорить о том, что или веб-мастер сайта не следит за адресатами своих внешних ссылок, или ему абсолютно неважно, куда ведут эти переходы. В большинстве случаев пользователи, увидев сообщение о несуществующей странице, уже не вернуться назад. В любом случае, доверие к такому владельцу сайта не увеличивается. 🙂

Для поисковых систем битая ссылка — это просто ошибка в коде сайта. Такая же, как если бы на посте блога или на странице интернет-магазина шла внутренняя ссылка на несуществующий документ. Но хорошо, если она одна или две. Если же ошибок много, это негативно может сказаться на индексировании ресурса — поисковым системам не нужны «глючные» сайты в выдаче.

Как найти битые ссылки на сайте

Да, битая ссылка на своем сайте — это вещь крайне неприятная как для самого владельца, так и для его посетителей. Но если таких проблемных переходов много (а с течением времени битые ссылки на большинстве ресурсах растут как на дрожжах), они могут принести большие проблемы. Поэтому от них нужно периодически избавляться. Для этого существуют различные программы, плагины и онлайн-сервисы.

Популярные средства по поиску битых ссылок на сайте

Программы являются самыми универсальными средствами. Как правило, они выдают много различной информации не только по битым ссылкам. Это их плюс. А минус в том, что из-за многообразия функций пользователю нужно хорошо знать интерфейс софта. Лучшие бесплатные программы — Netpeak Spider и Xenu’s Link Sleuth.

Плагины менее громоздки и более узкоспециализированные — решают конкретную задачу (поиск битых ссылок). В этом заключается их плюс. Минус их в том, что такие плагины должны устанавливаться в тело сайта (блога) под конкретную CMS. Для ресурсов на Вордпрессе самым популярным является Broken link checker plagin.

В последнее время все более актуальными становятся онлайн-сервисы для seo анализа сайта. Они обладают всем функционалом по поиску битых ссылок, которым обладают и универсальные программы. Но их интерфейсы очень просты. И самое важное — не требуется привязка к сайту (как в случае для плагина) и не требуется наличие специального софта и операционной системы — онлайн-сервис работает в любом браузере.

Лично я использую сервис Online Broken Link Checker. Теперь я покажу Вам как в нем нахожу битые ссылки.

Руководство по поиску битых ссылок на сайте

Онлайн сервис Broken link checker

Для нахождения битых ссылок в Online Broken Link Checker, переходим на главную страницу сервиса. Вводим данные в специальный блок и нажимаем кнопку Find broken links:

Указываем домен анализируемого сайта

Здесь нужно еще выбрать режим поиска битых ссылок — обычный и расширенный. При обычном режиме чекер будет искать битые ссылки в единственном числе на странице. При расширенном укажет каждый нерабочий переход. (Это бывает актуальным для блогов, которые на одной странице могут иметь по нескольку ссылок с одинаковыми неработающими урлами комментаторов — об этом ниже).

Затем сервис начинает поиск битых ссылок. За время сканирования чекер отражает каждый несуществующий переход на экране. После окончания проверки сайта к списку найденных битых ссылок добавляется их количество и число просканированных страниц ресурса:

Отчет готов

Переходим к изучению предоставленного отчета. Он выглядит в виде таблицы, столбцы которого указывают на битую ссылку, ее нахождение на странице сайта, скриншот с отрывком кода с неработающим переходом и пояснение ошибки.

Об ошибках расскажу немного подробнее. Всего существует несколько постоянных проблем (битые ссылки — это ошибка 404 и bad host), и различные ошибки сканирования (empty, time out и т.д.):

Варианты проблем, по которым сервис Broken Link Checker видит битую ссылку

Самые популярные причины возникновения ошибки при сканировании — 404 ошибка, говорящая об отсутствии страницы ресурса, на которую идет битая ссылка или bad host (нет домена на сервере).

Анализ битых ссылок

Каждый пункт таблицы рассматриваем по следующему плану:

План анализа битых ссылок

Первым делом смотрим, по какой проблеме сервис классифицирует битую ссылку. Для этого обращаем свое внимание на соответствующий раздел в таблице (на картинке он обозначен под цифрой 1). В качестве примера я взял битую ссылку, которая возникла в одном из комментариев на моем блоге.

Как видим на картинке, битая ссылка возникла из-за отсутствия страницы, на которую идет переход в комментарии. Для подтверждения этого ввожу адрес страницы, на которую идет битая ссылка (в моем примере это адрес блога interesenki.ru) и получаю сообщение об отсутствии домена на сервере:

Домен отсутствует на сервере

Убедившись в наличие ошибки, нажимаю в таблице на ссылку под номером 2 — пришло время узнать, где находиться неработающий переход. В моем случае битая ссылка была в одном из комментариев на посте:

Сервис показывает, где на странице анализируемого сайта находиться ошибка

Если же Вы не смогли сразу определить место несуществующей ссылки (например, в моем случае из-за большого количества комментариев с этим доменом), стоит нажать цифру 3 в отчете и посмотреть отрывок кода страницы анализируемого ресурса:

Отрывок кода страницы, где находится битая ссылка

Удаление битых ссылок в комментариях

После того, как мы нашли битые ссылки с помощью сервиса, нужно их исправить. В моем примере неработающий переход возник из-за отсутствия сайта одного из моих комментаторов. Так как ошибка возникла не из-за моей ошибки, мне следует убрать из комментария адрес ресурcа своего читателя:

Удаляю проблемную ссылку в комментарии

Кстати, обычно постоянные читатели на блогах оставляют не один комментарий. И как правило они есть на разных страницах. Поэтому, после того, как я разобрался с одной битой ссылкой, указанной сервисом Broken Link Checker, сразу ищу другие проблемные сообщения. Для этого в разделе блога «Комментарии» задаю поиск по проблемному адресу сайта читателя и получаю весь список его сообщений:

Битые ссылки в комментариях читателя

На рисунке показаны не только комментарии с аналогичной битой ссылок, но и специальный значок 404-й ошибки (в зеленой рамке). Это сам CMS WordPress указывает на то, что блога interesenki.ru на сервере нет.

И раз затронули тему комментариев, укажу еще на одну частую причину возникновения битых ссылок. Она возникает из-за шаблона, который автоматом указывает в форме для комментария адрес ресурса посетителя в виде «Ваш сайт» (как в моем случае). И если домен сайта не прописывается, то в сообщении вместо адреса блога читателя стоит такая строка:

Причина возникновения битой ссылки из-за в комментариях

Увы, такой «виртуальный адрес» тоже считается битой ссылкой. Поэтому при модерации я стараюсь всегда убирать такой пустой урл.

Как удалить битую ссылку в статье

Помимо комментариев часто битые ссылки на блогах и на коммерческих сайтах появляются в контенте. Бывает так, что вчера ссылка работала — ссылалась на чужую страницу, а сегодня уже выдает сообщение с ошибкой (сайт переехал, его удалили, поменялась его структура). Поэтому такие переходы тоже нужно лечить.

На примере все того же сервиса покажу план поиска и удаления битой ссылки на моем блоге. Вот очередной пример:

Поиск битой ссылки в тексте поста

Сервис Broken Link Checker нашел битую ссылку в одном из моих прошлых ежемесячных обзоров (эх, классная когда-то тема была!). Она ссылалась на статью моего земляка Дениса Тумиловича, автора сайта monetablog.ru. При проверке данный блог на момент проверки не работал (сейчас он заражен вирусом). Поэтому я принял решение удалить неработающий переход (жаль, конечно — пост Дениса был классным):

Удаление в CMS WordPress битой ссылки в тексте

Рекомендации и советы по поиску битых ссылок на блоге

Как видите, найти битую ссылку несложно — сервис Broken Link Checker четко выполняет свои функции. Но из своего опыта использования чекера скажу, что если сайт запущен, то копаться в отчете придется очень долго. Особенно, если включен расширенный режим поиска. Чтобы ускорить задачу, дам несколько простых советов (в основном это касается только блоггеров):

Расширенный поиск битых ссылок в комментариях

Как я уже говорил, многие блоггеры оставляют в комментариях адреса своих блогов. И зачастую, если эти сайты не существуют или к ним запрещен доступ, они генерируют битые ссылки. В моем мануале я указал, как можно их найти на своем блоге, и как удалить.

Но как показывает практика, ряд блоггеров вместо адреса своего блога указывают не ее домен (главная страница), а урл конкретного поста. В таком случае, так как блог читателя не открывается, то и конкретный пост тоже не будет виден браузером. Но в моем примере мы искали битые ссылки только по домену. Чтобы ускорить процесс нахождения переходов на несуществующие урлы статей проблемного блога, рекомендую в поиске наряду с адресом главной прописывать и почту читателя:

Поиск комментариев по урлу сайта и почте читателя

Как видно из примера, по запросу адреса домена читатель оставил 17 комментариев, а по почте — 37. Таким образом можно ускорить процесс удаления битых ссылок.

Поиск битых ссылок на домены с разным написанием урла

Такие случае редки, но тоже могут иметь место. Это когда адрес главной пишется со слэшем на конце урла или без:

Поиск битых ссылок на домены с разным написанием урла

На этом мой практический мануал по поиску битых ссылок закончен. В конце хочу дать еще один важный совет — делайте такую проверку ежемесячно. Ведь глазом не успеете моргнуть, как появятся нерабочие переходы.

Желаю удачи в чистке своего сайта! С уважением, Ваш Максим Довженко

About Максим Довженко

Максим Довженко

Check Also

Группировка семантического ядра сайта

Добрый день, уважаемые читатели! Все мы знаем, что сбор поисковых запросов — это фундамент для …

50 комментариев

  1. Аватар

    Проверять и удалять битые ссылки необходимо регулярно, я раз в месяц примерно запускаю плагин Broken Link и затем его деактивирую.
    Порой бывает, что не все битые ссылки нужно удалять, я их тщательно проверяю. Например сайт временно может быть не доступен, а для плагина это всё равно битая ссылка.
    Иногда бывают битые ссылки из-за некорректно удаленных картинок на блоге. Я вот чистил недавно папку image и несколько лишних картинок удалил. После этого запустил плагин и он мне быстренько нашел эти изображения, поскольку ссылки битые остались, я загрузил вновь недостающие изображения и теперь порядок.

    • Paladin

      Привет, Николай! Картинкам тоже нужен уход. Но как правило битые ссылки в таком случае очень редки.

    • Аватар

      Здравствуйте, Николай! Вроде не так уж и мало работаю с WP, но такой полезный плагин как-то пропустила. Спасибо за рекомендации. Установила и себе.

  2. Аватар

    Спасибо, Максим, очень полезный пост! Я как-то запускала проверку своего блога на этом сервисе, и он накопал немало того, что не показывал плагин Вордпресса, к сожалению. Сейчас запустила расширенный поиск, посмотрим, чего нароет… Хотя указанный плагином битые ссылки регулярно чищу.

    • Paladin

      Молодец, Елена! Чистка полезна не только блогу, но и блоггеру, так как он себя дисциплинирует. 🙂

  3. Аватар

    Очень интересно. Я блоггер «молодой» и про битые ссылки даже не думал. Максим, скажи, а на каком этапе «наполнения» ресурса есть смысл этим вопросом заниматься? Или это никогда не бывает рано?
    Отдельное спасибо за способ нахождения всех ссылок по фильтрам — я очень люблю автоматизацию процессов.

    • Paladin

      Привет, Дима! Даю примерные цифры. Если блогу меньше года и цикличность публикаций новых постов в месяц где-то 6-8, то стоит делать проверку раз в 45 дней. Если блогу более года и его уже читают не только постоянные читатели, но и поисковые посетители, то проверку стоит делать 1 раз в месяц.

  4. Аватар

    Добрый вечер, Максим! Полезная информация. Спасибо, нашла и для себя кое-что новенькое. А так обычно пользовалась прогой Netpeak Spider.
    P.S.: очень рада, что проблемы с вредоносным кодом для Вас теперь позади.

    • Paladin

      Спасибо, Инга! Я за эту неделю немного поседел, пока этот вирус творил гадости всякие…
      Рад, что мой пост принес Вам полезную информацию. 🙂

  5. Аватар

    Спасибо, что познакомили с онлайн сервисом, все — таки лишний плагин не хочется ставить, хотя на одном моем блоге он есть и я его включаю только периодически. Битые ссылки я удаляю только в статьях, а в комментариях чаще всего делаю их текстовыми, так как иногда в комментариях завязываются настоящие дебаты между читателями блога

    • Paladin

      Добрый день, Вилия! Если делать ссылки текстовыми, могут обидеться некоторые блоггеры. Поэтому Вы лучше делайте периодическую проверку на битые ссылки — всем будет хорошо. 🙂

  6. Аватар

    Максим, я зашла по ссылке на главную, ввела адрес блога и появилась табличка с просьбой подтвердить действия, а где их подтвердить, я не нахожу, может подскажете, что я делаю не так

    • Paladin

      Вилия, посмотрите внимательно на мой рисунок с примером авторизации. Сначала прописываем домен в синем окошке, а затем появляется страница, где нужно прописать символы и выбрать стратегию сканирования битых ссылок.

  7. Аватар

    Хоть я и не блоггер, да и страниц на моем сайте очень мало, статья понравилась. Думаю, и небольшой сайт проверять стоит.

    • Paladin

      Конечно стоит, Татьяна! А вдруг Вы сами где-то ошиблись и дали ссылку на несуществующий ресурс. Посетителям это точно не понравится.

  8. Аватар

    Неделю назад тоже установил этот плагин. Оказывается за 4 месяца ведения блога, появилось 23 битые ссылки в именах авторов комментариев. Плагин отличный!

    • Paladin

      Привет, Андрей! Я тоже заметил, что самый частый источник битых ссылок на блоге — это ссылки в комментариях.

  9. Аватар

    Добрый день, Максим!
    Ввожу адрес , клацаю кнопку, появляется окошечко «Подтвердите действия на …» Вторая строчка : «URLS with slashes are supported in the FREE version» Нажимаю ОК.
    И всё по новой… — Не работает!

    • Paladin

      Только что сам еще раз проверил (мало ли, друг за ночь что изменилось) — все работает. Попробуйте еще раз. Сначала вводите домен, нажимаете кнопку, затем на другой странице выбираете стратегию сканирования (по умолчанию стоит облегченный поиск), вводите цифры капчи и опять нажимаете кнопку.

  10. Аватар

    Обалденный плагин. Что мне в нём нравится — так это то, что он присылает письма на почту при обнаружении битых ссылок.

  11. Аватар

    Отличный плагин, каждый месяц провожу им проверку и все время появляются какие-то новые битые ссылки, без него просто никуда

  12. Аватар

    Обычно пользуюсь плагином, иногда проверяю сервисами, но про этот не знал. Сейчас потестим.

    • Paladin

      Привет, Олег! Обязательно попробуй, удобная штука, когда ты сканируешь по пару незнакомых сайтов в неделе. 🙂 Интересно будет твое мнение услышать.

      • Аватар

        Ну ты и подкинул работы. Сервис нашел ссылки, которые плагин не показывал. Причем их оказалось не мало, все из комментариев. Пришлось ручками удалять. Теперь буду проверять этой штукой периодически. Спасибо, за наводку!

        • Paladin

          Привет, Олег! Спасибо за обратную связь! Уверен, что теперь многие пользователи плагина будут периодически использовать и этот онлайн-сервис.

  13. Аватар

    У меня их больше 200 нашлось

  14. Аватар

    Я думаю после проверки это принесёт хорошие результаты,хорошая статья.

  15. Аватар

    Здравствуйте, Максим. Знакома с Вашим сайтом уже давно, несколько раз заглядывала почитать статьи по оптимизации блога, но сейчас возникла проблема технического характера и без Вашей подсказки я никак не справлюсь.
    Вчера мне написали в комментариях, что невозможно перейти с моего блога на блоги других авторов. Никакую полезную информацию в интернете по этому поводу я не нашла (технарь я нулевой), вспомнила о Вас, и в результате разыскала эту статью.
    Проверила блог на указанном сервисе, он мне выдал 140 битых ссылок и все они с адресами блогов моих комментаторов (везде ошибка 404). Хотя с моего блога я перехожу ко всем без проблем. Может быть Вы сталкивались с таким вот безобразием и подскажите что это такое и как с ним бороться, если нет, то подскажите куда обратиться за помощью. Заранее благодарна))

    • Paladin

      Добрый день, Наталья!
      Если я Вас правильно понял, Ваши читатели не могут попасть на сайты, которые являются личными блогами других читателей. Но Вы это можете сделать. Верно?

  16. Аватар

    Да, Максим. Я как раз сейчас с чужого компьютера, попробовала: если нажимаю в комментарии под статьей на имя комментатора с личным блогом, то вместо перехода на его блог открывается заглавная страница моего блога где написано «К сожалению, по Вашему запросу ничего не найдено». Причем из виджета «ТОП комментаторов» все открывается без проблем. А дома со своего компьютера у меня без проблем открывались блоги и из виджета, и из комментариев под статьей.
    И вроде бы не лазила куда не надо в последнее время….

    • Paladin

      да уж, все это очень странно. Похоже стоит где-то редирект на главную страницу Вашего блога, если нажимать ссылки с комментов. Я спрошу у знакомых веб-мастеров, было ли у них такая проблемка и Вам напишу ответ.

  17. Аватар

    Ой, Максим, спасибо большое.
    Я как и большинство женщин-блогеров создала блог не подозревая о масштабах технических заморочек, хотя сама хорошо разбираюсь только в стиральных порошках и губных помадах, о чем и пишу вобщем-то))

    • Paladin

      Поэтому, Ваш блоггерский труд важен вдвойне! Не опускайте руки, продолжайте своим читателям рассказывать о том, что знаете и умеете. 🙂

  18. Аватар

    Плагин стоит давно, и огромное количество битых ссылок было удалено им (иногда такие блоги хорошие были, даже жалко, что люди их побросали), но я поняла, что онлайн сервис работает глубже и круче. Попробую проверить им, и посмотреть «чё будет». Самой интересно!

  19. Аватар

    Здравствуйте, Максим
    Регулярно читаю Ваш блог, пользуюсь книгой и сое-шпаргалками (низкий поклон за полезный труд). У меня вопрос немного не по плану: как критично переделать ссылки на своем блоге с русского на латиницу? Дело в том, что у меня ссылки на русском и при копировании появляются пятитонные кракозябры :(. Зачем я их на русском сделала даже не скажу… Может быть Вы посоветуете, что лучше для продвижения и нормального функционирования блога, какие ссылки? Все же полностью кроить блог страшновато…

    • Paladin

      Добрый день, Ирина!
      На русском Вы могли сделать адреса ссылок только в том случае, если сам блог имеет кирилицу в урлах. А значит ничего менять не нужно.

  20. Аватар

    Максим, огромное спасибо за статью! Воспользовалась сервисом. Оказывается битые ссылки можно легко найти и удалить.

  21. Аватар

    Спасибо за рекомендованные сервис, нашел несколько ссылочек, хотя стоит плагин, который должен их вылавливать.

  22. Аватар

    Нет, не выловил. Благодаря вашему сервису аж 6 штук нашла, после чего благополучно снесла плагин.

  23. Аватар

    Сканирование — Ошибки сканирования во вкладке Не найдено список всех битых ссылок, которые обнаружил Гугл, нажав на конкретную из них, вы уведите какие страницы ссылаются на данный URL. По моему опыту,  многие результаты сканирования могут быть устаревшими и оставаться даже после того, как вы устранили проблему, не забудьте поставить галочку и нажать Отметить исправленными.

  24. Аватар

    Добрый день! Спасибо за очень полезную статью!
    Не могли бы вы помочь советом? Дело в том, что после использования сервиса Broken link checker я обнаружила, что все мои внешние ссылки отмечались как «битые», то же самое показал и вебмастер. Оказалось, сработал плагин WP No External Links, который оборачивает ссылки таким образом, что при нажатии гостем ссылка работает, а ПС видит ее как 404 и перенаправляет на главную страницу моего сайта. Плагин я отключила, после этого Broken link checker показал, что битых ссылок нет.
    В связи с этим обстоятельством очень волнует вопрос: не повредит ли сайту, что все ссылки стали открытыми? Не потеряют ли страницы сайта свой вес? Насколько я могу судить по свежим статьям seo-блогов, сейчас оставлять внешние тематические ссылки стало полезно, хотя раньше все советовали оборачивать их в «noindex» и «nofollow».
    Спасибо.

    • Paladin

      Добрый день, Ольга! Очень хороший вопрос. По поводу моего мнения об открытых ссылках Вы подробно можете узнать из этой статьи на блоге — http://www.workformation.ru/ishodjashhie-ssylki-s-sajta.html
      А если кратко — если идут ссылки на тематические проверенные ресурсы, то это даже хорошо. Вес утечет небольшой, но это мелочь, по сравнению с тем, что Ваш сайт линкуется с другими такой же тематики — поисковики это любят.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *