/ Soft

Xenu Link Sleuth: обзор программы для экспресс-аудита сайта

Xenu's Link Sleuth — бесплатная программа-краулер, позволяющая сканировать любой сайт. Ее основным назначением является поиск битых ссылок, однако софт позволяет решать и другие задачи.

Cкачать дистрибутив Xenu можно на официальном сайте home.snafu.de. Программа работает стабильно, несмотря на то, что последняя сборка датирована 2010 годом, и станет полезным инструментом для тех, кто занимается развитием своего проекта.

  1. Начало работы с Xenu
  2. Настройка программы
  3. Анализ отчетов и применение на практике
  4. Данные в окне программы

Единственными минусами Xenu для некоторых пользователей могут стать полностью английский интерфейс и отсутствие возможности экспорта отчетов в таблицы.

Начало работы с Xenu

После установки и запуска программы откроется окно минималистичного интерфейса.

Для запуска нового проекта выберите в меню File > Check URL.

В открывшемся окне вбейте адрес своего проекта.

Галочка Check external links означает,что будут просканированы внешние (исходящие) ссылки сайта.

Если вы хотите исключить из внешнего ссылочного профиля некоторые ссылки, например, на поддомены или зеркала, укажите, какие URLы считать внутренними в секции Include/Exclude.

Также здесь можно исключить из сканирования целые директории, если они слишком обширны или вы разделили сканирование на несколько этапов.

Настройка программы

В меню Options можно установить дополнительные настройки для сканирования. Так, в секции Basic отмечаем галочками нужные виды отчетов.

  1. Broken links, ordered by link — Битые ссылки, сгруппированные по URL-адресу;
  2. Broken links, ordered by page — Битые ссылки, сгруппированные по страницам, где они расположены;
  3. Broken local links — Внутренние битые ссылки;
  4. Redirected URLs — Адреса, возвращающие 301 или 302 редирект;
  5. Ftp and gopher URLs — FTP и не HTTP/HTTPS протоколы;
  6. Valid text URLs — Рабочие текстовые ссылки;
  7. Site Map — Карта сайта в формате XML;
  8. Statistics — Статистика;
  9. Orphan files — Потерянные файлы (те файлы, на которые не ссылается ни один документ сайта): для их поиска программа запросит FTP-доступ к серверу).

По окончании сканирования вы увидите окошко.

Кликните Да и отчет откроется локально в окне браузера.

Анализ html-отчетов

Xenu формирует html-страничку с отчетами, указанными в настройках.

Используя полученные данные, можно найти достаточно серьезные проблемы в оптимизации сайта.

Какие ошибки можно выявить с помощью отчета

1. Найти и устранить неработающие ссылки.
Со временем информация на сайте устаревает и появляются битые ссылки на уже удаленные страницы, картинки, документы вашего же или стороннего ресурса. Большое количество неработающих ссылок служит сигналом поисковику о том, что развитию сайта не уделяют внимания, а значит, возможно, и его контент не несет большой ценности. Кроме того, битые URLы — однозначно плохой user experience.

Программа найдет все неработающие ссылки, в том числе на служебные файлы и элементы дизайна.

Смотрите отчеты:
— Broken links, ordered by link
— Broken links, ordered by page
— Broken page-local links

2. Увидеть, какие ссылки возвращают редирект.
В SEO часто используется склейка редиректом дублирующих адресов или удаленных страниц с новыми, чтобы не терять посетителей. При этом за внутренними ссылками следят не так внимательно и при простановке редиректов оставляют их в исходном виде. Тогда как большое число активных редиректов — это еще один сигнал для поисковика о том, что информация на сайте не актуализируется.

Смотрите отчет:
— List of redirected URLs

3. Получить список всех страниц сайта и выстроить его структуру.

Список всех доступных страниц поможет составить правильную логическую структуру сайта и найти URLы с большим уровнем вложенности. Если вы нашли важную информацию на странице 4-го или 5-го уровня вложенности, стоит подумать над улучшением внутренней навигации.

Смотрите отчеты:
— List of valid URLs you can submit to a search engine
— Site Map of HTML pages with a Title

4. Составить HTML-карту сайта.
Программа создаст карту сайта, которую удобно использовать на небольших статичных ресурсах взамен долгого ручного труда.

Смотрите отчет:
— Site Map of HTML pages with a Title

5. Найти неуникальные тайтлы.

Дублирование браузерных заголовков — критичная ошибка в оптимизации сайта. Для поисковика title был и остается одним из ключевых сигналов о содержимом страницы. Если на сайте несколько URL с одинаковым заголовком, поисковику придется случайным образом решать, какой же из них отвечает на запрос пользователя, что негативно скажется на ранжировании всего сайта.

Смотрите отчет:
— Site Map of HTML pages with a Title

6. Получить экспресс-статистику сайта.

В этом отчете вы найдете статистику по сайту с указанием типов данных, кодов ответа и размеров передаваемого кода.

Смотрите отчет:
— Statistics for managers

Данные в окне программы

Тем временем, в основном окне программы останется доступным список всех просканированных адресов и их параметров.

  1. Address — URL страницы;
  2. Status — Статус сканирования (доступность страницы во время обхода программой);
  3. Type — Тип содержимого;
  4. Size — Объем передаваемых данных;
  5. Title — Браузерный заголовок title;
  6. Date — Дата обновления (может отсутствовать);
  7. Level — Уровень вложенности;
  8. Out Links — Исходящие ссылки;
  9. In Links — Входящие ссылки;
  10. Server — Тип сервера;
  11. Error — Описание ошибки;
  12. Duration — Время ответа;
  13. Charset — Кодировка;
  14. Description - Мета-описание description.

К сожалению, эту информацию нельзя выгрузить в привычный табличный редактор, но с ней можно работать прямо в окне программы — доступна сортировка по столбцам.

Что можно узнать по собранным данным

1. Найти страницы с наибольшим и наименьшим количеством внутренних ссылок.

Полученные данные можно использовать при перелинковке сайта. Наиболее важные страницы должны иметь самое большое число входящих ссылок.

Для просмотра всех внутренних связей страницы кликните по URL-адресу правой кнопкой мыши и выберите URL properties.

2. Найти страницы с долгим ответом и ошибками сервера.

Потребуется исправить конфигурацию или удалить ошибочные ссылки.

3. Найти исходящие ссылки на другие ресурсы.

Адреса этих сайтов появятся в первом столбце вместе с вашими URL.

Злоумышленники используют чужие сайты в том числе для простановки вредоносных ссылок. Проверьте, действительно ли вы размещали эти ссылки.

4. Найти изображения без атрибута alt.

Если на вашем сайте много уникального графического контента, то поиск по изображениям может приносить неплохой трафик. Для того, чтобы пользователи находили ваш сайт, надо заполнить атрибут alt у всех изображений поясняющей подписью.

Увидеть заполненные и найти пустые можно в окне программы, оссортировав таблицу по типу контента.

В итоге

Несмотря на то, что с момента релиза софта прошло много времени, за которое появилось немало аналогичных инструментов, Xenu остается отличным средством для быстрого аудита не слишком крупных ресурсов.

Основными преимуществами программы остаются простота использования, скорость работы и, конечно, доступность на бесплатной основе, а недостатками — английский интерфейс и невозможность экспорта отчетов в таблицы.

Xenu Link Sleuth: обзор программы для экспресс-аудита сайта
Поделиться