1. Составление семантического ядра.
Распределение ключевых запросов по целевым страницам.
- анализ сайтов конкурентов
- взаимопродвигаемые запросы должны быть на одной странице
2. Оптимизация текста документа:
- title – включение продающих моментов
- мета-теги (keywords, description)
- распределение ключевых слов в тегах форматирования: <h1> – <h6>, <strong>, <em>
- теги списков: <ul> – <li>; <ol> – <li>
- расположение ключевых слов ближе к началу документа
- плотность ключевых слов (5-6%)
- количество точных вхождений (в сравнении с конкурентами). TF-IDF — статистическая мера, используемая для оценки важности слова в документе, являющегося частью коллекции документов.
- TF (частота слова) — отношение числа вхождений слова в документ к общему число слов в данном документе.
- IDF (обратная частота документа) — частота, с которой некоторое слово встречается в документах коллекции.
Таким образом, мера TF-IDF является произведением двух сомножителей: TF и IDF.
Большой вес в TF-IDF получат слова с высокой частотой в пределах конкретного документа и с низкой частотой употреблений в других документах.
- уникальный контент (копирайтинг). Проверка уникальности контента:
- www.copyscape.com
- ввести строчки из контента в поисковик
3. Оптимизация ссылочной структуры – перелинковка, типы:
- кольцевая (циклическая, круговая): А -> б, в, г; Б -> в, г, а
- «хлебная крошка» – путь: Главная/Раздел/Страница
- случайная (рандомная) – неструкурированное расположение ссылок на основе ключевых слов
4. Карта сайта
- для роботов ( в robots.txt) – индексация – формат .txt; .xml
- для пользователей – юзабилити – формат .html
5. Оптимизация изображений (alt)
6. Юзабилити
- проверка удобности структуры сайта
- удобное меню
- наличие страницы с контактами
- продающие моменты: телефон, адрес, e-mail в шапке сайта
- если меню на java или flash – дублировать внизу
7. Аудит сайта – поиск технических проблем
- битые ссылки
- орфографические ошибки
- фреймы
- наличие ключевых слов в url
- скрытый текст, однопиксельные ссылки
- наличие списка запросов
- счётчики – системы аналитики
- помещение разделов с быстро растущим контентом (новости, доски объявлений, форумы, блоги) на поддомены, чтоб избежать попадания под спам-фильтры
- дорвеи, клоакинг
- дорвей – это сайт с большим количеством ключевых слов, созданны целью редиректа посетителей на основной сайт, либо открутки контекстной рекламы
- клоакинг – это метод достижения высоких позиций в поисковой выдаче путем показа разных страниц роботу (пауку) и посетителю
- динамические url
- время отклика страницы:
- 1xx: Информационные
- 2xx: Успешно
- 200 – OK
- 3xx: перенаправление
- 301 – перемещена навсегда
- 302 – временно перемещена
- 4xx: ошибка клиента
- 404 – страница не найдена
- 5xx: ошибки сервера
- 503 сервис недоступен
- 504 шлюз не отвечает
- идентификаторы сессии id (- воспринимаются как зеркала)
8. robots.txt
– это текстовый файл, находящийся в корневой директории сайта, в котором записываются специальные инструкции для поисковых роботов.
Особенности:
- Формат файла robots.txt – простой текстовый файл, создается в обычном блокноте.
- Местонахождение файла роботс – корневая директория сайта.
- Пустой файл robots.txt или его отсутствие означает разрешение на индексирование всего сайта.
- Большие robots.txt (более 256 Кб) считаются полностью разрешающими
- Регистр написания имени файла – только нижний.
- При копировании файла с помощью ftp-клиента, его нужно настроить на текстовый режим обмена файлами.
- Если для данной страницы сайта подходит несколько директив, то выбирается первая в порядке появления в выбранном User-agent блоке.
- Директива User-agent
При сессионном принципе работы запись User-agent содержит
в себе название поискового робота
User-agent: * обращение происходит абсолютно ко всем поисковикам
User-agent: Yandex обращение к роботу Яндекса - Директивы Disallow и Allow
Disallow запрещает доступ робота к некоторым частям сайта или сайту целиком
Disallow: / сайт закрыт для индексации
Disallow: /cgi-bin/ блокирует доступ к страницам начинающимся с ‘/cgi-bin’Allow разрешает доступ робота к некоторым частям сайта или сайту целиком
Allow: /cgi-bin
Disallow: / запрещает скачивать все, кроме страниц начинающихся с ‘/cgi-bin’Disallow: *.htm$ запрещает все файлы с расширением .htm - Директива Sitemap
Sitemap: http://mysite.ru/site_structure/my_sitemaps.xml
Робот запомнит пути к sitemaps.xml, обработает файлы и будет использовать результаты при последующем формировании сессий закачки. - Директива Host
Определяет главное зеркало.
Директива ‘Host’ не гарантирует выбор указанного главного зеркала, но алгоритм при принятии решения учитывает ее с высоким приоритетом
Host: www.glavnoye-zerkalo.ru - Директива Crawl-delay
Если сервер сильно нагружен и не успевает отрабатывать запросы на закачку.
Задает поисковому роботу минимальный период времени (в секундах) между концом закачки одной страницы и началом закачки следующей.
Crawl-delay: 2 задает таймаут в 2 секунды - Директива Clean-param
Если адреса страниц сайта содержат динамические параметры которые не влияют на их содержимое
(идентификаторы сессий, пользователей, рефереров и т.п.), можно описать их при помощи директивы ‘Clean-param’.
Clean-param: s /showthread.php
Для проверки правильности файла robots.txt вы можете воспользоваться специальным «Анализатором robots.txt»
No related posts.