Внутренняя оптимизация сайта

Posted Декабрь 27th, 2009 by admin

1. Составление семантического ядра.
Распределение ключевых запросов по целевым страницам.

  • анализ сайтов конкурентов
  • взаимопродвигаемые запросы должны быть на одной странице

2. Оптимизация текста документа:

  • title – включение продающих моментов
  • мета-теги (keywords, description)
  • распределение ключевых слов в тегах форматирования: <h1> – <h6>, <strong>, <em>
  • теги списков: <ul> – <li>; <ol> – <li>
  • расположение ключевых слов ближе к началу документа
  • плотность ключевых слов (5-6%)
  • количество точных вхождений (в сравнении с конкурентами). TF-IDF — статистическая мера, используемая для оценки важности слова в документе, являющегося частью коллекции документов.
    • TF (частота слова) — отношение числа вхождений слова в документ к общему число слов в данном документе.
    • IDF (обратная частота документа) — частота, с которой некоторое слово встречается в документах коллекции.

    Таким образом, мера TF-IDF является произведением двух сомножителей: TF и IDF.
    Большой вес в TF-IDF получат слова с высокой частотой в пределах конкретного документа и с низкой частотой употреблений в других документах.

  • уникальный контент (копирайтинг). Проверка уникальности контента:
    1. www.copyscape.com
    2. ввести строчки из контента в поисковик

3. Оптимизация ссылочной структуры – перелинковка, типы:

  • кольцевая (циклическая, круговая): А -> б, в, г; Б -> в, г, а
  • «хлебная крошка» – путь: Главная/Раздел/Страница
  • случайная (рандомная) – неструкурированное расположение ссылок на основе ключевых слов

4. Карта сайта

  • для роботов ( в robots.txt) – индексация – формат .txt; .xml
  • для пользователей – юзабилити – формат .html

5. Оптимизация изображений (alt)

6. Юзабилити

  • проверка удобности структуры сайта
  • удобное меню
  • наличие страницы с контактами
  • продающие моменты: телефон, адрес, e-mail в шапке сайта
  • если меню на java или flash – дублировать внизу

7. Аудит сайта – поиск технических проблем

  • битые ссылки
  • орфографические ошибки
  • фреймы
  • наличие ключевых слов в url
  • скрытый текст, однопиксельные ссылки
  • наличие списка запросов
  • счётчики – системы аналитики
  • помещение разделов с быстро растущим контентом (новости, доски объявлений, форумы, блоги) на поддомены, чтоб избежать попадания под спам-фильтры
  • дорвеи, клоакинг
    1. дорвей – это сайт с большим количеством ключевых слов, созданны целью редиректа посетителей на основной сайт, либо открутки контекстной рекламы
    2. клоакинг – это метод достижения высоких позиций в поисковой выдаче путем показа разных страниц роботу (пауку) и посетителю
  • динамические url
  • время отклика страницы:
    1. 1xx: Информационные
    2. 2xx: Успешно
    3. 200 – OK
    4. 3xx: перенаправление
    5. 301 – перемещена навсегда
    6. 302 – временно перемещена
    7. 4xx: ошибка клиента
    8. 404 – страница не найдена
    9. 5xx: ошибки сервера
    10. 503 сервис недоступен
    11. 504 шлюз не отвечает
  • идентификаторы сессии id (- воспринимаются как зеркала)

8. robots.txt
– это текстовый файл, находящийся в корневой директории сайта, в котором записываются специальные инструкции для поисковых роботов.

Особенности:

  • Формат файла robots.txt – простой текстовый файл, создается в обычном блокноте.
  • Местонахождение файла роботс – корневая директория сайта.
  • Пустой файл robots.txt или его отсутствие означает разрешение на индексирование всего сайта.
  • Большие robots.txt (более 256 Кб) считаются полностью разрешающими
  • Регистр написания имени файла – только нижний.
  • При копировании файла с помощью ftp-клиента, его нужно настроить на текстовый режим обмена файлами.
  • Если для данной страницы сайта подходит несколько директив, то выбирается первая в порядке появления в выбранном User-agent блоке.
  1. Директива User-agent
    При сессионном принципе работы запись User-agent содержит
    в себе название поискового робота
    User-agent: * обращение происходит абсолютно ко всем поисковикам
    User-agent: Yandex обращение к роботу Яндекса
  2. Директивы Disallow и Allow
    Disallow запрещает доступ робота к некоторым частям сайта или сайту целиком
    Disallow: / сайт закрыт для индексации
    Disallow: /cgi-bin/ блокирует доступ к страницам начинающимся с ‘/cgi-bin’Allow разрешает доступ робота к некоторым частям сайта или сайту целиком
    Allow: /cgi-bin
    Disallow: / запрещает скачивать все, кроме страниц начинающихся с ‘/cgi-bin’Disallow: *.htm$ запрещает все файлы с расширением .htm
  3. Директива Sitemap
    Sitemap: http://mysite.ru/site_structure/my_sitemaps.xml
    Робот запомнит пути к sitemaps.xml, обработает файлы и будет использовать результаты при последующем формировании сессий закачки.
  4. Директива Host
    Определяет главное зеркало.
    Директива ‘Host’ не гарантирует выбор указанного главного зеркала, но алгоритм при принятии решения учитывает ее с высоким приоритетом
    Host: www.glavnoye-zerkalo.ru
  5. Директива Crawl-delay
    Если сервер сильно нагружен и не успевает отрабатывать запросы на закачку.
    Задает поисковому роботу минимальный период времени (в секундах) между концом закачки одной страницы и началом закачки следующей.
    Crawl-delay: 2 задает таймаут в 2 секунды
  6. Директива Clean-param
    Если адреса страниц сайта содержат динамические параметры которые не влияют на их содержимое
    (идентификаторы сессий, пользователей, рефереров и т.п.), можно описать их при помощи директивы ‘Clean-param’.
    Clean-param: s /showthread.php
  7. Для проверки правильности файла robots.txt вы можете воспользоваться специальным «Анализатором robots.txt»

No related posts.

Leave a Reply