Цитата(Andriy @ 10.8.2008, 9:05)

Возьмите фразу с сайта, который по Вашему имеет "уник для поисковиков",
Определение первоисточника это самое слабое место в данный момент в алгоритмах ПС (по моему мнению). Определяет конечно исключительно по времени индексации, другой вопрос как реализуется. Если контент на сайте, он уже практически сразу становится неуникальным.
У гугла с его отличной скоростью индексации это реализуется тем, что спустя некоторое время неуникальный контент исчезает из основной выдачи, а виден только в supplemental results, в народе говорят - "сайт попал в сопли (IMG:
style_emoticons/default/rolleyes.gif) "
у яндекса, все реализуется........ (это маты), как всегда через ...... сложности (IMG:
style_emoticons/default/rolleyes.gif) Очень часто уникальный текст, появляется гораздо позже и первоисточник гораздо ниже. Если у Вас молодой сайт, а кто то берет часть Вашего контента, даже с указанием на первоисточник, но если этот кто то размещает Ваш контент на хорошо обновляемом, хорошо индексируемом, как сейчас модно говорить трастовом сайте, то в выдаче будет скорее всего не Ваш контент. Очень часто у яндекса сателиты, которые создаются на основе ворованного контента опережают первоистчник. Здесь несколько причин.
1. у Я не очень хороший алгоритм определения первоисточника и слабые возможности для постоянного сканирования сети.
поэтому, сайты которые
постоянно и регулярно обновляются, обрабатываются роботом в первую очередь
2. ваш сайт, который уже есть в выдаче и обновляется время от времени обрабатывается ботами в рабочем режиме, т.е. не спешно, по каким то там ему только известным графикам, а вот только созданный сателит на основе Вашего контента, прокачивается ссылками и к нему боты ходят по сотням, тысячам новых ссылок.
3. часто сервер не отдает дату создания документа.
Предлагая пари, я написал, что мне нужно пару К страниц уникального контента. но я не писал, что сразу буду его выкладывать (IMG:
style_emoticons/default/rolleyes.gif) . Если разместить 200 страниц, дать под индекс , а потом интенсивно, постоянно и стабильно добавлять контент, то Вы привяжете ботов к своему сайту, они сами внесут Ваш сайт в какую то категорию быстрообновляемых и будут очень частыми гостями.
Ботами можно манипулировать, просто нужно понять кто они и как "думают", работают.
здесь на форуме упоминалось, что добавление сайта в аддурилку яндекса вызывает на сайт быстроробота. это не так. добавляя сайт в аддурилку вы вызываете compatible; Win16; D, который тащит инфу и отмечает дату индексации, но он не отдает ничего в серп, он передает эту инфу compatible; Win16; I, основному индескирующему роботу, который съедает весь сайт и после АПа выдачи Ваш сайт появляется в серпе.
Быстроробот это бот который индексирует блоги,часто обновляемые сайты, новостные по RSS. В серпе сайты на которых пасется быстроробот, появляются в течении нескольких часов. иногда он забредает случайно на новые сайты, тогда сайт появляется в индексе к радости веб мастера, но спустя пару дней пропадает вызывая истерику у того же веб мастера.
Стоит не забывать одно - боты, они тупые (с) Задорнов.
они работают по определенному режиму и правилам, поняв которые можно помогать им, подсказывать и быть с ними в шоколаде. Гимморно, но сейчас по другому никак. Самый простой способ подружиться с ботами, и соответственно с ПС, это по началу подстраиваться под их логику. (не забываем, что создают их люди, а значит правила и логика создателей)
Для помощи ботам нужно работать на них
и прежде чем ваш сайт станет трастовым с точки зрения ПС, очень много нужно сделать и делать постоянно.
Вот упрощенная схема как можно безболезненно немного укрепить свои позиции и со временем стать авторитетным первоисточником в глазах ботов. Сразу оговорюсь, это моя субъективная точка зрения, только для СДЛ ( а их я считаю у одного человека не может быть много. максимум 2-3)
Нужно иметь много запаса контента. после индесции основного сайта, добавляя контент, не ленитесь добавлять страницу (но не много, по 1-2 в день с интервалом в два три дня в
аддурилку, пусть они отмечают у себя дату индексации. Если есть возможность на обновляемый контент ставьте
ссылки с других сайтов даже на время. не новости, не материал с указанием первоисточника, а именно ссылки. (указание первоисточника в статье на другом сайте как правило внизу страницы и бот может просто не дойти до него, а схватить кусок и утащить в базу).
добавляете страницы понемногу но часто, в идеале каждый день - два, при этом на морде сайта анонсируете новый контент. Как пример посмотрите здесь
пример хорошо поданых обновлений для роботов (IMG:
style_emoticons/default/rolleyes.gif)
и со временем будет Вам и Вашему сайту щастя от ботов. и быстроробот будет постоянно жить и контент уникальный будет именно с Вашего сайта в серп первым попадать