Это не моралистическая статья призванная наставить вас на путь истинный, я не призываю никого бросать все свои дела и идти бороться со спамом. Нет, статья опубликована вовсе из других соображений. Во-первых, на Западе к спаму относятся очень плохо, не в пример нашему долготерпению, а поэтому не вредно знать, что же может быть сочтено спамом и, возможно, действительно постараться избежать неправомерных обвинений. Во-вторых, на мой взгляд, эта статья последовательное и детальное руководство для умных по засорению индекса поисковых машин своими страницами. Я никого не призываю применять изложенные в этой статье "советы", но ... В общем, читайте и размышляйте.
Что такое спам?
Перед тем, как вы захотите использовать различные технические увертки для того, чтобы поднять свой собственный рейтинг у поисковых машин, вам необходимо узнать немного о том, что такое спам и спамминг.
Спамминг поисковых машин - это практически использование неэтичных и непрофессиональных технических приемов в попытках поднять свой собственный рейтинг у поисковой машины. Вы должны быть осведомлены о том, что есть спамминг, для того чтобы избежать неприятностей с поисковыми роботами.
Например, если у вас есть страница с белым фоном, а на ней таблица с синими ячейками и белым текстом в них, то вы, тем самым, автоматически спаммингуете Infoseek, хотя никто об этом даже и не догадывается! Поисковый робот "видит" белый фон и белый текст и делает вывод, что на вашей странице текст одного цвета с фоном, а, следовательно, вы пользуетесь нечестными способами. После этого вас выкидывают из индекса и пойди потом докажи, что ты не верблюд. Эту неприятную ситуацию, конечно, можно легко исправить, изменив белый цвет подложки на светло-серый, причем сами вы изменений даже и не заметите, а для робота - это два принципиально разных цвета. Тем не менее, крайне неприятно уже то, что вас в чем-либо обвинили.
В общем, гораздо проще узнать заранее, чего лучше не делать, чем рисковать быть обвиненным во всех смертных грехах, а также тем, что ваши страницы будут игнорироваться поисковыми машинами и службами каталогов. Если вы будете следовать нескольким несложным правилам, то сможете избежать неприятных ощущений.
Из чего состоит спам?
- Махинации с ключевыми словами. Это чрезмерное повторение ключевых слов на странице для увеличения частоты, а, следовательно, релевантности поиска. Продвинутые поисковые машины в состоянии разобрать, когда это повторение является нормальным, т.е., вполне допустимым, среди остальных слов документа, когда же частота превышает пороговую, они делают заключение, что вы - жулик.
- Невидимый текст. Некоторые веб-мастера фарширую свои страницы текстом, который имеет тот же цвет, что и фон страницы. Поисковые машины, как уже упоминалось. В состоянии распознать подобные хитрости и могут выкинуть вас из индекса. Тоже самое касается и очень мелкого текста, который часто располагают между строками или по бокам текстового блока.
- Переадресация страницы. Многие роботы, особенно это касается Infoseek, "не любят" страницы, которые не имея собственного содержания отсылают пользователей на другой адрес. Причем, некоторые, особо продвинутые машины в состоянии отследить, когда это делается не только с помощью <meta>- тегов, но и при использовании Java апплетов, CGI - скриптов, а также прямых серверных приложений.
- Набивка meta-тегов. Не повторяйте ключевые слова в meta-тегах более одного раза - они могут быть сочтены лишними и ненужными. Также не стоит использовать ключевые слова, которые не соответствуют содержанию вашего сайта.
- Не посылайте одну и туже страницу более одного раза в день на одну и туже поисковую машину.
- Не посылайте набор одинаковых страниц. Т.е. не стоит размножать одну и туже титульную страницу, простым копирование, а затем пытаться отослать их все вместе. Это может быть расценено, как попытка надуть поисковую машину.
- Подмена кода. Если вы уже оптимизировали свою страницу для достижения первых мест в рейтинге поисковых машин, то не стоит полностью заменять код вашей страницы после того, как топ рейтинга был достигнут.
- Не посылайте на регистрацию больше дозволенного. Каждая поисковая машина имеет свои пределы для приема страниц. Например, для AltaVista этот предел составляет 1-10 страниц в день, для HotBot - 50, Excite - 25 в неделю, Infoseek - 50 в день, если вы используете форму. Учтите, что это не максимальная глубина индексирования, а максимальное количество страниц, которое от вас будет принято. Так, если у вас сайт объемом 1000 страниц, а вы можете послать только 50 из них, то у вас не возникает никаких проблем, так как робот пройдет по ссылкам на вашей странице в пределах одного сервера и проиндексирует все ваши страницы, даже, если вы их не посылали.
Теневые стороны
Очень часто поисковые роботы могут счесть спамом самые лучшие куски вашего сайта. например Infoseek не воспринимает страницы с быстрым обновлением, хотя некоторые дизайны создают с помощью этой функции удивительные эффекты мерцания и движения. Или вот еще пример: Infoseek может жаловаться на большое количество страниц на одном хосте залинкованных на одну. Из индекса вас при этом не выкинут, но могут сбросить с высоких мест в рейтинге. Подразумевается, что эта мера должна дезориентировать спаммеров, а не практике, оказывается, что в категорию "нечистоплотных" попадают сразу все содержатели больших, разветвленных ресурсов, например, если у вас сайт из ста страниц, каждая из которых имеет ссылку на оглавление.
На счастье, поисковые роботы придумали и поддерживают не роботы, а живые люди, и они прекрасно понимают, что даже самые жесткие ограничения не остановят спаммеров, а вот невинные люди вполне могут пострадать. Поэтому никто не будет применять никаких к вам санкций, если у вас просто хорошо релевантная страница, точно также, если у вас большой и разветвленный проект. Поэтому, если вам кажется, что у вас есть проблемы с поисковой машиной, то напишите ее администратору, скорее всего, он войдет в ваше положение.
Давид Гиканди. InternetDay, сокращенный перевод.
|