Анализируя посещаемость одного сайта, обратил внимание, что поисковик (а именно Google) в сниппете поисковой выдачи часто выдает содержимое футера. Поскольку сайт был медицинской тематики, и футер содержал множество предупреждений, то сниппет выглядел, мягко говоря, отталкивающим. Так появилась необходимость разобраться с индексацией содержимого страницы.
Noindex
Поисковики единогласно выдали по запросу запрета индексации содержимого страницы тег <noindex>. Рассмотрим возможные варианты его применения.
- Мета тег noindex: <meta name= “robots” content= “noindex”/> — позволяет запретить индексацию содержимого страницы в целом;
- тег <noindex>: – <noindex> Этот текст не будет индексироваться </noindex> позволяет запретить индексацию содержимого, заключенного внутри тега;
- для сохранения валидности (“безошибочности”) кода страницы существует следующий вариант: <!–noindex–> Этот текст не будет индексироваться <!–/noindex–>.
Вроде бы все ясно и прозрачно, да не совсем так. <noindex>, чисто Яндексовская фишка, на Google не распространяется.
Первый вариант, запрещающий индексацию всего содержимого страницы, по-прежнему применим к Google: <meta name= “robots” content= “noindex” />.
Googleoff/on
Дальнейшие поиски навели на googleoff/on. И, вроде, бы счастье было совсем близко, но положительного результата не дало. Как оказалось данный тег применим исключительно для Google Search Appliance. Говоря проще, для локального поиска. Веб-поиском не поддерживается вообще.
Информация представлена ниже исключительно в ознакомительных целях. Данный тег, увы, никак не влияет на индексацию, хотя рассматривается в качестве решения в большинстве публикаций по данной теме.
-
для запрета индексации части контента googleoff/on:index: индексируемое содержимое <!–googleoff: index–> данное содержимое не индексируется <!–googleon: index–> индексируемое содержимое;
-
для запрета вывода части контента в сниппете, индексация содержимого производится и учитывается при поиске googleoff/on:snippet : индексируется и может быть выведено в сниппете <!–googleoff: snippet–> данное содержимое индексируется, но не выводится в сниппет <!–googleon: snippet–> индексируется и может быть выведено в сниппете;
- для запрета индексации и вывода части контента в сниппете googleoff/on:all: индексируется и может быть выведено в сниппете <!–googleoff: snippet–> данное содержимое не индексируется и не выводится в сниппет <!–googleon: snippet–> индексируется и может быть выведено в сниппете;
Script
Остается вариант запрета индексации с помощью скриптов. Порядок действий приблизительно таков:
-
- создать папку, в которой будем держать весь контент, не требующий индексации;
- запретить индексацию данной папки в robots.txt ( Disallow: /folder/*);
- создать в данной папке файл file.html с содержимым, которое необходимо скрыть;
- подключить JQuery на странице, где требуется скрыть содержимое;
- в <head> добавить следующий скрипт:
<script type="text/javascript"> $(document).ready(function() { $('#hide_content').load('folder/file.html'); }); </script>12345<script type="text/javascript">$(document).ready(function() {$('#hide_content').load('folder/file.html');});</script> - вставить div с указанным в скрипте идентификатором, там где необходимо вывести скрытый от индексации контент:
<div id="hide_content"></div>1<div id="hide_content"></div>
<iframe>
Данный метод практически повторяет предыдущий, кроме того, что контент выводим не через скрипт, а через <iframe>:
- создать папку, в которой будем держать весь контент, не требующий индексации;
- запретить индексацию данной папки в robots.txt ( Disallow: /folder/*);
- создать в данной папке файл file.html с содержимым, которое необходимо скрыть;
- вставить iframe, там где необходимо вывести скрытый от индексации контент:
<span><iframe src="folder/file.html"></span><span></iframe></span>1<span><iframe src="folder/file.html"></span><span></iframe></span>
Картинка вместо текста
Может быть, в каких-то случаях это и вариант. Но по-моему больше головной боли и недостатков.