Форум Рідного Міста

Нове значення атрибуту rel гіпертекстового посилання від Google

Андрій Пелещишин - 21-1-2005 у 18:51

Тепер Google зайнявся вдосконаленням мови HTML – додав до списку можливих значень атрибуту rel тегу А значення nofollow (зі самим списком допустимих значень можна ознайомитися тут - http://www.w3.org/TR/html4/types.html#h-6.12
Нове значення атрибуту rel покликане відмічати ті посилання, які не повинні використивуватися інтернет-роботами для лазання по мережі а також не повинні використовуватися при визначенні рангу сторінки (PageRank) та різноманітних схожих величин, які базуються на посиланнях, що ведуть на сторінку.
Метою нововведення є боротьба зі найпопулярнішим на сьогодні методом “сірого” просування сайту в пошукових машинах – спаму систем розміщення коментарів на сайтах (таких як коментарі в блогах та книгах відгуків відвідувачів) з метою розміщення там посилань на свій сайт.
Дана ініціатива підтримана також пошуковими системами MSN Search та Yahoo.
Деякі основні аспекти даного нововведення є розміщені тут - http://www.google.com/googleblog/2005/01/preventing-comment-spam.ht...

Проте, як завжди в таких таких випадках є ряд цікавих моментів.
1. Своїм нововведенням Google практично визнала неможливість повноцінної автоматизованої фільтрації сторінок пошукового спаму на основі алгоритмів рангування, що базуються на посиланнях (PageRank, Hilltop тощо). Раніше стверджувалося, що об’єктивно існуюча гіпертекстова стуктрура WWW є найкращим арбітром релевантності сторінок. Тепер фактично, веб-майстер сам може консультувати пошукову систему щодо достойності чи недостойності сторінки, на яку веде посилання з його сайту.
2. В руки Веб-майстрів фактично надається новий інструмент для маніпулювання розподілу PageRank в межах контрольованих ним сторінок. Наприклад, веб-майстер може проводити нечесний обмін посиланнями з іншим сайтом, вказуючи rel=”nofollow” у посиланні на партнерський сайт
3. Пропонований механізм теоретично може бути використаний для визначення сайтів, що просуваються в Інтернеті з використанням пошукового спаму. Що відкриває нові можливості по дискредитації сайтів-конкурентів. Хоча цей аспект нововедення не афішується, теоречно такі моменти можуть мати місце.

Імовірно, дане нововедення було здійснене не стільки з ініціативи Google, скільки з ініціативи власників онлайн-сервісів типу LiveJournal та виробників ПЗ для блогів та CMS (наприклад SixAparts з її Movable Type) , які серйозно страждають від спамерів, що постійно заповнюють блоги рекламною та спамерською інформацією.

Андрій Пелещишин - 7-2-2005 у 01:28

Main Page - NoNoFollow
Сайт, присвячений критиці даного нововведення

vovka - 7-2-2005 у 22:24

Воно має і позитивні сторони як я зрозумів.
Наприклад гугл не розуміє тегу <noindex></noindex> тоді як яндекс розуміє.
Я буває що непотрібно індексувати лінки деякі на сайті, наприклад ті в яких в кінці стоїть якийсб додатковий параметр, наприклад є такий лінк:
http://misto.ridne.net/viewthread.php?tid=3414
а наприклад підписка на цю тему морже виглядати як
http://misto.ridne.net/viewthread.php?tid=3414&mode=subscribe
Так от другий лінк практично нема змісту підсовувати гугл..
Тому там можна поставити rel=nofollow .
Бо в robots.txt таких лінків не заборониш....

Андрій Пелещишин - 7-2-2005 у 23:13

Песимісти щодо змін у мові HTML більше відзначають, те що повертається паскудна практика 90-х, коли стандарти Вебу ігнорувалися виходячи з "доцільності" - кожен виробник броузера вважав за необхідне всунути в специфікацію мови пару власних нестандартних розширень. Тоді це обгрунтовувалося недостатніми можливостями стандарту ХТМЛ у графічній верстці, тепер - необхідністю захисту від спаму блогів та книг відгуків.
Я тільки "за" боротьбу проти спаму. Але треба реально дивитися на речі - саме недосконалість алгоритмів Гугла породило явище спаму блогів. І тепер перекладати дану проблему на власників блогів - трохи некоректно. Та й неефективно.

Андрій Пелещишин - 7-2-2005 у 23:21

Цитата:
а наприклад підписка на цю тему морже виглядати як
http://misto.ridne.net/viewthread.php?tid=3414&mode=subscribe
Так от другий лінк практично нема змісту підсовувати гугл..
Тому там можна поставити rel=nofollow .
Бо в robots.txt таких лінків не заборониш....


Для робота Гугла такий лінк заборонити можна. Правда доведеться використати специфічне для Гугл розширення синтаксису файлу robots.txt , але воно таке саме нестандартне як атрибут rel зі значенням nofollow чи тег noindex
І так і так - зле :(.
Найгірше, що спамерам наплювати, чи ти використовуєш блокування від робота Гугла чи ні. Тому що бази сайтів для спаму набивають одні люди, а спамлять по купленим базам - другі. І задача перших набрати якомога більшу базу, яку потім продати другим.
Хто має досвід впровадження багатьох проектів - помічав, що спамлять "усе, що дихає", незалежно від того, який лінк отримається (прямий, непрямий, з nofolllow) і чи отримається взагалі. Діють по класичному принципу - "кількість переростає в якість"

vovka - 8-2-2005 у 01:05

Цитата:

Для робота Гугла такий лінк заборонити можна. Правда доведеться використати специфічне для Гугл розширення синтаксису файлу robots.txt , але воно таке саме нестандартне як атрибут rel зі значенням nofollow чи тег noindex

О, точно є в гугла розширення, я щось не додивився...
User-Agent: Googlebot
Disallow: /*.gif$

Цитата:

Хто має досвід впровадження багатьох проектів - помічав, що спамлять "усе, що дихає", незалежно від того, який лінк отримається (прямий, непрямий, з nofolllow) і чи отримається взагалі. Діють по класичному принципу - "кількість переростає в якість"

Ага, тепер тільки додастся мороки при обміні зсилками.
Треба перевірити роботс.txt , <noindex> а тепер ще й rel=nofollow . А то деколи трапляються розумники..

Гуглу це розширення напевно і допоможе відфільтрувати зайвий спам при сприянні веб-майстрів, а от веб-майстрам це точно нічого не дасть. Як спамили їх, так і будуть спамити. Тому і неясно чи буде це хтось використовувати, хіба що заради морального задоволення - раз спамлять, то хай хоть користі від того не буде...