Борьба с клонами

Известная проблема интерактивных ресурсов - множественные регистрации пользователей. В зависимости от характера ресурса это явление может быть желательным, не имеющим значения или нежелательным.
На больших форумах, особенно имеющих коммерческую составляющую, клонирование участников весьма нежелательно. Оно отрицательно сказывается на доверии к участникам, ослабляет эффективность борьбы администрации с нарушителями и имеет другие негативные стороны. Попробую кратко обозначить некоторые технические способы противодействия этому явлению.

Первое, что приходит в голову вебмастера - отслеживать IP адреса. Этот способ обладает рядом недостатков, сводящих его значение до вспомогательного. Во-первых, многие провайдеры, особенно спутниковые, выпускают пользователей в Сеть через один или несколько шлюзов, что приводит к совпадению адресов у многих пользователей. С другой стороны, динамические адреса, присваиваемые другими провайдерами делают невозможной однозначную привязку пользователя к адресу. Отдельно следует упомянуть анонимайзеры, веб-ускорители и другие сервисы, полностью искажающие картину соответствия адресов и пользователей.
Тем не менее, не стоит полностью отказываться от анализа IP. Статистическая обработка логов пользователей способна дать интересные результаты. Следует разделить адреса и участников на группы, требующие различного подхода к анализу. Адреса, используемые многими пользователями выделяются в недостоверную группу (сюда же включаются их подсети). Полезно так же выделить участников, заходящих из одной подсети и участников заходящих с множества подсетей. Каждой группе адресов и участников присваивается свой индекс достоверности. При обработке массива логов с учетом индексов достоверности, можно выявить первую группу клонов. Эта группа наиболее заметна, но ее участникам требуется дополнительное подтверждение клонирования, поскольку результаты лишь указывают на возможность клонирования, не доказывая факта.

Вторая мысль, возникающая у вебмастера - использование долгоживущих cookies для фиксации браузера участника. Этот способ весьма достоверен, но эффективен лишь на непрофессиональных форумах, где участники с трудом отличают браузер от почтового клиента. Более-менее грамотные клоноводы давно умеют очищать cookies и ходить в Сеть из разных браузеров.

Третий способ - использование скриптовых и flash элементов, собирающие некоторые сведения о компьютерах участников и хранящие их в отдельной базе. Достоверность и эффективность этого способа сильно зависит от искусства программиста, его реализующего.

Кроме того, возможны встречные низкоуровневые сетевые запросы по обратившемуся IP адресу, но эта тема за пределами веб-технологий, поэтому упомянута лишь как иллюстрация возможного коварства программистов. :)

Четвертый способ - построение "поведенческого профиля" участника. Порядок переходов между разделами, среднее количество просмотренных тем в каждом разделе и множество других деталей поведения могут дать весьма достоверную информацию об участнике, при условии правильного подбора анализируемых параметров и корректной их статистической обработки.

Еще один, довольно экзотический способ профилирования участников - лингвистический анализ их сообщений. Этот способ ограничен форматом интерактивного ресурса (короткие посты на разные темы, изобилующие цитатами), но, в сочетании с другими способами может заметно повысить достоверность результатов.

Администратору, занятому выявлением клонов не следует полагаться на какой-то один из указанных способов. Максимальной эффективности можно достичь лишь их умелым сочетанием.

disclaimer (отмазка):
В заметке перечислены лишь наиболее очевидные методики борьбы с клонами. Все приведенные в заметке методики описаны схематично и в описаниях отсутствуют важные детали, без которых эти методики остаются теоретическими рассуждениями, неприменимыми на практике. На самом деле, методов намного больше и эффективность этой борьбы зависит лишь от заинтересованности администрации. В принципе, можно выявить почти всех клонов, дающих хоть какой-то материал для статистики, однако не стоит забывать, что любая крайность вредна. А паранойя администраторов вообще убийственна для интерактивного ресурса.