Добавить комментарий

Кибернетика против спама

На авторство не претендую, техническую идею подсмотрел на одном из форумов. Современные спам-защиты недостаточно эффективны. Спам просачивается даже сквозь двойные рубежи: на почтовом сервере и на клиенте. Взглянем на проблему с кибернетической точки зрения.

Она состоит в том, что разнообразие на входе (спам) очень велико. А система, его детектирующая, обладает разнообразием гораздо меньшим.

Забудем временно про алгоритмы и прочую байесову математику. Попытаемся построить гомеостат. Внесем в детектирующую систему разнообразие, соответствующее входу. Технически это сделать очень просто: добавим на вход почтовые ящики, в которые будет попадать только спам. Для этого, например, генерируем несколько почтовых адресов и размещаем их в открытом доступе.

Детектирование превращается в относительно простую процедуру:
- на адрес реального пользователя пришло письмо
- ищем в спам-ящике такое же
- нашли - удаляем, не нашли - доставляем

Получили тот самый "черный ящик", которого нам не хватало ранее для обеспечения адекватного разнообразия. Как он работает - нам неведомо: его наполняют сами спамеры :)

Может показаться, что гомеостата как такового нет: в обозначенной схеме он не виден. Но ведь нам нужно управлять генерацией и размещением адресов-ловушек. Добавится параметр эффективности поступления спама в ящик, далее нужно принимать решение о закрытии неэффективного ящика и генерации нового. Вот уже и гомеостат вырисовался.

Теперь обратная связь бьет по самим спамерам: чтобы доставить спам в ящик пользователя, нужно научить спам-боты различать спам-ловушки от "человеческих" адресов. А разнообразие адресов-ловушек тоже очень велико.
Вот пусть теперь сидят и придумывают алгоритмы отсева ловушек и прочие "хренализаторы". Ведь стоит пропустить в рассылке хотя бы один такой адрес, как вся партия спама отправляется в мусор.

Однако, наука - открытый источник, поэтому спамеры тоже в курсе дела. Они поступают в соответствии с тем же принципом: увеличивают разнообразие на входе. Например, индивидуализируя текст в рассылке.

Каков следующий ход? :)