Распределенные системы обнаружения спама |
Электронная почта | ||
<< HDMI | Выявление спам сайтов на основе анализа контента страниц >> |
Картинок нет |
Автор: Alex Tutubalin. Чтобы познакомиться с картинкой полного размера, нажмите на её эскиз. Чтобы можно было использовать все картинки для урока информатики, скачайте бесплатно презентацию «Распределенные системы обнаружения спама.ppt» со всеми картинками в zip-архиве размером 120 КБ.
Сл | Текст | Сл | Текст |
1 | Распределенные системы обнаружения | 9 | Пользователь, получивший спам, может |
спама. Существующие решения и перспективы | проголосовать «против» него (передав | ||
Алексей Тутубалин ЗАО «Ашманов и | сигнатуру сообщения на сервер). Сигнатура, | ||
Партнеры». | получившая много голосов, считается | ||
2 | Определения. Спам (спам-рассылка) – | спамом, все сообщения с такой сигнатурой – | |
массовая анонимная незапрошенная рассылка | тоже спам. Лидер: Razor/SpamNet | ||
электронной почты Легальная рассылка - | (Cloudmark). Альтернативная система Pyzor | ||
рассылка электронной почты, произведенная | – не развивается и не имеет большого | ||
по запросу ее получателей Обычная | охвата. | ||
(легальная) электронная почта - обмен не | 10 | Razor/SpamNet. Бесплатное ПО для UNIX | |
массовыми сообщениями между пользователями | и бесплатное право на его использование | ||
и/или автоматическими системами | Платная подписка для Windows-клиентов | ||
Обнаружение спама – синоним для «борьбы со | (серверное и клиентское ПО) ~600000 | ||
спамом». | голосующих пользователей ~100 млн. | ||
3 | Популярные способы обнаружения спама. | обрабатываемых сообщений в сутки Рейтинги | |
Черные списки IP-адресов (RBL и ведущиеся | доверия к голосующим клиентам Уровень | ||
вручную) Анализ технической информации | обнаружения российского спама невысок – | ||
сообщения Анализ тела сообщения | порядка 10%, что объясняется малой | ||
(контентный анализ) методами лингвистики, | распространенностью метода в Рунете, | ||
либо статистики Системы с квитированием | соответственно малым числом голосов. | ||
Отказ (частичный отказ) от E-mail | 11 | Анализ всей транзитной почты. Подсчет | |
Большинство методов рассматривают | сигнатур для всех сообщений Передача | ||
сообщение отдельно от общего контекста. | сигнатур на сервер системы, получение в | ||
Накопление данных если и ведется, то | ответ данных о частотности Частотные | ||
локально - в рамках одного списка либо | сообщения считаются массовой рассылкой | ||
почтовой системы. | Невозможно отличить легальные рассылки от | ||
4 | Свойства спам-рассылок. | спама – необходимы белые списки | |
Распределенность - рассылки производятся | принимаемых легальных рассылок. | ||
со многих IP-адресов «Персонализация» - | 12 | Система DCC. Распределенная система | |
каждое отдельное сообщение уникально | сбора статистики по почте Обрабатывается | ||
Мимикрия – техническая информация | вся транзитная почта Бесплатное ПО в | ||
максимально похожа на легальную. | открытых кодах ~40 млн. «уникальных» | ||
5 | Свойства спам-рассылок (2). Сообщения | сообщений в сутки (с учетом повторяемости | |
содержат рекламу от заказчика рассылки и | – порядка 100 млн.) Дополнительный | ||
не могут содержать слишком много другого | механизм голосований, похожий на | ||
текста Сообщения должны быть читаемы | Razor/SpamNet Уровень обнаружения | ||
получателем без напряжения Уникальность | российского спама – около 25% при | ||
сообщений обеспечивается машинным путем, | отсутствии ложных срабатываний (по тестам | ||
сообщения в одной рассылке похожи друг на | автора доклада). | ||
друга. | 13 | Возможности компрометации. Ухудшение | |
6 | Распределенные антиспам-системы. Сбор | качества работы. Может быть результатом | |
информации о происходящих сейчас рассылках | «персонализации» спама Может быть | ||
из максимально-возможного количества точек | результатом не попадания спама в систему | ||
в сети Быстрая централизованная или | сбора. Увеличение доли ложных срабатываний | ||
распределенная обработка Максимально | Может быть результатом попадания в систему | ||
быстрая доступность информации об идущих | сбора сообщений, которые не являются | ||
рассылках Имеющиеся на сегодня системы | спамом. Потенциально возможно для всех | ||
принципиально отличаются методами сбора | распределенных систем. | ||
данных, остальные их свойства похожи. | 14 | Проблемы распределенных систем. | |
7 | Методы сбора данных. Ловушки | «Персонализация» спама – добавление | |
(honeypots) – E-mail адреса, | мусора, HTML-трюки и т.п. Пути решения – | ||
предназначенные только для приема спама | использование аппарата поиска схожих | ||
Голосование пользователей Анализ всей | текстов, возможно с выделением частотных, | ||
проходящей почты Каждый из методов | либо словарных слов. Ложные срабатывания | ||
используют 1-2 лидера в данной области. | Пути решения – создание белых списков | ||
Системы небольшого размера неэффективны и | легальных массовых рассылок, возможно – | ||
не выживают (исключение – антиспам-системы | массовое внедрение авторизации при | ||
на крупных почтовых сервисах, таких как | проведении легальных рассылок. | ||
Яndex.Почта, Mail.RU и т.д). | 15 | Пути развития распределенных систем. | |
8 | Системы с ловушками почты. Сбор спама | Распределенные системы анализа спама | |
в заранее созданные и «засвеченные» | накапливают огромный объем данных, которые | ||
(известные спамерам) почтовые ящики. | могут быть использованы для: | ||
Обработка – составление сигнатур, образцов | Автоматического построения черных списков | ||
спама и т.п. Передача результатов | IP-адресов Анализ активности отдельных | ||
обработки пользователям для использования | машин, рассылающих спам. Построение | ||
при анализе почты. Два лидера: BrightMail | spam-patterns Анализ вариаций текста | ||
и MessageLabs; сети с похожими | внутри одной рассылки Оборотная сторона – | ||
характеристиками (около 1 млн. адресов для | потенциальная возможность использования | ||
сбора, похожие методы обработки | накапливаемых данных во вред. Чтобы этого | ||
сообщений). | избежать, данные о персональной | ||
9 | Голосование пользователей. Почтовая | не-массовой почте накапливаться не должны. | |
система рассчитывает сигнатуру принятого | 16 | Спасибо за внимание. Пожалуйста | |
письма, передает ее на сервер системы, | задавайте вопросы. | ||
получает ответ – спам это или нет. | |||
Распределенные системы обнаружения спама.ppt |
«Спам» - Раскрутка сайта. Засылка троянов. Платные звонки. Спам. Спам – добро или зло?! Выяснить , что такое спам. Сбор информации. Проблемный вопрос: Причиняемый вред. Цель. Реклама денежных пирамид. Происхождение термина. Как защититься от спама? Источники информации. Так же существует: - Фильтрация автоматическая и неавтоматическая - Чёрные списки.
«Ящик электронной почты» - Сервис Интернета. Спам. Почтовые клиенты. ПО для работы с электронной почтой. Природа сообщений электронной почты. Протоколы электронной почты. Функционирование электронной почты. Электронная почта. Адрес электронной почты. Преимущества электронной почты.
«Электронная почта» - Работа с почтой. Почтовые рассылки. Электронная почта. Для управления почтовыми рассылками используются менеджеры почтовых рассылок. Электронная почта. Спам. Названия. Заполнение анкеты. Примеры программ управления рассылками: mailman, sympa, majordomo. Непропорциональный рост количества и размера рекламных рассылок.
«Что такое электронная почта» - Электронное письмо. Структура письма. Дата. Маршутизация почты. Копия. Отправитель. Письмо. Электронная почта. Вопрос появления электронной почты. Как работает электронная почта. X-mailer. История электронной почты. Адрес электронной почты.
«Электронная почта» - Основные понятия. Прикрепленные файлы. Пересылка почтовых открыток. Адрес электронной почты. Практическая работа. Почта. Электронная почта. Компьютерная сеть. Функционирование электронной почты. Скорость пересылки. Коммуникационные технологии. Работа с электронной почтой. Почтовые программы.
«Электронная почта история» - П р е д л о ж е н и е с в о б о д н ы х. Как создать свой электронный ящик на yandex.ru. Первая почтовая рассылка не была автоматизирована, и все делалось вручную. Шаг №1. Дуг Энгельбарт. Ц и ф р. Исторические факты. Л о г и н о в. Шаг №8. В в о д л и ч н ы х д а н н ы х. В в о д л о г и н а. 1975 год.