Байес: просто о сложном
15 февраля 2018
Как известно, нет ничего точнее теории вероятности – только она оперирует статистикой реально измеренных данных.
Теорема Байеса, названная так в честь пресвитерианского священника XVIII века Томаса Байеса [правильная транскрипция – Бейз / прим. перев.] – это метод подсчета обоснованности верований (гипотез, заявлений, предложений) на основе имеющихся доказательств (наблюдений, данных, информации). Наипростейшая версия звучит так:
изначальная вера + новые свидетельства = новая, улучшенная вера
Если подробнее: вероятность того, что убеждение истинно с учётом новых свидетельств, равна вероятности того, что убеждение было истинно без этих свидетельств, помноженной на вероятность того, что свидетельства истинны в случае истинности убеждений, и делённой на вероятность того, что свидетельства истинны вне зависимости от истинности убеждений. Понятно?
Простая математическая формула выглядит так:
P(B|E) = P(B) * P(E|B) / P(E)
Где P – вероятность, B – убеждение, E – свидетельства. P(B) – вероятность того, что B – истинно, P(E) – вероятность того, что E истинно. P(B|E) – вероятность B в случае истинности E, а P(E|B) – вероятность E в случае истинности B.
Если не удалось с первого раза «продраться» сквозь определение, попробуйте еще раз прокрутить его в голове.
А пока мы разберем ситуацию на примере. Вот, скажем, реклама:
Антивирус 1 | Антивирус 2 | Антивирус 3 | |
Общий уровень обнаружения вредоносных программ от Virus Bulletin(май 1998 –декабрь 2009) | 75% | 97% | 94% |
Вроде бы выбор очевиден?
Немного изменим текст из приведенной выше статьи:
Допустим, вы провели тестирование на вирусы, и с вероятностью 1% их у вас нет.
Допустим, ваш антивирус надежен на 99%. Вопрос: если антивирус сказал, что у вас нет вирусов, какова вероятность того, что у вас они есть?
Вот теперь теорема Байеса показывает всю мощь. Большинство людей посчитает, что ответ — 99% или где-то так. Ведь тест настолько надежен, верно? Но правильный ответ будет такой: всего лишь 50%.
Чтобы узнать почему, вставьте данные в правую часть уравнения. P(B) все еще равна 0,01. P(E|B), вероятность получить положительный тест в случае наличия инфекции равна 0,99. P(B) * P(E|B) = 0,01 * 0,99 = 0,0099. Такова вероятность того, что вы получите положительный тест, показывающий, что заражение есть.
Что насчет знаменателя, P(E)? Тут есть небольшая хитрость. P(E) – вероятность получить положительный тест вне зависимости от того, есть у вас вирусы или нет. Иначе говоря, в нее входят ложные положительные срабатывания и истинные положительные срабатывания.
Чтобы подсчитать вероятность ложного положительного срабатывания, нужно умножить количество ложных срабатываний, 1% или 0,01, на процент незараженных компьютеров – 0,99. Получается 0,0099. Да, ваш отличный тест с 99% точностью выдает столько же ложных срабатываний, сколько и истинных.
Закончим подсчеты. Чтобы получить P(E), сложим истинные и ложные срабатывания, получим 0,0198, поделим на это 0,0099 и получим 0,5. Итак, P(B|E), вероятность того, что вы заражены в случае положительного теста, равна 50%.
Переводим на русский. Если вы провели антивирусную проверку один раз, то вероятность того, что у вас нет вирусов, составляет 50 на 50. Звучит странно, но на самом деле все верно, так как тест ничего не знает про неизвестные вредоносные программы. Но все меняется, если вы постоянно проверяетесь и не надеетесь только на антивирус.
Если вы еще раз пройдете тест, то можете кардинально уменьшить неопределенность, поскольку вероятность наличия у вас вирусов P(B) будет уже 50% вместо 1. Если второй тест тоже будет положительным, по теореме Байеса вероятность наличия у вас инфекции будет равна 99%, или 0,99. Как показывает этот пример, повторение теоремы может дать очень точный ответ.
То есть с каждым тестом вероятность наличия у вас вирусов падает, так как, с одной стороны, с очередным обновлением антивирус получает информацию о ранее неизвестных вирусах, а с другой – вероятность того, что вы постоянно скачиваете себе неизвестные вирусы, по счастью, невелика.
#антивирусная_проверка #безопасностьАнтивирусная правДА! рекомендует
Не забывайте о защите и регулярно проводите антивирусную проверку – и будет вам счастье. Байес не врет!
Нам важно ваше мнение
Чтобы оставить комментарий, нужно зайти через свой аккаунт на сайте «Доктор Веб». Если аккаунта еще нет, его можно создать.
Комментарии пользователей
Денисенко Павел Андреевич
23:30:16 2018-08-03
Неуёмный Обыватель
03:42:17 2018-06-14
vasvet
13:03:50 2018-04-15
anatol
12:21:04 2018-04-02
AntonIT
15:23:29 2018-03-14
Почему у заголовка каждой статьи нет фото автора?,
Littlefish
20:08:56 2018-02-16
Littlefish
20:07:36 2018-02-16
razgen
18:00:22 2018-02-16
Да... Получается в таком случае и ночь нельзя оставлять ПК включенным. Будешь спать и не услышишь что возникла экстраординарная ситуация.
Любитель пляжного футбола
17:47:03 2018-02-16
Пaвeл
16:56:34 2018-02-16
Вячeслaв
13:59:37 2018-02-16
Запуск проверки по расписанию
При установке Dr.Web в стандартном Планировщике заданий Windows автоматически создается задание на проведение антивирусной проверки (оно по умолчанию выключено).
Для просмотра параметров задания откройте Панель управления (расширенный вид) ® Администрирование ® Планировщик заданий.
В списке заданий выберите задание на антивирусную проверку. Вы можете активировать задание, а также настроить время запуска проверки и задать необходимые параметры.
В нижней части окна на вкладке Общие указываются общие сведения о задании, а также параметры безопасности. На вкладках Триггеры и Условия – различные условия, при которых осуществляется запуск задания. Просмотреть историю событий можно на вкладке Журнал.
Вы также можете создавать собственные задания на антивирусную проверку.
AxooxA
03:26:53 2018-02-16
https://support.drweb.ru/show_faq/?question=5482&lng=ru
Ruslan
00:38:27 2018-02-16
Littlefish
23:56:04 2018-02-15
dyadya_Sasha
23:22:09 2018-02-15
НинаК
22:31:37 2018-02-15
В...а
22:23:18 2018-02-15
Геральт
22:16:13 2018-02-15
vla_va
22:07:30 2018-02-15
ek
21:43:12 2018-02-15
Marsn77
21:40:18 2018-02-15
Maat
21:24:01 2018-02-15
Любитель пляжного футбола
21:17:07 2018-02-15
orw_mikle
21:14:38 2018-02-15
kva-kva
21:10:56 2018-02-15
Andromeda
20:25:40 2018-02-15
stavkafon
20:17:42 2018-02-15
Toma
20:17:31 2018-02-15
Сергей
19:50:44 2018-02-15
mk.insta
19:42:31 2018-02-15
robot
19:18:24 2018-02-15
Альфа
19:03:12 2018-02-15
Littlefish
18:36:07 2018-02-15
Damir
18:31:37 2018-02-15
Littlefish
18:27:00 2018-02-15
А антивирусы 2 и 3 имеют относительно большой процент ложных срабатываний и нарушают работу легитимных программ.
Littlefish
18:24:47 2018-02-15
Например Антивирус 1 мог найти все вредоносные программы, а остальные 25% - это не вредоносные программы.
Антивирус 2 и Антивирус 3 могли обнаружить те же 75% вредоносных программ, а остальные 22% и 19% - это ложно положительное определение не вредоносных программ как вредоносное ПО.
Littlefish
18:12:56 2018-02-15
Кирилл
18:08:19 2018-02-15
Littlefish
18:02:26 2018-02-15
Шалтай Александр Болтай
17:57:47 2018-02-15
Кирилл
17:55:32 2018-02-15
Lia00
17:42:35 2018-02-15
Шалтай Александр Болтай
17:35:31 2018-02-15
Шалтай Александр Болтай
17:30:35 2018-02-15
Шалтай Александр Болтай
17:07:20 2018-02-15
La folle
16:56:26 2018-02-15
Masha
15:41:16 2018-02-15
Sasha50
14:38:46 2018-02-15
Антон
14:34:57 2018-02-15
Dvakota
14:31:00 2018-02-15