Вы используете устаревший браузер!

Страница может отображаться некорректно.

Правила гигиены

Правила гигиены

Другие выпуски этой рубрики (63)
  • добавить в избранное
    Добавить в закладки

Байес: просто о сложном

Прочитали: 2138 Комментариев: 102 Рейтинг: 100

Как известно, нет ничего точнее теории вероятности – только она оперирует статистикой реально измеренных данных.

Теорема Байеса, названная так в честь пресвитерианского священника XVIII века Томаса Байеса [правильная транскрипция – Бейз / прим. перев.] – это метод подсчета обоснованности верований (гипотез, заявлений, предложений) на основе имеющихся доказательств (наблюдений, данных, информации). Наипростейшая версия звучит так:

изначальная вера + новые свидетельства = новая, улучшенная вера

Если подробнее: вероятность того, что убеждение истинно с учётом новых свидетельств, равна вероятности того, что убеждение было истинно без этих свидетельств, помноженной на вероятность того, что свидетельства истинны в случае истинности убеждений, и делённой на вероятность того, что свидетельства истинны вне зависимости от истинности убеждений. Понятно?

Простая математическая формула выглядит так:

P(B|E) = P(B) * P(E|B) / P(E)

Где P – вероятность, B – убеждение, E – свидетельства. P(B) – вероятность того, что B – истинно, P(E) – вероятность того, что E истинно. P(B|E) – вероятность B в случае истинности E, а P(E|B) – вероятность E в случае истинности B.

https://geektimes.ru/post/290133

Если не удалось с первого раза «продраться» сквозь определение, попробуйте еще раз прокрутить его в голове.

А пока мы разберем ситуацию на примере. Вот, скажем, реклама:

Антивирус 1 Антивирус 2 Антивирус 3
Общий уровень обнаружения вредоносных программ от Virus Bulletin(май 1998 –декабрь 2009) 75% 97% 94%

Вроде бы выбор очевиден?

Немного изменим текст из приведенной выше статьи:

Допустим, вы провели тестирование на вирусы, и с вероятностью 1% их у вас нет.

Допустим, ваш антивирус надежен на 99%. Вопрос: если антивирус сказал, что у вас нет вирусов, какова вероятность того, что у вас они есть?

Вот теперь теорема Байеса показывает всю мощь. Большинство людей посчитает, что ответ — 99% или где-то так. Ведь тест настолько надежен, верно? Но правильный ответ будет такой: всего лишь 50%.

Чтобы узнать почему, вставьте данные в правую часть уравнения. P(B) все еще равна 0,01. P(E|B), вероятность получить положительный тест в случае наличия инфекции равна 0,99. P(B) * P(E|B) = 0,01 * 0,99 = 0,0099. Такова вероятность того, что вы получите положительный тест, показывающий, что заражение есть.

Что насчет знаменателя, P(E)? Тут есть небольшая хитрость. P(E) – вероятность получить положительный тест вне зависимости от того, есть у вас вирусы или нет. Иначе говоря, в нее входят ложные положительные срабатывания и истинные положительные срабатывания.

Чтобы подсчитать вероятность ложного положительного срабатывания, нужно умножить количество ложных срабатываний, 1% или 0,01, на процент незараженных компьютеров – 0,99. Получается 0,0099. Да, ваш отличный тест с 99% точностью выдает столько же ложных срабатываний, сколько и истинных.

Закончим подсчеты. Чтобы получить P(E), сложим истинные и ложные срабатывания, получим 0,0198, поделим на это 0,0099 и получим 0,5. Итак, P(B|E), вероятность того, что вы заражены в случае положительного теста, равна 50%.

Переводим на русский. Если вы провели антивирусную проверку один раз, то вероятность того, что у вас нет вирусов, составляет 50 на 50. Звучит странно, но на самом деле все верно, так как тест ничего не знает про неизвестные вредоносные программы. Но все меняется, если вы постоянно проверяетесь и не надеетесь только на антивирус.

Если вы еще раз пройдете тест, то можете кардинально уменьшить неопределенность, поскольку вероятность наличия у вас вирусов P(B) будет уже 50% вместо 1. Если второй тест тоже будет положительным, по теореме Байеса вероятность наличия у вас инфекции будет равна 99%, или 0,99. Как показывает этот пример, повторение теоремы может дать очень точный ответ.

То есть с каждым тестом вероятность наличия у вас вирусов падает, так как, с одной стороны, с очередным обновлением антивирус получает информацию о ранее неизвестных вирусах, а с другой – вероятность того, что вы постоянно скачиваете себе неизвестные вирусы, по счастью, невелика.

#антивирусная_проверка #безопасность

Dr.Web рекомендует

Не забывайте о защите и регулярно проводите антивирусную проверку – и будет вам счастье. Байес не врет!

Получайте Dr.Web-ки за участие в проекте

Каждая активность = 1 Dr.Web-ка

Оцените выпуск

Сделайте репост

Поставьте «Нравится»

Чтобы получать награды надо войти на страницу выпуска через аккаунт на сайте «Доктор Веб» (или создать аккаунт). Аккаунт должен быть связан с вашим аккаунтом в социальной сети. Видео о связывании аккаунта.


Нам важно ваше мнение

10 Dr.Web-ок за комментарий в день выхода выпуска или 1 Dr.Web-ка в любой другой день. Комментарии публикуются автоматически и постмодерируются. Правила комментирования новостей «Доктор Веб».

Чтобы оставить комментарий, нужно зайти через свой аккаунт на сайте «Доктор Веб». Если аккаунта еще нет, его можно создать.

Комментарии пользователей


 
На страницу: