dememax ([personal profile] dememax) wrote2009-11-11 06:09 pm

Произошли два события с вероятностью порядка 10 в минус 5-ой степни.

Я пользуюсь почтовым ящиком на mtu-net.ru через веб.
Там предлагают воспользоваться «Спамообороной»: http://www.hosting.ru/email/so/
Внизу страницы написано:
"К сожалению, безошибочных алгоритмов антиспама не существует, и некоторые письма могут ошибочно отмечаться как спам (вероятность ложного срабатывания — порядка 10-5), поэтому некоторым пользователям больше подойдет фильтрация на стороне почтового клиента."

Вчера просматривал то, что они посчитали спамом, а там - два письма из Райффайзенбанка.
Нет, ну одно оказалось действительно похоже на спам (рекламная совместная акция с автосалоном), а второе - моя ежемесячная выписка по счёту!
А вот, как это выглядит в заголовке одного из писем:
X-Spam-Flag: YES
X-Spam-Yversion: Spamooborona-3.0

P.S.: Коллега назвал меня флуктуацией.

Ты нерепрезентативен

[identity profile] itman.livejournal.com 2009-11-11 03:50 pm (UTC)(link)
Ну ты везучий. :-) Про вероятность ложного срабатывания, это, скорее всего, температура по больнице в среднем. То есть, они обработали, скажем, миллиард писем, из них получили примерно десять тысяч ложных срабатываний. Но это ничего не говорит о том, что для отдельных категорий писем вероятность срабатывания может быть гораздо больше (в частности, и из-за ошибок в программе). Те, кто получает много разного рода "коммерческих" писем наверняка почти тоже страдает от ложных срабатываний. Им бы по хорошему надо было бы оценить максимальную вероятность срабатывания у отдельных пользователей.
(deleted comment)

Re: Ты нерепрезентативен

[identity profile] itman.livejournal.com 2009-11-11 04:21 pm (UTC)(link)
Flux это, кажется, совсем не то.

Re: Ты нерепрезентативен

[identity profile] itman.livejournal.com 2009-11-11 04:25 pm (UTC)(link)
Я не уверен, что это флуктуация. Средняя температура по больнице - это, ИМХО, более подходящее определение. Скажем, у тебя есть сто классов пользователей. У каждого класса пользователей есть вероятность ложного срабатывания p_i. Так вот, отдельные p_i могут быть очень большими, но усредненные данные - хорошими.

[identity profile] rezdm.livejournal.com 2009-11-11 05:51 pm (UTC)(link)
Что-то они там про вероятность попутали. Там должно быть P=0.5.
Письмо либо попало в спам, либо нет.

Млм даже P=1/3. Ибо {попало в спам|не попало в спам|письмо вообще пропало}