Пояснение к предложенному примеру:
Эти данные - это ежемесячные данные по неактивным абонентам у интернет-провайдера. По тем, кто не использовал интернет за указанный период. Всегда есть люди, которые временно не пользуются интернетом. Всегда есть люди, которые переходят к другому провайдеру. Это объективный процесс.
Гипотеза в том, что при НЕАКТИВНОСТИ конкурентов - данные будут несущественности отличаться. Статистических данных по месяцам нет, их просто никто не делал. То есть начинаем с нуля собирать статистику по этой гипотезе.
Смысл расчета в том, что уловить момент, когда ситуация выходит из под контроля, то есть конкурент начинает предпринимать активные действия и пере подключать абонентов. По гипотезе цифра неактивных абонентов должна вырасти.
Как я понимаю, сначала нужно вычислить значение, с которым все остальные будет сравниваться
ИМХО, среднее значение не является корректным значением. Допустим, что пять цифр - это все цифры от 1 до 10. Шестая цифра - 100. Среднее значение будет около 17, то есть отклонение будет достаточно большим для всех значений.
МОДА - тоже вряд ли подойдет. Как я понимаю, эта функция подходит для повторяющихся значений. А если их нет? ...
МЕДИАНА - это уже тепло. Я правильно понимаю, что МЕДИАНА учитывает распределение результатов и близость их друг к другу?
Допустим, используем ее.
Теперь надо заложить критерии допустимости
Заложить на глазок критерии допустимости было бы не совсем правильно.
Предлагалась цифра 30%, 40%. Почему 30%? Я понимаю, что это уже статистика, а не Эксель.
Если на форуме есть специалисты в области статистики, подскажите, пожалуйста, какой процент отклонения может считаться допустимым при этой задаче?