Одним из методов решения статистических задач является расчет доверительного интервала. Он используется как предпочтительная альтернатива точечной оценке в небольших выборках. Следует отметить, что сам процесс расчета доверительного интервала довольно сложен. Но инструменты программы Excel позволяют несколько ее упростить. Давайте узнаем, как это делается на практике.
Процедура вычисления
Этот метод используется для оценки диапазона различных статистических величин. Основная задача этого расчета — исключить неопределенности точечной оценки.
В Excel есть два основных варианта выполнения вычислений с использованием этого метода: когда известна дисперсия и когда она неизвестна. В первом случае для расчетов используется функция КОНФИДЕНТ.НОРМ, а во втором — функция КОНФИДЕНТ.СТУДЕНТ.
Способ 1: функция ДОВЕРИТ.НОРМ
Оператор CONFIDENT.NORM, который принадлежит к совокупной группе функций, был впервые представлен в Excel 2010. В более ранних версиях программы используется эквивалент CONFIDENCE. Цель этого оператора — вычислить нормально распределенный доверительный интервал для средней совокупности.
Его синтаксис следующий:
= ДОВЕРИЕ.НОРМ (альфа; стандартное_устройство; размер)
Альфа — это аргумент, который указывает уровень значимости, используемый для расчета уровня достоверности. Уровень достоверности равен следующему выражению:
(1- «Альфа») * 100
«Стандартное отклонение» — это аргумент, подсказанный названием. Это стандартное отклонение предложенной выборки.
«Размер» — это аргумент, определяющий размер выборки.
Все аргументы для этого оператора обязательны.
Функция УВЕРЕННОСТЬ имеет те же аргументы и возможности, что и предыдущая. Его синтаксис следующий:
= ДОВЕРИЕ (альфа; стандартное_откл; размер)
Как видите, отличия только в названии оператора. По соображениям совместимости эта функция сохраняется в Excel 2010 и более поздних версиях в специальной категории «Совместимость». В версиях Excel 2007 и ранее он присутствует в основной группе статистических операторов.
Предел доверительного интервала определяется по формуле следующего вида:
X + (-) ОБЫЧНАЯ УВЕРЕННОСТЬ
Где X — это среднее значение выборки, которое находится в центре выбранного диапазона.
Теперь давайте посмотрим, как рассчитать доверительный интервал на конкретном примере. Было проведено 12 тестов, в результате которых были получены различные результаты, приведенные в таблице. Это наша совокупность. Стандартное отклонение равно 8. Нам нужно рассчитать доверительный интервал с уровнем достоверности 97%.
- Выберите ячейку, в которой будет отображаться результат обработки данных. Нажмите кнопку «Вставить функцию».
- Появится мастер. Перейдите в категорию «Статистика» и выберите название «КОНФИДЕНТ.НОРМ». Затем нажмите кнопку «ОК».
- Откроется окно темы. Его поля естественно соответствуют именам аргументов.
Установите курсор в первое поле — «Альфа». Здесь следует указать уровень значимости. Как мы помним, уровень нашей уверенности составляет 97%. При этом мы сказали, что он рассчитывается так:(1- «Альфа») * 100
Это означает, что для расчета уровня значимости, т. Е. Для определения значения «Альфа», должна применяться формула следующего типа:
(1 уровень доверия) / 100
То есть, подставляя значение, получаем:
(1-97) / 100
Путем несложных вычислений мы обнаруживаем, что аргумент «Альфа» равен 0,03. Введите это значение в поле.
Как известно, по условию стандартное отклонение равно 8. Поэтому в поле «Стандартное отклонение» просто напишите это число.
В поле «Размер» необходимо ввести количество элементов выполненных тестов. Как мы помним, их 12. Но чтобы автоматизировать формулу и не менять ее каждый раз при выполнении нового теста, мы задаем это значение не обычным числом, а с помощью оператора COUNT. Затем установите ползунок в поле «Размер», затем щелкните треугольник, который находится слева от строки формул.
Отображается список недавно использованных функций. Если вы недавно использовали оператор COUNT, он должен быть в этом списке. В этом случае просто нажмите на его название. В противном случае, если вы не можете его найти, перейдите в «Другие функции…».
- Появляется уже знакомый нам мастер функции. Вернитесь в группу «Статистика». Выделяем там название «АККАУНТ». Нажимаем на кнопку «ОК».
- Отображается окно аргументов для предыдущего оператора. Эта функция предназначена для вычисления количества ячеек в указанном диапазоне, содержащих числовые значения. Его синтаксис следующий:
= СЧЁТ (значение1; значение2;…)
Группа аргументов «Значения» — это ссылка на диапазон, в котором вы хотите вычислить количество ячеек, заполненных числовыми данными. Всего может быть до 255 аргументов этого типа, но в нашем случае нам нужен только один.
Поместите курсор в поле «Value1» и, удерживая левую кнопку мыши, выберите диапазон, содержащий нашу коллекцию на листе. Тогда ваш адрес отобразится в поле. Нажимаем на кнопку «ОК».
- Далее приложение выполнит расчет и отобразит результат в ячейке, в которой оно находится. В нашем конкретном случае формула получилась так:
= КОНФИДЕНТ.НОРМ (0,03,8; СЧЁТ (B2: B13))
Общий результат расчета составил 5,011609.
- Но это еще не все. Как мы помним, предел доверительного интервала вычисляется путем сложения и вычитания выборочного среднего результата вычисления CONFIDENCE.NORM. Это вычисляет правую и левую границы доверительного интервала соответственно. Само выборочное среднее можно рассчитать с помощью оператора AVERAGE.
Этот оператор предназначен для вычисления среднего арифметического выбранного диапазона чисел. Он имеет следующий довольно простой синтаксис:
= СРЕДНИЙ (число1; число2;…)
Аргумент Number может быть одним числовым значением или ссылкой на ячейки или даже целые диапазоны, которые их содержат.
Затем выберите ячейку, в которой будет отображаться расчет среднего значения, и нажмите кнопку «Вставить функцию».
- Мастер откроется. Снова перейдите в категорию «Статистика» и выберите из списка название «СРЕДНИЙ». Как всегда, нажмите кнопку «ОК».
- Откроется окно темы. Установите курсор в поле «Число 1» и, удерживая левую кнопку мыши, выделите весь диапазон значений. После того, как координаты отобразятся в поле, нажмите кнопку «ОК».
- Затем СРЕДНИЙ отображает результат расчета в элементе листа.
- Вычисляем правый край доверительного интервала. Для этого выделите отдельную ячейку, введите знак «=» и добавьте содержимое элементов листа, где находятся результаты расчетов функций СРЕДНИЙ и КОНФИДЕНТ.НОРМ. Чтобы выполнить расчет, нажмите клавишу Enter. В нашем случае мы получили следующую формулу:
= F2 + LA16
Результат расчета: 6.953276
- Точно так же мы вычисляем левый край доверительного интервала, только на этот раз мы вычитаем результат вычисления оператора CONFIDENCE.NORM из результата вычисления AVERAGE. Результатом является формула для нашего примера следующего типа:
= F2-LA16
Результат расчета: -3.06994
- Мы постарались подробно описать все этапы расчета доверительного интервала, поэтому подробно описали каждую формулу. Но вы можете объединить все действия в одну формулу. Расчет правой границы доверительного интервала можно записать следующим образом:
= СРЕДНИЙ (B2: B13) + РЕЗЕРВНЫЙ (0,03,8; СЧЁТ (B2: B13))
- Аналогичный расчет левого края будет выглядеть так:
= СРЕДНИЙ (B2: B13) — СТАНДАРТНОЕ ДОВЕРИЕ (0,03,8; СЧЁТ (B2: B13))
Способ 2: функция ДОВЕРИТ.СТЮДЕНТ
Кроме того, в Excel есть еще одна функция, связанная с вычислением доверительного интервала: ДОВЕРИЙ УЧАЩИХСЯ. Он появился только в Excel 2010. Этот оператор вычисляет доверительный интервал генеральной совокупности с использованием t-распределения Стьюдента. Это очень удобно, когда дисперсия и, следовательно, стандартное отклонение неизвестны. Синтаксис оператора следующий:
= ДОВЕРИЕ.СТУДЕНТ (альфа; стандартное_устройство; размер)
Как видите, в этом случае названия операторов остались без изменений.
Давайте посмотрим, как рассчитать границы доверительного интервала с неизвестным стандартным отклонением, используя тот же пример популяции, который мы рассматривали в предыдущем методе. Уровень доверия, как и в прошлый раз, 97%.
- Выберите ячейку, в которой будет производиться расчет. Нажмите кнопку «Вставить функцию».
- В открывшемся мастере перейдите в категорию «Статистика». Выбираем название «КОНФИДЕНТ.СТУДЕНТ». Нажимаем на кнопку «ОК».
- Откроется окно аргументов для указанного оператора.
В поле «Альфа», поскольку уровень достоверности 97%, обратите внимание на число 0,03. Второй раз останавливаться на принципах расчета этого параметра не будем.
Затем поместите курсор в поле «Стандартное отклонение». На этот раз этот показатель нам неизвестен, и нам нужно его рассчитать. Это делается с помощью специальной функции — СТАНДОТКЛОН. B. Чтобы открыть это окно оператора, щелкните треугольник слева от строки формул. Если мы не находим нужное имя в открывшемся списке, переходим в «Другие функции…».
- Мастер запускается. Перейдите в категорию «Статистика» и отметьте в ней имя «STDEV.V». Затем нажимаем кнопку «ОК».
- Откроется окно темы. Задача оператора STDEV.B — определить стандартное отклонение выборки. Его синтаксис выглядит так:
= СТАНДОТКЛОН.V (число1; число2;…)
Как вы понимаете, аргумент Number — это адрес элемента выбора. Если выделение помещено в один массив, то, используя только один аргумент, вы можете предоставить ссылку на этот диапазон.
Поместите курсор в поле «Число 1» и, как всегда, зажмите левую кнопку мыши и выберите популяцию. После того, как координаты были введены в поле, не спешите нажимать кнопку «ОК», так как результат будет некорректным. Во-первых, нам нужно вернуться в окно аргументов оператора CONFIDENCE.STUDENT, чтобы вставить последний аргумент. Для этого щелкните соответствующее имя в строке формул.
- Снова открывается окно аргументов для знакомой функции. Установите курсор в поле «Размер». Еще раз нажмите на уже знакомый нам треугольник, чтобы перейти к выбору операторов. Как вы понимаете, нам нужно название «COUNT». Поскольку мы использовали эту функцию в расчетах в предыдущем методе, она присутствует в этом списке, поэтому просто щелкните по ней. Если вы его не нашли, действуйте по алгоритму, описанному в первом способе.
- Оказавшись в окне СЧЁТ аргументов, поместите курсор в поле «Число 1» и, удерживая кнопку мыши, выберите агрегат. Затем нажимаем кнопку «ОК».
- Далее программа рассчитывает и отображает значение доверительного интервала.
- Чтобы определить границы, нам все равно нужно будет вычислить выборочное среднее. Но, поскольку алгоритм расчета по формуле СРЕДНИЙ такой же, как и в предыдущем методе, и результат также не изменился, мы не будем подробно останавливаться на этом второй раз.
- Суммируя результаты вычислений СРЕДНЕГО и УВЕРЕННОГО СТУДЕНТА, мы получаем правый край доверительного интервала.
- Вычитая результат вычисления CONFIDENCE STUDENT из результатов вычисления оператора AVERAGE, мы получаем левый край доверительного интервала.
- Если расчет записать по формуле, расчет правого края в нашем случае будет выглядеть так:
= СРЕДНЕЕ (B2: B13) + ДОВЕРИЕ УЧАЩИХСЯ (0,03; СТАНДАРТ B (B2: B13), СЧЁТ (B2: B13))
- Следовательно, формула расчета левого края будет выглядеть так:
= СРЕДНИЙ (B2: B13) — ДОВЕРИЙ УЧАЩИЙСЯ (0,03; СТАНДАРТ B (B2: B13), СЧЁТ (B2: B13))
Как видите, инструменты Excel значительно упрощают расчет доверительного интервала и его пределов. Для этого используются отдельные операторы для выборок, для которых дисперсия известна и неизвестна.