tags:
- "#y2025"
- матстат
- конспекты
- учеба
- кфу
- хуйня
created: 2025-03-17
master: "[[Матстат Hub (лекции)]]"
aliases:
- хуекции
icon: 💩
💩
Лекции:
Курс читается по книгам Г. Крамер и Тутубалин "Методы математической статистики"
Мы наблюдаем за случайной величиной
с функцией распределения . Мы проводим эксперимент раз и получаем значения . — некоторый параметр распределения (напр, в распределении Пуассона это )
Так называют элементы выборки
Мы предполагаем, что в нашем эксперименте величины
Пусть у нас есть некоторое распределение по выборке:
Тогда мы можем ввести эмпирическую функцию распределения
При этом, само собой разумеется,
Тогда мы можем записать математическое ожидание
Пусть
Так называют оценку параметра
Это 2 графика (нормального) распределения с параметрами
и . Их математические ожидания совпадают и равны . Но дисперсия больше (в 4 раза), из-за чего лучше использовать именно
Это такая несмещенная оценка
Это такая оценка, при которой
Таким образом, при больших
Пусть
Но поскольку мы ищем не сам
Из монотонности
Посему
Ну так, по-дружески
Это, если что
Итак, переходим к следующему примеру!..
Тогда функция правдоподобия будет иметь следующий вид:
Находим логарифм:
И, условия для максимума функции:
"Это придумал не я"
В этом случае исходная формула остается той же самой за исключением того, что произведение заменяется на интеграл:
Отсюда функция максимального правдоподобия:
И мы имеем:
И условия, сначала для
Для
И для
"Это придумал Пирсон"
Пусть
Рассмотрим пару примеров в случае с нормальным распределением:
Построим доверительный интервал для
В нашем случае
Тогда наш доверительный интервал будет иметь вид
Мы знаем, что
Тогда в случае
Исходя из определения вероятности
https://dzen.ru/video/watch/60842bb67b54072a763e7fc7?share_to=link
Ранее мы рассмотрели точечные оценки и два метода их получения: метод максимального правдоподобия и метод моментов.
Точечная оценка сообщает некоторое значение неизвестного параметра, но не даёт информации о её точности. Ответ на этот вопрос дают интервальные оценки, или доверительные интервалы.
Интервальная оценка — это оценка, определяемая двумя числами, концами интервала.
Такие оценки позволяют установить точность и надёжность оценивания.
Пусть
или
Параметр
Так как
Значения
0.95, 0.99, 0.999.
Тогда:
называют интервал
Пусть
Потребуем:
Пусть
Находим
Доверительный интервал:
Теперь
Тогда:
Обозначим:
Величина
имеет распределение Стьюдента с
Тогда:
Где:
Отсюда по таблице находим
И подставляем в интервал:
Доверительный интервал:
покрывает
На практике часто возникает задача проверки предположений о типе распределения или параметрах случайной величины
Статистическая гипотеза
Возможны два типа ошибок:
Пусть
Проверка гипотезы осуществляется по статистике
Критерий определяется критической областью — областью значений
Пусть
Если
Если распределение
Тогда:
Значит:
Вывод: Вид критической области выбирается в зависимости от формулировки гипотез. Тип сравнения и направление неравенства задаются в задаче.
Пусть
Определим статистику критерия:
Критическая область:
Пусть
Так как
Тогда:
Находим
По выборке вычисляем
Теперь критическая область левосторонняя:
Решение аналогично.
Находим
Если
Критическая область: двусторонняя
Условие:
Из симметрии нормального распределения:
Находим
Если
Тогда используем распределение Стьюдента
Тогда:
или
По таблице
Критическая область:
Точно так же:
Двусторонняя область:
Находим
Пусть
Тогда:
Уровень значимости |
Интерпретация |
---|---|
Хорошее согласие с гипотезой | |
Нет оснований отвергать гипотезу | |
Слабо значимое расхождение | |
Значимое расхождение | |
Высоко значимое расхождение |
Использование
Требуется проверить гипотезу
Для проверки такой гипотезы используется критерий согласия χ². Ниже — пошаговая процедура.
Выдвигается гипотеза
Разбиение области значений
Интервал значений случайной величины разбивается на
Подсчёт частот
По выборке
Расчёт теоретических вероятностей попадания
Для каждого интервала
Предполагается, что параметры распределения
Вычисление статистики критерия χ²:
Это измеряет расхождение между наблюдаемыми частотами
Используется критическое значение
где
Таким образом, чем больше расхождение между
Пусть
Даны две независимые выборки:
Нулевая гипотеза:
Используется статистика:
При
Тогда:
Уровень значимости:
Если
Иначе
Предполагается, что
Но выборочные средние
Где
Дальнейшее решение полностью аналогично случаю с известными дисперсиями.
Пусть выборки
Нулевая гипотеза:
Альтернативная:
или в более красивом виде:
При
Пусть
Критический уровень значимости:
Где
Если
Иначе
Различие между
Прежде всего определим понятие двумерного нормального распределения (на плоскости).
Это распределение вероятностей двумерной случайной величины
где
Если
Подставляя
Это выражение можно представить как произведение двух одномерных нормальных распределений:
Следовательно, для двумерной нормальной случайной величины:
Пусть имеется выборка
Выдвигаем гипотезу:
На основе выборки вычисляем выборочный коэффициент корреляции:
где:
Альтернативная формула:
Пусть
Проверим значимость при уровне
Строим статистику:
При
Критическая область: двусторонняя
(так как
Из симметрии:
Также можно использовать уровень значимости:
Если выборочная корреляция
Если нет — зависимость статистически не подтверждается.
Для нормального распределения
Асимметрия:
Эксцесс:
Если
По выборке
При
Проверка на "островершинность" или "плосковершинность".
Формула:
При
Отклонения