КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Основные понятия математической статистики 2 страница
Проверяемая гипотеза называется нулевой и обозначается По выборке При любом результате проверки гипотезы есть вероятность допустить ошибку. Если отклоняется верная гипотеза, то совершается ошибка первого рода. Если принимается ложная гипотеза, то совершается ошибка второго рода. Вероятность α совершить ошибку первого рода называется уровнем значимости гипотезы. Этот уровень (вероятность отклонить верную гипотезу) выбирают как можно меньше (0,01; 0,05…) в том случае, если ошибка первого рода влечёт большие потери, а ошибка второго рода – малые. Единственный способ одновременного уменьшения вероятностей этих ошибок – это увеличение объёма выборки. Пусть гипотеза состоит в том, что генеральная совокупность подчиняется некоторому закону распределения. По выборке нужно подтвердить или опровергнуть эту гипотезу. Критерий для проверки такой гипотезы называется критерием согласия. При решении социологических задач модель закона распределения в общем случае неизвестна, поэтому возникает необходимость выбора закона распределения, согласующегося с результатами выборочных наблюдений. В предлагаемом задании следует рассмотреть критерий Пирсона, схема проверки которого состоит в следующем: 1. По выборочным данным проводят оценку параметров выбранной модели закона распределения. Предполагают, что закон распределения имеет r параметров. 2. Подставляя выборочные оценки значений параметров распределения, находят теоретические значения вероятностей:
3. Рассчитывают теоретические частоты:
4. Рассчитывают значение критерия согласия Пирсона:
Эта величина при n 5. Задаваясь достаточно малой вероятностью (уровнем значимости
Элементы теории корреляции Многие социологические задачи требуют установить и оценить зависимость двух и более случайных величин. Эта зависимость может быть функциональной, статистической или совсем отсутствовать. Отсутствие зависимости (связи) характерно для независимых случайных величин. Если каждому значению случайной величины X соответствует определённое значение случайной величины Y, то говорят, что X и Y имеют между собой функциональную зависимость. Эта зависимость реализуется редко, так как обе величины подвержены действию случайных факторов. Если каждому значению случайной величины X соответствует вполне определённый закон распределения случайной величины Y, то говорят, что X и Y имеют статистическую зависимость. Частным случаем такой зависимости является корреляционная зависимость, когда при изменении одной из величин изменяется среднее значение другой. Для исследования влияния одной величины на изменение другой рассматривают условные законы распределения первой величины при фиксированных значениях второй. Пусть Х получила одно из своих значений Корреляционной зависимостью Y от X называют функциональную зависимость условной средней
Аналогично определяется условная средняя Выражение (31) называют уравнением регрессии Х на Y, а функцию
Задача теории корреляции состоит в определении формы корреляционной зависимости и оценки тесноты этой зависимости. Функция регрессии может быть линейной, квадратичной, показательной и т. д. Если функции (30), (31) линейные, то корреляционная зависимость называется линейной, в противном случае – нелинейной. Степень зависимости Y от X оценивается по величине рассеяния значений Y вокруг условного среднего Для того, чтобы иметь конкретное представление о двумерном распределении и его характеристиках, результаты n наблюдений, в каждом из которых регистрируются совместные значения X и Y, вносят в корреляционную таблицу (таблица 7). Если одна и та же пара чисел (x,y) наблюдается несколько раз, то эти данные группируют, т.е. подсчитывают частоты В первой строке таблицы указывают наблюдаемые значения признака Х, а в первом столбце – наблюдаемые значения признака Y. На пересечении строк и столбцов вписывают частоты Выборочное уравнение линейной регрессии Y на X имеет вид:
Так как по выборочным данным можно получить только оценки параметров, то оценку коэффициента k обозначим через
Используя метод наименьших квадратов, основанный на минимизации суммы квадратов отклонений теоретических значений функции от наблюдаемых значений
где
Однако чаще уравнение регрессии записывают в другом виде с использованием выборочного коэффициента корреляции. Для этого находят
где Затем получают выборочное уравнение линейной регрессии Y на X в виде:
или выборочное уравнение линейной регрессии X на Y в виде:
Коэффициент корреляции служит для оценки тесноты линейной корреляционной зависимости. Отметим свойства коэффициента 1. 2. Если X и Y независимы, то 3. При | Для получения выводов о практической значимости математической модели, показаниям тесноты связи даётся качественная оценка. Это осуществляется на основе шкалы Чеддока: если 0,1< В случае нелинейной корреляции Может оказаться, что для некоторой таблицы распределения
где Корреляционное отношение имеет следующие свойства: 1. 2. Если 3. Если 4. Если 5. Во всех других случаях Для оценки адекватности уравнения регрессии может использоваться показатель средней ошибки аппроксимации:
где При При численности объектов анализа n<30 возникает необходимость определения точности и значимости параметров Для оценки значимости
Вычисленное значение t сравнивается с критическим, которое берётся из таблицы значений t-Стьюдента с учётом заданного уровня значимости и числа степеней свободы k. Если t> Для оценки значимости параметров
Затем вычисляют среднее квадратическое отклонение факторного признака
При этом фактические значения t-критерия: для параметра
для параметра
Полученные по формулам фактические значения
Далее находят доверительные интервалы для коэффициентов
где При вычислении прогнозного значения необходимо получить оценку его точности. При заданных значениях надёжности
В заключении необходимо отметить, что на основе проделанного корреляционного анализа делаются выводы о пригодности математической модели и её практическом использовании.
Дата добавления: 2015-04-24; Просмотров: 531; Нарушение авторских прав?; Мы поможем в написании вашей работы! |