КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Тема: корреляционный анализ
№6 №5 №4 №3 №2 №1 Задачи для самостоятельного решения
В задачах №1-4 по приведенным данным наблюдений найдите уравнение линии регрессии
В зависимости от тиража стоимость изготовления одного листа печатной продукции в разных типографиях составляет:
а) По полученным данным зависимости стоимости изготовления 1 листа печатной продукции S от объёма тиража T постройте корреляционную таблицу б) Найдите условные средние значения в) Считая функциональную зависимость г) Запишите уравнение линейной регрессии и постройте линию регрессии д) Используя полученное уравнение линейной регрессии, сделайте прогноз о средней стоимости одного листа печатной продукции, если тираж составит 6000экз.
Взависимости от дохода на душу населения, возраставшего в течение определенного периода, объем продаж некоторого товара в расчете на 1000жителей в разных городах менялсяследующим образом:
а) По полученным данным зависимости количества продаж Q от дохода на душу населения б) Найдите условные средние значения в) Считая функциональную зависимость г) Запишите уравнение линейной регрессии и постройте линию регрессии д) Используя полученное уравнение линейной регрессии, сделайте прогноз о среднем количестве продаж товара, если доход на душу населения составит 110у.е.. 1o. Корреляционная зависимость двух случайных переменных величин X и Y Корреляционный анализ – один из методов исследования статистической зависимости переменных случайных величин на основе выборочных данных. Пусть Х – рост, Y – масса человека. Несмотря на возможные значительные различия массы человека одного и того же роста можно утверждать, что для данного роста существует некоторая средняя (оптимальная) масса. Отсюда и формулы для эталонов, т.е. рекомендации «веса» для человека определенного роста, начиная с новорожденных. Изменяется рост – изменяется и рекомендуемый средний «вес» (масса) человека. Обратно, задавая массу тела, можно указать соответствующий ей «эталонный» рост. Данный пример иллюстрирует взаимосвязь системы двух случайных переменных величин. Однако между Х и Y может существовать только односторонняя связь: Y – степень обученности юриста-практиканта, измеряемая числом различных видов правонарушений за период его практики, Х – уровень преступности за период практики. Между Х и Y может вообще отсутствовать статистическая зависимость: Х – количество осадков, выпавших за год, Y – число абитуриентов, поступивших в СГУ за этот год. Хотя кажущаяся зависимость в определенные годы и может наблюдаться: и то и другое может расти или уменьшаться одновременно. Если изменение одной случайной величины Х приводит к функциональному изменению среднего значения другой случайной переменной Y, т.е. если М (Y) = f (х), то связь между Х и Y называется корреляционной зависимостью. Функция f (х) называется регрессией (в вольном толковании «откликом») Y на Х. Возможна и регрессия Х на Y, т.е. М (Х) = j(y). График y = f (х) называется линией регрессии Y на Х, график x = j(y) – линией регрессии Х на Y. Регрессия случайной зависимой переменной может иметь место и в случае, когда независимая переменная не является случайной величиной, т.е. принимает заданные значения. 2o. Формы представления выборочных данных для корреляционного анализа
Диаграмма рассеяния – точечный график значений пар (Х; Y) случайных величин по данным выборки. Недостатком диаграммы рассеяния является отсутствие информации о час- тоте значений (хi, yi). Достоинство – наглядность распределения выборочных данных. При этом форма линии регрессии y = y (x) устанавливается по точкам yi * =
матрица частот значений (хi, yi). Достоинство – полная инфор- мация о выборке, недостаток – отсутствие наглядности.
3o. Парная линейная регрессия Рассмотрим простейшую корреляционную зависимость, при которой регрессия Y на Х – линейная функция: y = а + bx, параметр b называется коэффициентом регрессии и определяет тангенс угла наклона прямой линии регрессии относительно положительного направления оси х.
y = а + bx должна пройти че- рез все точки (хi, yi) диаграм- мы рассеяния. Однако на практике значения yi выбор- ки не совпадают с y (хi) = a + bxi ни для каких a и b. Поэ- тому возникает необходи- мость найти такую прямую линию регрессии y (х) = Нахождение оценок Отметим, что этот метод не дает ответ, функция какого вида лучше отвечает исследуемой зависимости переменных (линейная, квадратичная, логарифмическая и т.д.), он позволяет лишь определить, какие параметры выбранной функции являются лучшими для полученных выборочных данных. Выполним необходимые условия для точки экстремума F (
Аналогично находятся оценки параметров уравнения х (y) = Если в уравнение регрессии Y на Х y (х) = Если учесть, что
то Чтобы проверить значимость уравнения парной регрессии в целом (т.е. установить, соответствует ли линейная модель с установленными параметрами экспериментальным данным для описания зависимой переменной) используется F -критерий Фишера-Снедекора. Наблюдаемое значение критерия K н = (n – 2)· QR / Q ост, где QR – вариация зависимой переменной, учтенная регрессией (
4o. Корреляционный анализ как один из приемов прогнозирования Поскольку уравнение регрессии Y на Х задает зависимость статистического среднего (условного мат. ожидания) случайной переменной величины Y для каждого значения Х:
Однако это не означает, что экстраполяция вообще недопустима. Напротив, корреляционная модель, в общем случае, нацелена на обоснование прогнозируемых величин в предположении сохранения закономерностей, определяющих зависимость переменных случайных величин. Рассмотрим приложение корреляционного анализа к прогнозированию в случае линейной зависимости случайных переменных величин, при которой существующая корреляционная зависимость y = а + bx моделируется уравнением y (х) = Пример: Составить прогноз товарооборота в млн. руб. на 2025 г. для фирмы по имеющимся выборочным данным (Х – годы, Y – объем товарооборота):
Имеем объем выборки n = 6. Проведем расчет для независимой переменной Х, уменьшив ее значения на 1900 единиц:
Найдем параметры линейного уравнения регрессии y (х) =
1)
3)
Строим график по двум точкам:
Делаем прогноз на 2025 год (х * = 125): y * = Рассчитаем доверительный интервал с надежностью g = 0,95: y * – d <
Þ s(y *) = 5o. Уравнение множественной линейной регрессии Рассмотрим случай множественной линейной регресии: и (x) = и (x 1, x 2,…, xт) =
Если построить матрицы Х = то Х Т × Х =
п ×
= п × В = (Х Т × Х)– 1× Х Т × U.
Эта формула позволяет достаточно быстро, используя, например, табличный редактор Ехсеl, получить значения числовых параметров эмпирической функции при множественной линейной регрессии. Для этого достаточно составить матрицы Х и U по результатам выполненных п измерений, т.е. по выборке объема п. Для установления значимости на уровне a уравнения множественной линейной регрессии и (x) =
Дата добавления: 2015-07-02; Просмотров: 376; Нарушение авторских прав?; Мы поможем в написании вашей работы! |