КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Функциональная и корреляционная зависимости
Элементы теории корреляции Изучение разнообразных явлений сопровождается выяснением закономерностей, которым подчиняются характерные для данных явлений количественные соотношения или связи. При этом оказывается, что только для тех явлений, происхождение которых связывается с четко учтенными факторами, количественные соотношения или связи имеют вполне точный и определенный характер. Для таких явлений, изучаемых, например, в физике, химии, механике, астрономии, действуют функциональные связи между количественными признаками. Характеристика этих связей в виде уравнения, графика или таблицы подчиняется принципу строго определенного срответствия, составляющего сущность функциональной зависимости. Вместе с тем для самых разнообразных явлений массового характера нельзя установить закономерность в количественных соотношениях между рассматриваемыми показателями, которая удовлетворяла бы принципу строгого соответствия. Нарушение этого принципа связано с тем, что изменение одного показателя определяется не только изменением другого основного показателя, но и влиянием ряда сопутствующих второстепенных факторов. Так, при установлении взаимосвязи между показателями использования основных средств и уровня производительности труда на заводе выясняется, что на уровень производительности труда, помимо объема затрачиваемых основных средств, влияют еще и другие факторы (рационализация производственного процесса, организация труда и др.). Взаимосвязи между количеством осадков и показателями урожайности, толщиной покрова снега и показателями стока воды, пока зателями содержания марганца в стали и степенью ее прокаливаемости начальной прочностью бетона и прочностью его через 28 дней и т. д также не удовлетворяют условию определенного соответствия. Во всех таких примерах мы сталкиваемся с невозможностью учета влияния всех факторов на интересующие нас количественныесоотношения между двумя основными величинами (показателями). Поэтому характеристика каждой такой взаимосвязи по данным отдельных наблюдений носит случайный характер и может выявить некоторые закономерности лишь по данным большого числа наблюдений. Характерная особенность взаимосвязей в массовых явлениях состоит в том, что каждому значению одной величины х соответствует распределение значений у (т. е. несколько значений у с различными вероятностями каждого из них), меняющееся с изменением х. Такое же соответствие имеет место между каждым значением величины y и связанными с ним значениями х. В отличие от функциональной зависимости связь такого характера между двумя величинами называется статистической. Степень рассеяния возможных значений у, соответствующих каждому значению x, характеризует большую или меньшую тесноту связи между этими величинами. Это значит, что если влияние неучтенных факторов на изучаемую связь между величинами х и у незначительно, то степень рассеяния значений у мала, а связь между х и у имеет большую тесноту. Если же влияние неучтенных факторов значительно, то степень рассеяния значений у велика, а теснота связи между х и у мала. Для выяснения математической сущности связей такого вида на конкретном примере обратимся к данным табл. 1 распределения 100 растений житняка по общему весу х и по весу семян у каждого растения. Таблица 1
При составлении таблицы растения житняка сгруппированы в отдельные классы по общему весу и по весу семян, а затем определены середины классов, т. е. средние значения этих весов по каждому классу. Середины классов растений по общему весу обозначены переменной х, а середины классов по весу семян — переменной у. Так, Символом Числами во внутренних клетках обозначены частоты соответственных комбинаций растений с некоторым общим весом х и с некоторым весом семян у. Так, число 8 означает количество растений с общим весом 55 г (от 50 до 60 г) и с весом семян 33 г (от 30,5 до 35,5 г); число 4 в третьем (внутреннем) столбце — количество растений с общим весом (в среднем) 35 г и с весом семян (в среднем) 23 г, а число 4 в третьей снизу (внутренней) строке — количество растений с общим весом 105 г и с весом семян 58 г. В обобщенных обозначениях для чисел во внутренних клетках применяется символ п с двойным индексом Рассмотренная структура таблицы распределения растений житняка по общему весу и по весу семян отдельных растений раскрывает на этом частном примере общую структуру так называемой корреляционной таблицы, связывающей значения изучаемых показателей х и y. Суммы чисел п, расположенных во внутренних клетках, по строкам дают частоты соответственных значений переменной х. Так, Суммы чисел
Так, Суммирование всех чисел Совпадение результатов суммирования, выполненного в одном или в другом порядке, подтверждает правильность составления корреляционной таблицы:
Если совпадение результатов нарушено, то ошибка может быть устранена проверкой результатов суммирования по каждой строке и по каждому столбцу. В частных случаях числа значения у 23 33 38 43 их частоты 1 4 4 2 Распределение значений у, соответствующих значению Значению значения у 18 23 28 их частоты 1 13 5 Так же элементарно можно охарактеризовать распределения значений x, соответствующие тем или другим значениям у. Корреляционная таблица, составленная на основании результатов наблюдения за значениями переменных х и у, позволяет после некоторой математической обработки ее данных подойти к разрешению двух основных задач корреляционного анализа: установлению формы корреляционной связи между переменными х и у и определению тесноты этой связи. Рассмотрение в корреляционной таблице рядов распределения значений у, соответствующих последовательным значениям х, может выявить некоторые закономерности в смещении этих рядов. Простейшие случаи, характерные для формы таких смещений, позволяют убедиться в том, что с возрастанием значений х в среднем растут или в среднем убывают значения у, что с возрастанием значений х значения у в среднем сначала возрастают, а затем убывают, или наоборот. К этим характеристикам связей между значениями х и y приводит внешний вид расположения рядов распределения значений у, соответствующих последовательным значениям х. Так, по данным корреляционной таблицы 1 распределения растений житняка смещение рядов распределения значений у показывает, что с возрастанием х (общего веса растения) возрастая в среднем и у (вес семян растения). Но эта связь выразится более отчетливо, если каждому значению х будет поставлено в соответствия частное среднее значение у, которое обозначим символом Вычисляя эти частные средние по правилу определения средней взвешенной, будем иметь:
С помощью таких средних, вычисленных для всех значений х исходная табл. 1 приводится к форме, отражающей связь между значениями х и соответствующими частными средними Таблица 3
Графическое отображение данных табл. 3 в виде точек, соответствующих парам значений х и Отыскание уравнения этой линии дает разрешение первой основной задачи корреляционного анализа, — установления формы корреляционной связи между переменными х и у. Если точки
т. е. к линейной корреляции. К этому типу корреляционной зависимости между у и х приводит, в частности, рассматриваемый пример распределения растений житняка по общему весу и по весу семян (рис. 13).
Рис. 13 Если же расположение точек, соответствующих парам значений x и Здесь мы выяснили, таким образом, возможность установить наличие корреляционной связи между значениями х и соответствующими частными средними значениями у. Но та же корреляционная таблица позволяет поставить вопрос о корреляционной связи между значениями у и соответствующими им частными средними значениями х. Действуя аналогично предыдущему, следует найти для каждого значения у соответственную частную среднюю Если взаимное расположение вершин этой ломаной, соответствующих парам значений у и
выражающему корреляционную зависимость между х и у. Корреляционные уравнения Термин «регрессия», принятый для обозначения корреляционного характера связи между изучаемыми показателями и для графического отображения этой связи в виде некоторой линии, отражает тенденцию смещения рядов распределения значений у с изменением соответственных значений x. Так, в табл. 1 с увеличением значений х соответствующие ряды распределений у смещаются в сторону больших значений у. Контуры фигуры, образуемой скоплением данных распределения в таблице, позволяют приближенно представить форму связи между изучаемыми показателями в виде линии регрессии, выравнивающей обнаруженное в таблице смещение. При составлении эмпирической линии регрессии у по х может оказаться, что все точки
В таких случаях говорят, что между х и у существует точная корреляционная зависимость (линейная, если эта линия — прямая, и криволинейная — в общем случае). Эти результаты в отношении эмпирической линии регрессии могут иметь место и при малой, и при большой степени рассеяния значений у относительно линии регрессии. Такое различие в степени рассеяния характеризует тесноту изучаемой корреляционной зависимости — при малом рассеянии теснота считается большой, и наоборот. То же может иметь место и при составлении эмпирической линии регрессии х по у. Признаком наличия точной линейной корреляции является обращение в тождество соответствующего уравнения регрессии при подстановке в него любой пары значений Бывает и так, что значения То же имеет место и в отношении связи х по у. Заключительной стадией отыскания формы связи является операция выравнивания. Она состоит в определении аналитическими методами параметров корреляционного уравнения, которому приближенно удовлетворяют значения х и Соотношения между показателями, характерные для корреляционной зависимости, имеют не точный, а приближенный характер, ибо, как выше указывалось, при изучении этих соотношений остаются неучтенными различные дополнительные факторы, которые рассеивают воздействие одного из основных показателей на другой. Поэтому второй задачей теории корреляции является измерение тесноты корреляционной связи. Такая связь в виде корреляционного уравнения будет тем теснее (ближе к данным наблюдения над значениями изучаемых показателей), чем слабее рассеяние связи между этими показателями под влиянием дополнительных неучтенных факторов. Практическое значение теории корреляции состоит в том, что она позволяет, используя опытные данные и известные сведения о значениях той или иной величины, определять границы, в которых должна заключаться другая величина, с ней связанная.
Дата добавления: 2014-12-26; Просмотров: 1670; Нарушение авторских прав?; Мы поможем в написании вашей работы! |