КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Регрессия в программе Excel
Статистическая обработка данных может также проводиться с помощью надстройки ПАКЕТ АНАЛИЗА (рис. 63). Из предложенных пунктов выбирает пункт «РЕГРЕССИЯ» и щелкаем на нем левой кнопкой мыши. Далее нажимаем ОК.
Рис. 63. Окно «ПАКЕТ АНАЛИЗА»
Появится окно, показанное на рис. 64.
Рис. 64. Окно функции «РЕГРЕССИЯ»в окне «ПАКЕТ АНАЛИЗА»
Инструмент анализа «РЕГРЕССИЯ» применяется для подбора графика для набора наблюдений с помощью метода наименьших квадратов. Регрессия используется для анализа воздействия на отдельную зависимую переменную значений одной или нескольких независимых переменных. Например, на спортивные качества атлета влияют несколько факторов, включая возраст, рост и вес. Можно вычислить степень влияния каждого из этих трех факторов по результатам выступления спортсмена, а затем использовать полученные данные для предсказания выступления другого спортсмена. Инструмент «Регрессия» использует функцию ЛИНЕЙН. Диалоговое окно «РЕГРЕССИЯ» Входной интервал Y Введите ссылку на диапазон зависимых данных. Диапазон должен состоять из одного столбца. Входной интервал X Введите ссылку на диапазон независимых данных. Эти данные будут расположены слева направо в порядке возрастания. Максимальное число независимых переменных равно 16. Метки Установите флажок, если первая строка или первый столбец входного диапазона содержит заголовки. Снимите этот флажок, если заголовки отсутствуют. В этом случае подходящие заголовки для данных выходной таблицы будут созданы автоматически. Уровень надежности Установите флажок, чтобы включить в выходную таблицу итогов дополнительный уровень. В соответствующее поле введите уровень надежности, который следует применить, дополнительно к уровню 95%, применяемому по умолчанию. Константа - ноль Установите флажок, чтобы линия регрессии прошла через начало координат. Выходной интервал Введите ссылку на левую верхнюю ячейку выходного диапазона. Отведите как минимум семь столбцов для выходной таблицы итогов, которая будет включать в себя: результаты дисперсионного анализа, коэффициенты, стандартную погрешность вычисления Y, среднеквадратичные отклонения, число наблюдений, стандартные погрешности для коэффициентов. Новый рабочий лист Установите переключатель в это положение, чтобы открыть новый лист в книге и вставить результаты анализа, начиная с ячейки A1. При необходимости введите имя для нового листа в поле, расположенном напротив соответствующего положения переключателя. Новая рабочая книга Установите переключатель в это положение для создания новой книги, в которой результаты будут добавлены в новый лист. Остатки Установите флажок для включения остатков в выходную таблицу. Стандартизированные остатки Установите флажок для включения стандартизированных остатков в выходную таблицу. График остатков Установите флажок для построения графика остатков для каждой независимой переменной. График подбора Установите флажок для построения графика зависимости предсказанных значений от наблюдаемых. График нормальной вероятности Установите флажок, для построения графика нормальной вероятности. Функция ЛИНЕЙН Для проведения расчетов выделяем курсором ячейку, в которой хотим отобразить среднее значение и нажимаем на клавиатуре клавишу =. Далее в поле Имя указываем нужную функцию, например СРЗНАЧ (рис. 22). Функция ЛИНЕЙН рассчитывает статистику для ряда с применением метода наименьших квадратов, чтобы вычислить прямую линию, которая наилучшим образом аппроксимирует имеющиеся данные и затем возвращает массив, который описывает полученную прямую. Можно также объединять функцию ЛИНЕЙН с другими функциями для вычисления других видов моделей, являющихся линейными в неизвестных параметрах (неизвестные параметры которых являются линейными), включая полиномиальные, логарифмические, экспоненциальные и степенные ряды. Поскольку возвращается массив значений, функция должна задаваться в виде формулы массива. Уравнение для прямой линии имеет следующий вид: y=mx+b или y=m1x1+m2x2+…+b (в случае нескольких диапазонов значений x), где зависимое значение y — функция независимого значения x, значения m — коэффициенты, соответствующие каждой независимой переменной x, а b — постоянная. Обратите внимание, что y, x и m могут быть векторами. Функция ЛИНЕЙН возвращает массив{mn;mn-1;…;m1;b}. ЛИНЕЙН может также возвращать дополнительную регрессионную статистику. ЛИНЕЙН (известные_значения_y; известные_значения_x; конст; статистика) Известные_значения_y — множество значений y, которые уже известны для соотношения y=mx+b. Если массив известные_значения_y имеет один столбец, то каждый столбец массива известные_значения_x интерпретируется как отдельная переменная. Если массив известные_значения_y имеет одну строку, то каждая строка массива известные_значения_x интерпретируется как отдельная переменная. Известные_значения_x — необязательное множество значений x, которые уже известны для соотношения y=mx+b. Массив известные_значения_x может содержать одно или несколько множеств переменных. Если используется только одна переменная, то массивы_известные_значения_y и известные_значения_x могут иметь любую форму — при условии, что они имеют одинаковую размерность. Если используется более одной переменной, то известные_значения_y должны быть вектором (т. е. интервалом высотой в одну строку или шириной в один столбец).
Конст — логическое значение, которое указывает, требуется ли, чтобы константа b была равна 0.
Статистика — логическое значение, которое указывает, требуется ли вернуть дополнительную статистику по регрессии.
Дополнительная регрессионная статистика (таблица 18).
Таблица 18
На приведенном ниже рисунке показано, в каком порядке возвращается дополнительная регрессионная статистика (рис. 65).
Рис. 65. Регрессионная статистика
Наклон (m): чтобы определить наклон прямой, обычно обозначаемый через m, нужно взять две точки прямой (x1,y1) и(x2,y2); наклон будет равен (y2-y1)/(x2-x1). Y-пересечение (b): Y-пересечением прямой, обычно обозначаемым через b, является значение y для точки, в которой прямая пересекает ось y. Уравнение прямой имеет вид y=mx+b. Если известны значения m и b, то можно вычислить любую точку на прямой, подставляя значения y или x в уравнение. Можно также воспользоваться функцией ТЕНДЕНЦИЯ.
Наклон: ИНДЕКС (ЛИНЕЙН(известные_значения_y; известные_значения_x); 1) Y-пересечение: ИНДЕКС (ЛИНЕЙН (известные_значения_y; известные_значения_x); 2)
где x и y – выборочные средние значения, например x = СРЗНАЧ (известные_значения_x), а y = СРЗНАЧ (известные_значения_y).
Функция ЛИНЕЙН возвращает значение, равное 0. Алгоритм функции ЛИНЕЙН используется для возвращения подходящих значений для коллинеарных данных, и в данном случае может быть найден по меньшей мере один ответ. Функции НАКЛОН и ОТРЕЗОК возвращают ошибку #ДЕЛ/0!. Алгоритм функций НАКЛОН и ОТРЕЗОК используется для поиска только одного ответа, а в данном случае их может быть несколько.
=ЛИНЕЙН(значения_y, значения_x^СТОЛБЕЦ($A:$C)) работает при наличии одного столбца значений Y и одного столбца значений Х для вычисления аппроксимации куба (многочлен 3-й степени) следующей формы: y=m1x+m2x2+m3x3+b Формула может быть изменена для расчетов других типов регрессии, но в отдельных случаях требуется корректировка выходных значений и других статистических данных.
Литература
1. Шустов Ю.С. Метрология. – М: РИО МГУДТ, 2013. 2. Соловьев А.Н. Измерения и оценка свойств текстильных материалов. – М.: М., Легкая индустрия 3. Берк К., Кэйри П. Анализ данных с помощью Microsoft Excel. – М.: Вильямс, 2005 4. Сингаевская Г.И. Функции в Ехсel. Решение практических задач. - М.: Вильямс, 2005 5. Вадзинский Р. Статистические вычисления в среде Excel. – СПб.: ООО «Питер-пресс», 2008. – 608с. 6. Конрад Карлберг Бизнес-анализ с использованием Excel. Решение практических бизнес-задач: 4-е издание. – М.: «ВИЛЬЯМС», 2012. - 576 с. 7. Джон Уокенбах Microsoft Excel 2010. Библия пользователя. – М.: Диалектика, 2011 8. Иванов И. Microsoft Excel 2010 для квалифицированного пользователя. - Академия АЙТИ, 2011. - 244 с.
Дата добавления: 2014-01-03; Просмотров: 2269; Нарушение авторских прав?; Мы поможем в написании вашей работы! |