Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Вибір найближчого елемента в стовпці j матриці відстаней 3 страница




3. Фільтрація вихідного часового ряду

4. Функції для моделювання часового ряду

5. Оцінки математичної моделі прогнозування

Мета:

навчити студентів методам дослідження часових рядів

 

Література:

 

Основна:

[2], [3], [5], [7], [12]

 

Додаткова:

[22]

 

 

Питання для самоконтролю:

1. Які складові частини методу екстраполяції Ви знаєте?

2. З чого складається фільтрація вихідного часового ряду?

3. Які функції найчастіше використовуються для моделювання часових рядів?

4. Що таке дисконтування у моделі часового ряду?

5. Як визначити параметр згладжування?


Основні поняття

 

Прогнозування – це дослідницький процес, за результатами якого отримують прогноз про стан об’єкта.

У методах прогнозування використовують два підходи: евристичний і математичний.

Евристичний підхід базується на явищах та процесах, які не підлягають формалізації.

Для математичного підходу обирається модель і математичні методи її дослідження.

До групи екстраполяційних методів прогнозування можна віднести методи:

1) на основі побудови багатофакторних кореляційно-регресійних моделей;

2) авто регресії, яка враховує взаємозв’язок членів часового ряду;

3) які базуються на розкладі часового ряду на компоненти: головна тенденція (тренд), сезонні коливання і випадкова складова;

4) які дозволяють врахувати нерівно значимість вихідних даних;

5) прямої екстраполяції при використанні різних трендових моделей.

Прогнозування за допомогою методів екстраполяції повинно включати наступні етапи роботи:

1. Визначення мети і завдань дослідження, аналіз об’єкта прогнозування.

2. Підготовка вихідних даних. Проводиться перевірка часового ряду, дискретна форма якого має вигляд

,

де – значення визначаємої величини у моменти часу t (t = 1, 2, …, n), – детермінована невипадкова компонента процесу, – стохастична випадкова компонента процесу.

Якщо часовий ряд неповний, то проміжки заповнюють за допомогою методів інтерполяції у залежності від характеру процесу.

3. Фільтрація вихідних часових рядів. Ця процедура включає згладжування та вирівнювання вихідного динамічного ряду.

Згладжування, яке використовує лінійну залежність, для груп з трьох точок має вигляд

де , – значення вихідної і загладжуваної функції в середній точці групи, , – значення у лівій точці, , – значення у правій точці відповідно.

Для групи з п’яти точок формули для згладжування наступні:

Вирівнювання використовується для приведення вихідного ряду без зміни чисельних значень до вигляду, який більш легко дослідити відомими апробованими методами. Під вирівнюванням будемо розуміти приведення емпіричної формули

,

де t – час, a і b – параметри, до вигляду

.

Використання двохпараметричної залежності пояснюється її найбільшим використанням у практиці прогнозування. Зауважимо, що для більшої кількості параметрів зведення до лінійної форми функції не завжди можливі.

До методів вирівнювання можна віднести логарифмування та зміну параметрів.

 

Приклади.

1. Вихідна функція має вигляд у = аtb. Після логарифмування маємо ln y = ln a + b ln t. Зробимо заміни: Т = ln t, Y = ln y, a1 = b, b1 = ln a. Тоді функція вирівнювання дорівнює

2. Нехай у = аebt є вихідною функцією. Після логарифмування і заміни параметрів отримуємо

,

де b1 = ln a, a1 = b.

3. Вихідна функція представлена у вигляді

Вирівнювання приводить до функції

4. Нехай вихідна функція має вигляд

Заміни параметрів , a = b1, b = a1, Т = е-t приводять до формули

.

. Вирівнювання можна розглядати як метод безпосереднього наближеного визначення параметрів функції, яка апроксимує вихідну функцію.

 

4. Відбір виду функції, яка апроксимує вихідну функцію.

Після проведення дослідження можливих властивостей вихідної функції на основі статистичних даних (дослідження функцій і побудова графіків вивчалися на І курсі). Обирають функцію для апроксимації. Можна рекомендувати наступні функції:

− степеневий поліном

− експоненціальний поліном

− гіперболічний поліном

де y – прогнозний показник, t – час, a1, a2, …, an – параметри, які треба визначити.

Частіше використовуються наступні функції:

− лінійна

− квадратична

− степенева

− експоненціальна

модифікована експонента

гіперболічна

 

− логістична крива

де a, b, c, k – параметри.

При виборі функції для апроксимації використовують графічне відображення точок часового ряду. Обирають ту функцію для прогнозу, арифметична середня для різницевого ряду якого дорівнює нулю або близька до нього.

Оцінка математичної моделі прогнозування

Метод найменших квадратів полягає у визначенні параметрів моделі тренда, які мінімізують її відхилення від точок вихідного часового ряду:

де - розраховані (теоретичні) значення вихідного ряду, yi – фактичні значення вихідного ряду, n – кількість спостережень.

Практика показує, що поведінка процесу визначається більш пізніми спостереженнями, ніж попередніми, тобто мова йде про дисконтування: зменшення цінності попередньої інформації. дисконтування враховується шляхом введення у модель деяких ваг-коефіцієнтів βі < 1. Тоді

коефіцієнти задають у чисельній або у функціональній формі таким чином, щоб при поверненні у минуле вони спадали.

Верифікація прогнозів. EX POST як імітація процесу прогнозування

 

Статистичні прогнози ґрунтуються на гіпотезах про стабільність значень величини, що прогнозується; закону її розподілу; взаємозв'язків з іншими величинами тощо. Основний інструмент прогнозування — екстраполяція.

Суть прогнозної екстраполяції полягає в поширенні закономірностей, зв'язків і відношень, виявлених в t -му періоді, за його межі.

Залежно від гіпотез щодо механізму формування і подальшого розвитку процесу використовуються різні методи прогнозної екстраполяції. Їх можна об'єднати в дві групи:

- екстраполяція закономірностей динаміки — тренду і коливань;

- екстраполяція причинно-наслідкового механізму формування процесу — факторне прогнозування.

Ці методи різняться не процедурою розрахунків прогнозу, а способом описування об'єкта моделювання. Екстраполяція закономірностей розвитку ґрунтується на вивченні його передісторії, виявленні загальних і усталених тенденцій, траєкторій зміни в часі. Абстрагуючись від причин формування процесу, закономірності його розвитку розглядають як функцію часу. Інформаційною базою прогнозування слугують одномірні динамічні ряди.

При багатофакторному прогнозуванні процес розглядається як функція певної множини факторів, вплив яких аналізується одночасно або з деяким запізненням. Інформаційною базою виступає система взаємозв'язаних динамічних рядів. Оскільки фактори включаються в модель у явному вигляді, то особливого значення набуває апріорний, теоретичний аналіз структури взаємозв'язків.

Важливим етапом статистичного прогнозування є верифікація прогнозів, тобто оцінювання їх точності та обґрунтованості. Ha етапі верифікації використовують сукупність критеріїв, способів і процедур, які дають можливість оцінити якість прогнозу.

Найбільш поширене ретроспективне оцінювання прогнозу, тобто оцінювання прогнозу для минулого часу (ex-post прогноз). Процедура перевірки така. Динамічний ряд поділяється на дві частини: перша — для t = 1,2,3,...,p — називається ретроспекцією (передісторією), друга — для t=p + 1, p + 2, p + 3,..., p +(n —р) — прогнозним періодом.

За даними ретроспекції моделюється закономірність динаміки і на основі моделі розраховується прогноз Yp+v, де v — період упередження. Ретроспекція послідовно змінюється, відповідно змінюється прогнозний період, що унаочнює рис. 2.10 (для v = 1).

 

Рисунок 1 – Схема ретроспективної перевірки точності прогнозу для v = 1

 

Оскільки фактичні значення прогнозного періоду відомі, то можна визначити похибку прогнозу як різницю фактичного уt іпрогнозного Yt рівнів: et = yt – Yt. Всього буде n —р похибок. Узагальнюючою оцінкою точності прогнозу слугує середня похибка:

абсолютна , квадратична .

Для порівняння точності прогнозів, визначених за різними моделями, використовують похибку апроксимації (%):

Якщо результат оцінювання точності прогнозу задовольняє визначені критерії точності, скажімо, 10%, то прогнозна модель вважається прийнятною і рекомендується для практичного використання. Очевидно, що похибка прогнозу залежить від довжини ретроспекції та горизонту прогнозування. Оптимальним співвідношенням між ними вважається 3: 1.

При оцінюванні та порівнянні точності прогнозів використовують також коефіцієнт розбіжності Г. Тейла, який дорівнює нулю за відсутності похибок прогнозу і не має верхньої межі:

Існуючі методи верифікації прогнозів у більшості своїй ґрунтуються на статистичних процедурах, які зводяться до побудови довірчих меж прогнозу, себто до побудови інтервальних прогнозів.

Помилки ex post прогнозів можна оцінювати таким же чином, як ми оцінювали залишки моделі. Тобто ми можемо розглянути відповідні значення MSE, MAD і МАРE.

Для оцінки помилок ex post прогнозів використовується також число, яке називається коефіцієнтом нерівності Тейла (Theil's inequality coefficient):

де T – число ex post прогнозів.

Еx post – один з найнадійніших методів при виборі моделі прогнозування. При цьому особливу увагу слід звертати на останні значення моделі. Стабільність коефіцієнтів моделі, разом з іншими характеристиками, які вказують на достатньо високу точність (R2, MAD і МАРE), говорить на користь вибраної моделі.

Перш ніж приступити безпосередньо до прогнозування майбутніх значень, прогнозист повинен спочатку зрозуміти ті кількісні закономірності (або хоча б частина з них), які лежать в основі бізнес-процесу. Єдине, що він має в розпорядженні, це початкові дані. Звідси витікає, що на початку прогнозист повинен створити модель, яка достатньо добре описувала б саме початкові дані. Різниця між істинним і прогнозованим значеннями називається помилкою прогнозу.

Тут потрібно відзначити, що прогнозовані значення необов'язково повинні відноситися до майбутнього. Прогнозувати можна будь-які величини, що не входять в набір початкових даних. Подібні прогнозовані значення часто використовуються, коли необхідно відновити дані, відсутні через які-небудь причини.

Ідея ex post прогнозування. З цією метою початкові дані розбиваються на дві групи, так щоб в другій групі знаходилися пізніші дані, що становлять звично приблизно 15% всієї інформації. Ці дані будуть потім використовуватися для тестування. При невеликому об'ємі початкових даних в другій групі можна розглядати до 30% початкової інформації.

Але спочатку ми повинні задати горизонт прогнозування. При цьому кожного разу ми порівнюватимемо набуті значення з наявною інформацією. У цьому якраз і полягає головна перевага ex post прогнозування. При звичному прогнозуванні у нас такої можливості немає. Припустимо, що нас цікавить прогноз на один квартал вперед і ми хочемо протестувати лінійну модель. Нижче ми приводимо докладний алгоритм ex post прогнозування.

Алгоритм ex post прогнозування:

1. Знаходимо лінію регресії L для перших 13 значень.

2. З рівняння L визначаємо прогноз на 14-й квартал.

3. Порівнюємо одержаний прогноз з наявною інформацією за 14-й квартал. Знаходимо помилку.

4. Повторюємо пункти 1-3 послідовно для перших 14, 15 і 16 значень.

В результаті ми одержуємо таблицю, що містить ex post прогнози і відповідні помилки для останніх чотирьох кварталів.

В процесі ex post прогнозування, додаючи нові дані, ми кожного разу одержували інше рівняння. Це приклад рекурсивного ex post прогнозування,

 

 

Тема 5. Моделювання як метод прогнозування

Лекція 5.1. Метод експоненціального згладжування

 

 

План

1. Методи. Експоненціальна середня

2. Модель Хольта - Брауна

3. Практичні формули прогнозування

 

Мета:

за допомогою методу експоненціального згладжування покращувати знайдені тренди

 

Література:

 

Основна:

[2], [3], [5], [7], [12]

 

Додаткова:

[22]

Питання для самоконтролю:

1. Охаректиризуйте методи прогнозування.

2. Якому закону підлягають ваги сповзаючої середньої?

3. Як находиться експоненціальна середня?

4. Які умови необхідні для визначення лінійного тренду?

4. Які практичні формули прогнозування Ви знаєте?

 

Методи прогнозування

 

До недавнього часу (середини 80-х років минулого століття) існувало декілька загальновизнаних методів прогнозування тимчасових рядів:


• Економетричні

• Регресійні

• Методи Бокса-Дженкінса (ARIMA, ARMA)


Проте, починаючи з кінця 80-х років, в науковій літературі були опубліковані ряд статей з нейромережевої тематики, в яких був приведений ефективний алгоритм навчання нейронних мереж і доведена можливість їх використання для найширшого кола завдань.

Ці статті відродили інтерес до нейромереж в науковому співтоваристві і останні дуже скоро почали широко використовуватися при дослідженнях в самих різних областях науки від експериментальної фізики і хімії до економіки.

Методи прогнозування, засновані на згладжуванні, експоненційному згладжуванні і ковзному середньому

"Наївні" моделі прогнозування

При створенні "наївних" моделей передбачається, що деякий основний період прогнозованого тимчасового ряду краще всього описує майбутнє цього прогнозованого ряду, тому в цих моделях прогноз, як правило, є дуже простою функцією від значень прогнозованої змінної в недалекому минулому.

Найпростішою моделлю є

 

 

що відповідає припущенню, що "завтра буде як сьогодні"

Поза всяким сумнівом, від такої примітивної моделі не варто чекати великої точності. Вона не тільки не враховує механізми, що визначають прогнозовані дані (цей серйозний недолік взагалі притаменний багатьом статистичним методам прогнозування), але і не захищена від випадкових коливань, вона не враховує сезонні коливання і тенденції. Втім, можна будувати "наївні" моделі дещо по-іншому

 

 

такими способами ми намагаємося пристосувати модель до можливих тенденцій

 

 

це спроба врахувати сезонні коливання.

 

 

Рисунок 1. - Прогнозування найпростішими методами

 

 

 

Рисунок 2 - Прогнозування найпростішими методами

 

Середні і ковзаючі середні

 

Найпростішою моделлю, заснованою на простому усереднюванні є

 

 

і у відмінності від найпростішої "наївної" моделі, якій відповідав принцип "завтра буде як сьогодні", цій моделі відповідає принцип "завтра буде як було в середньому за останній час". Така модель, звичайно стійкіша до коливань, оскільки в ній згладжуються випадкові викиди щодо середнього. Не дивлячись на це, цей метод ідеологічно настільки ж примітивний як і "наївні" моделі і йому властиві майже ті ж самі недоліки.

У приведеній вище формулі передбачалося, що ряд усереднюється по достатньо тривалому інтервалу часу. Проте як правило, значення тимчасового ряду з недалекого минулого краще описують прогноз, ніж усі попередні значення цього ж ряду. Тоді можна використовувати для прогнозування ковзне середнє

 

 

Сенс його полягає в тому, що модель бачить тільки найближче минуле (на T відліків за часом в глибину) і грунтуючись тільки на цих даних будує прогноз.

При прогнозуванні досить часто використовується метод експоненціальних середніх, який постійно адаптується до даних за рахунок нових значень. Формула, що описує цю модель записується як

 

 

де Yt+1– прогноз на наступний період часу

Yt– реальне значення у момент часу t

Yt– минулий прогноз на момент часу t

а – постійна згладжування (0<=a<=1)

У цьому методі є внутрішній параметр а, який визначає залежність прогнозу від усіх розглянутих даних, причому вплив даних на прогноз експоненціально зменшується із "віком" даних. Залежність впливу даних на прогноз при різних коефіцієнтах а приведена на графіці.

Видно, що при a→1, експоненціальна модель прагне до найпростішої "наївної" моделі. При a→0, прогнозована величина стає рівною попередньому прогнозу.

Якщо проводиться прогнозування з використанням моделі експоненціального згладжування, зазвичай на деякому тестовому наборі будуються прогнози при a=[0.01, 0.02..., 0.98, 0.99] і відстежується, при якому а точність прогнозування вища. Це значення а потім використовується при прогнозуванні надалі.

Хоча описані вище моделі ("наївні" алгоритми, методи, засновані на середніх, ковзних середніх і експоненціальному згладжуванні) використовуються при бізнес-прогнозуванні в не дуже складних ситуаціях, наприклад, при прогнозуванні продажу на спокійних і сталих західних ринках, не рекомендовано використовувати ці методи в завданнях прогнозування з причини явної примітивності і неадекватності моделей.

 

Рисунок 3 - Залежність впливу даних на прогноз при різних коефіцієнтах а

 

Разом з цим хотілося б відзначити, що описані алгоритми цілком успішно можна використовувати як супутні і допоміжні для передобробки даних в завданнях прогнозування. Наприклад, для прогнозування продажу в більшості випадків необхідно проводити декомпозицію тимчасових рядів (тобто виділяти окремо тенденційну, сезонну і нерегулярну складові). Одним з методів виділення тенденційних складових є використання експоненціального згладжування.

 

 

Рисунок 4 - Прогнозування ковзаючим середнім.

 

Рисунок 5 - Спад адекватності при ковзаючому середньому.

 

Методи Хольта і Брауна

 

В середині минулого століття Хольт запропонував вдосконалений метод експоненціального згладжування, згодом названий його ім'ям. У запропонованому алгоритмі значення рівня і тенденції згладжуються за допомогою експоненціального згладжування. Причому параметри згладжування у них різні.

 

Тут перше рівняння описує згладжений ряд загального рівня.

Друге рівняння служить для оцінки тенденції.

Третє рівняння визначає прогноз на p відліків за часом вперед.

Постійні згладжування в методі Хольта ідеологічно грають ту ж роль, що і постійна в простому експоненціальному згладжуванні. Підбираються вони, наприклад, шляхом перебору по цих параметрах з якимсь кроком. Можна використовувати і менш складні в сенсі кількості обчислень алгоритми. Головне, що завжди можна підібрати таку пару параметрів, яка дає велику точність моделі на тестовому наборі і потім використовувати цю пару параметрів при реальному прогнозуванні.

Окремим випадком методу Хольта є метод Брауна, коли

 

Метод Вінтерса

 

Хоча описаний вище метод Хольта (метод двохпараметричного експоненціального згладжування) і не є зовсім простим (щодо "наївних" моделей і моделей, заснованих на усереднюванні), він не дозволяє враховувати сезонні коливання при прогнозуванні. Кажучи акуратніше, цей метод не може їх "бачити" в передісторії. Існує розширення методу Хольта до трьохпараметричного експоненціального згладжування. Цей алгоритм називається методом Вінтерса. При цьому робиться спроба врахувати сезонні складові даних. Система рівнянь, що описують метод Вінтерса виглядає таким чином:

Дріб в першому рівнянні служить для виключення сезонності з Y(t). Після виключення сезонності алгоритм працює з "чистими" даними, в яких немає сезонних коливань. З'являються вони вже в самому фінальному прогнозі, коли "чистий" прогноз, порахований майже по методу Хольта умножається на сезонний коефіцієнт.

 

 

Рисуунок 6 - Прогнозування методи Вінтерса.

 

 

Регресійні методи прогнозування

 

Разом з описаними вище методами, заснованими на експоненціальному згладжуванні, вже достатньо довгий час для прогнозування використовуються регресійні алгоритми. Коротко суть алгоритмів такого класу можна описати так. Існує прогнозована змінна Y (залежна змінна) і відібраний заздалегідь комплект змінних, від яких вона залежить, - X1, X2..., XN (незалежні змінні). Природа незалежних змінних може бути різною. Наприклад, якщо припустити, що Y - рівень попиту на деякий продукт в наступному місяці, то незалежними змінними можуть бути рівень попиту на цей же продукт в минулий і позаминулий місяці, витрати на рекламу, рівень платоспроможності населення, економічна обстановка, діяльність конкурентів і багато що інше. Головне - уміти формалізувати всі зовнішні чинники, від яких може залежати рівень попиту в числовій формі.

Модель множинної регресії в загальному випадку описується виразом

 

 

У простішому варіанті лінійної регресійної моделі залежність залежної змінної від незалежних має вигляд:

 

 

Тут підбирані коефіцієнти регресії

є -компонента помилки. Передбачається, що всі помилки незалежні і нормально розподілені. Для побудови регресійних моделей необхідно мати базу даних спостережень приблизно такого вигляду:

 

  Змінні
  Незалежні Залежна
X1 X2 ... XN Y
  x_11 x_12 ... x_1N Y_1
  x_21 x_22 ... x_2N Y_2
... ... ... ... ... ...
m x_M1 x_M2 ... x_MN Y_m

За допомогою таблиці значень минулих спостережень можна підібрати (наприклад, методом найменших квадратів) коефіцієнти регресії, побудувавши тим самим модель.

При роботі з регресією треба дотримуватися певної обережності і обов'язково перевірити на адекватність знайдені моделі. Існують різні способи такої перевірки. Обов'язковим є статистичний аналіз залишків, тест Дарбіна-Уотсона. Корисно, як і у випадку з нейронними мережами, мати незалежний набір прикладів, на яких можна перевірити якість роботи моделі.

 

Методи Бокса-Дженкінса (ARIMA)

 

В середині 90-х років минулого століття був розроблений принципово новий і достатньо могутній клас алгоритмів для прогнозування тимчасових рядів. Велику частину роботи по дослідженню методології і перевірці моделей була проведена двома статистиками, Г.Е.П. Боксом (G.E.P. Box) і Г.М. Дженкинсом (G.M. Jenkins). З тих пір побудова подібних моделей і отримання на їх основі прогнозів іноді називатися методами Бокса-Дженкінса. В це сімейство входить декілька алгоритмів, найвідомішим і використовуваним з них є алгоритм ARIMA. Він вбудований практично в будь-який спеціалізований пакет для прогнозування. У класичному варіанті ARIMA не використовуються незалежні змінні. Моделі спираються тільки на інформацію, що міститься в передісторії прогнозованих рядів, що обмежує можливості алгоритму. В даний час в науковій літературі часто згадуються варіанти моделей ARIMA, що дозволяють враховувати незалежні змінні. У даній доповіді вони розглядатись не будуть, обмежимось тільки загальновідомим класичним варіантом. На відміну від розглянутих раніше методик прогнозування тимчасових рядів, в методології ARIMA не передбачається якої-небудь чіткої моделі для прогнозування даної тимчасової серії. Задається лише загальний клас моделей, що описують часовий ряд і що дозволяють якось виражати поточне значення змінної через її попередні значення. Потім алгоритм, підстроюючи внутрішні параметри, сам вибирає найбільш відповідну модель прогнозування. Як вже наголошувалося вище, існує ціла ієрархія моделей Бокса-Дженкінса. Логічно її можна визначити так




Поделиться с друзьями:


Дата добавления: 2017-02-01; Просмотров: 120; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopediasu.com - Студопедия (2013 - 2026) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.012 сек.