Краткие содержания

Точечный и интервальный прогноз пример. Интервалы прогноза по уравнению регрессии. Прогнозирование экономической динамики на основе трендовых моделей

Средняя относительная по модулю ошибка

|Е ср | отн = |Е ср | / Y ср * 100% (3.4.25)

Эти показатели дают представление об абсолютной величине ошибки модели и о доле ошибки в процентном отношении к среднему значению результативного признака.

При использовании ретропрогноза - подхода, когда несколько последних уровней ряда оставляются в качестве проверочной последовательности - точность прогнозных оценок определяется на основе этих же показателей.

Лучшей по точности считается та модель, у которой все перечисленные характеристики имеют меньшую величину. Однако эти показатели по-разному отражают степень точности модели и потому нередко дают противоречивые выводы. Для однозначного выбора лучшей модели исследователь должен воспользоваться либо одним основным показателем, либо обобщенным критерием.

Идея социально-экономического прогнозирования базируется на предположении, что закономерность развития, действовавшая в прошлом (внутри ряда экономической динамики), сохранится и в прогнозируемом будущем. В этом смысле прогноз основан наэкстраполяции. Экстраполяция, проводимая в будущее, называетсяперспективной , а в прошлое – ретроспективной .

Прогнозирование методом экстраполяции базируется на следующих предположениях:

а) развитие исследуемого явления в целом описывается плавной кривой;

б) общая тенденция развития явления в прошлом и настоящем не указывает на серьезные изменения в будущем;

в) учет случайности позволяет оценить вероятность отклонения от закономерного развития.

Поэтому надежность и точность прогноза зависят от того, насколько близкими к действительности окажутся эти предположения и насколько точно удалось охарактеризовать выявленную в прошлом закономерность.

На основе построенной модели рассчитываются точечные и интервальные прогнозы. Точечный прогноз на основе временных моделей получается подстановкой в модель (уравнение тренда) соответствующего значения фактора времени, т.е. t =n +1, n +2,..., n +k .

Точное совпадение фактических данных и прогностических точечных оценок, полученных путем экстраполяции кривых, характеризующих тенденцию, имеет малую вероятность. Возникновение соответствующих отклонений объясняется следующими причинами.

1. Выбранная для прогнозирования кривая не является единственно возможной для описания тенденции. Можно подобрать такую кривую, которая дает более точные результаты.

2. Прогноз осуществляется на основании ограниченного числа исходных данных. Кроме того, каждый исходный уровень обладает еще и случайной компонентой. Поэтому и кривая, по которой осуществляется экстраполяция, также будет содержать случайную компоненту.


3. Тенденция характеризует движение среднего уровня ряда динамики, поэтому отдельные наблюдения могут от него отклоняться. Если такие отклонения наблюдались в прошлом, то они будут наблюдаться и в будущем.

Интервальные прогнозы строятся на основе точечных прогнозов. Доверительным интервалом называется такой интервал, относительно которого можно с заранее выбранной вероятностью утверждать, что он содержит значение прогнозируемого показателя. Ширина интервала зависит от качества модели, т.е. степени ее близости к фактическим данным, числа наблюдений, горизонта прогнозирования и выбранного пользователем уровня вероятности.

При построении доверительного интервала прогноза рассчитывается величина U(k), которая для линейной модели имеет вид:

, (3.4.27)

Стандартная ошибка (среднеквадратическое отклонение от модели), m – количество факторов в модели, для линейной модели m = 1.

Коэффициент является табличным значением t-статистики Стьюдента при заданном уровне значимости и числе наблюдений. Если исследователь задает уровень вероятности попадания прогнозируемой величины внутрь доверительного интервала, равной 70%, то при n =9 = 1,12. При вероятности, равной 95%, = 2,36.

Для других моделей величина U(k) рассчитывается аналогичным образом, но имеет более громоздкий вид. Как видно из формулы (3.10), величина U зависит прямо пропорционально от точности модели, коэффициента доверительной вероятности степени углубления в будущее на k шагов вперед, т.е. на момент t = n+k, и обратно пропорциональна объему наблюдений. Доверительный интервал прогноза будет иметь следующие границы:

– верхняя граница прогноза = Y прогноз (n+k ) + U (k );

– нижняя граница прогноза = Y прогноз (n+k ) – U (k ).

Если построенная модель адекватна, то с выбранной пользователем вероятностью можно утверждать, что при сохранении сложившихся закономерностей развития прогнозируемая величина попадает в интервал, образованный верхней и нижней границей.

После получения прогнозных оценок необходимо убедиться в их разумности и непротиворечивости оценкам, полученным иным способом.

Идея социально-экономического прогнозирования базируется на предположении, что закономерность развития, действовавшая в прошлом (внутри ряда экономической динамики), сохранится и в прогнозируемом будущем. В этом смысле прогноз основан наэкстраполяции. Экстраполяция, проводимая в будущее, называетсяперспективной , а в прошлое – ретроспективной .

Прогнозирование методом экстраполяции базируется на следующих предположениях:

а) развитие исследуемого явления в целом описывается плавной кривой;

б) общая тенденция развития явления в прошлом и настоящем не указывает на серьезные изменения в будущем;

в) учет случайности позволяет оценить вероятность отклонения от закономерного развития.

Поэтому надежность и точность прогноза зависят от того, насколько близкими к действительности окажутся эти предположения и насколько точно удалось охарактеризовать выявленную в прошлом закономерность.

На основе построенной модели рассчитываются точечные и интервальные прогнозы. Точечный прогноз на основе временных моделей получается подстановкой в модель (уравнение тренда) соответствующего значения фактора времени, т.е. t =n +1,n +2,..., n +k .

Точное совпадение фактических данных и прогностических точечных оценок, полученных путем экстраполяции кривых, характеризующих тенденцию, имеет малую вероятность. Возникновение соответствующих отклонений объясняется следующими причинами.

    Выбранная для прогнозирования кривая не является единственно возможной для описания тенденции. Можно подобрать такую кривую, которая дает более точные результаты.

    Прогноз осуществляется на основании ограниченного числа исходных данных. Кроме того, каждый исходный уровень обладает еще и случайной компонентой. Поэтому и кривая, по которой осуществляется экстраполяция, также будет содержать случайную компоненту.

    Тенденция характеризует движение среднего уровня ряда динамики, поэтому отдельные наблюдения могут от него отклоняться. Если такие отклонения наблюдались в прошлом, то они будут наблюдаться и в будущем.

Интервальные прогнозы строятся на основе точечных прогнозов. Доверительным интервалом называется такой интервал, относительно которого можно с заранее выбранной вероятностью утверждать, что он содержит значение прогнозируемого показателя. Ширина интервала зависит от качества модели, т.е. степени ее близости к фактическим данным, числа наблюдений, горизонта прогнозирования и выбранного пользователем уровня вероятности.

При построении доверительного интервала прогноза рассчитывается величина U(k), которая длялинейной модели имеет вид:

, (3.4.27)

- стандартная ошибка (среднеквадратическое отклонение от модели),m количество факторов в модели, для линейной моделиm = 1.

Коэффициент 5 является табличным значением t-статистики Стьюдента при заданном уровне значимости и числе наблюдений. Если исследователь задает уровень вероятности попадания прогнозируемой величины внутрь доверительного интервала, равной 70%, то при n =9 = 1,12. При вероятности, равной 95%, = 2,36.

Для других моделей величина U(k) рассчитывается аналогичным образом, но имеет более громоздкий вид. Как видно из формулы (3.10), величина U зависит прямо пропорционально от точности модели, коэффициента доверительной вероятности степени углубления в будущее на k шагов вперед, т.е. на момент t = n +k, и обратно пропорциональна объему наблюдений. Доверительный интервал прогноза будет иметь следующие границы:

– верхняя граница прогноза = Y прогноз (n +k ) + U (k );

– нижняя граница прогноза = Y прогноз (n +k ) – U (k ).

Если построенная модель адекватна, то с выбранной пользователем вероятностью можно утверждать, что при сохранении сложившихся закономерностей развития прогнозируемая величина попадает в интервал, образованный верхней и нижней границей.

После получения прогнозных оценок необходимо убедиться в их разумности и непротиворечивости оценкам, полученным иным способом.

Интервальные прогнозы строятся на основе точечных прогнозов. Доверительным интервалом называется такой интервал, относительно которого можно с заранее выбранной вероятностью утверждать, что он содержит значение прогнозируемого показателя.

Ширина интервала зависит от качества модели (т.е. степени ее близости к фактическим данным), числа наблюдений, горизонта прогнозирования, выбранного пользователем уровня вероятности и других факторов.

При построении доверительного интервала прогноза рассчитывается величина U(k), которая для линейной модели имеет вид

где S e – стандартная ошибка (среднеквадратическое отклонение от линии тренда);

n-р – число степеней свободы (для линейной модели у=а 0 +a 1 t количество параметров p = 2).

Коэффициент t a – табличное значение t-статистики Стьюдента при заданном уровне значимости и числе наблюдений. (Табличное значение t a можно получить с помощью функции Ехсеl СТЬЮДРАСПОБР).

Доверительный интервал прогноза будет иметь следующие границы:

Y прогн(n + k) + U(k) – верхняя граница; Y прогн(n + k) - U(k) – нижняя граница.

Если построенная модель адекватна, то с выбранной пользователем вероятностью можно утверждать, что при сохранении сложившихся закономерностей развития прогнозируемая величина попадает в интервал, образованный верхней и нижней границей. После получения прогнозных оценок необходимо убедиться в их разумности и непротиворечивости оценкам, полученным иным способом.

При краткосрочном прогнозировании обычно более важна динамика исследуемого показателя на конце периода наблюдений, а не тенденция его развития, сложившаяся в среднем на всем периоде предыстории. Свойство динамичности развития экономических процессов часто преобладает над свойством инерционности. Поэтому более эффективными являются адаптивные методы, учитывающие информационную неравноценность данных. Цель адаптивных методов – построение самокорректирующихся (самонастраивающихся) экономико-математических моделей, способных отражать изменяющиеся во времени условия и давать достаточно точные оценки будущих членов данного ряда.

Основные методы оценки качества прогноза

Важным этапом прогнозирования является верификация прогнозов, т.е. оценки их точности и обоснованности. На этапе верификации используют совокупность критериев, способов и процедур которые дают возможность оценить качество прогноза.

Наиболее распространенная ретроспективная оценка прогноза, т.е. оценка прогноза для прошедшего времени. Для этого исходная информация делится на две части, одна из которых охватывает более ранние данные, а другая - более поздние. С помощью данных первой группы (ретроспекции) оцениваются параметры модели прогноза, а данные второй группы рассматриваются как фактические данные прогнозируемого показателя. Полученная ретроспективно ошибка прогноза определенной степени характеризует точность применяемой методики прогнозирования.


Все показатели, используемые для анализа качества прогноза, можно разделить на три группы: абсолютные, сравнительные и качественные.

К абсолютным относятся показатели , позволяющие количественно определить величину ошибки прогноза в единицах измерения прогнозируемого объекта или в процентах:

Средняя ошибка прогноза показывает, на сколько в среднем будут отличаться фактические значения от расчетных при большом числе прогнозов. Этот показатель, как правило, используется при сравнении точности прогнозов разнородных объектов прогнозирования. Для оценки качества прогноза учитывают следующие виды ошибок:

- ME - Средняя ошибка (MeanError);

- МАЕ - Средняя абсолютная ошибка (MeanAbsoluteError);

- MSE - Среднеквадратическая ошибка (MeanSquaredError);

- MPE - Средняяпроцентнаяошибка (Mean Percentage Error);

- MAPE - Средняя абсолютная процентная ошибка (MeanAbsolutePercentageError).

Наибольшее распространение для оценки качества прогноза получила средняя абсолютная процентная ошибка (MAPE ), отображающая среднеарифметическую относительную погрешность на прогнозируемом интервале.

Сравнительные показатели точности прогноза основываются на сравнении ошибки рассматриваемого прогноза с эталонными прогнозам определенного вида

Один из типов таких показателей К) может быть в общем виде представлен так:

где р * - прогнозируемое значение величины эталонного прогноза

Качественные показатели точности прогноза дают возможность провести анализ видов ошибок прогноза, разделить их на составные Особенно такой анализ является важным для переменных, циклически меняются, когда необходимо прогнозировать не только общее направление развития, но и поворотные точки циклу.

Одним из методов такого анализа является диаграмма \"прогноз - реализация\" Сущность метода заключается в построении точечных прогнозов в координатах, в которых на одной оси откладывается реальное значение переменной, на другой ее прогнозируемое значение. Использование диаграммы позволяет содержательно оценить качество различных прогнозов, рассчитать коэффициенты, анализируют качество прогнозирования поворотных точек, выделить наиболее типичные ошибки (недооценки или переоценки изменений).

Идея социально-экономического прогнозирования базируется на предположении, что закономерность развития, действовавшая в прошлом (внутри ряда экономической динамики), сохранится и в прогнозируемом будущем. В этом смысле прогноз основан на экстраполяции. Экстраполяция, проводимая в будущее, называет­ся перспективной, а в прошлое - ретроспективной.

Прогнозирование методом экстраполяции базируется на сле­дующих предположениях:

а) развитие исследуемого явления в целом описывается плавной кривой;

б) общая тенденция развития явления в прошлом и настоящем не указывает на серьезные изменения в будущем;

в) учет случайности позволяет оценить вероятность отклонения от закономерного развития.

Поэтому надежность и точность прогноза зависят от того, насколько близкими к действительности окажутся эти предполо­жения и насколько точно удалось охарактеризовать выявленную в прошлом закономерность.

На основе построенной модели рассчитываются точечные и интервальные прогнозы. Точечный прогноз на основе временных моделей получается подстановкой в модель (уравнение тренда) соответствующего значения фактора времени, т.е. t = n+1 , п+2 , …, n+к.

Точное совпадение фактических данных и прогностических точечных оценок, полученных путем экстраполяции кривых, ха­рактеризующих тенденцию, имеет малую вероятность. Возник­новение соответствующих отклонений объясняется следующими причинами.

1. Выбранная для прогнозирования кривая не является единствен­но возможной для описания тенденции. Можно подобрать такую кривую, которая дает более точные результаты.

2. Прогноз осуществляется на основании ограниченного числа исходных данных. Кроме того, каждый исходный уровень об­ладает еще и случайной компонентой. Поэтому и кривая, по которой осуществляется экстраполяция, также будет содержать случайную компоненту.

3. Тенденция характеризует движение среднего уровня ряда ди­намики, поэтому отдельные наблюдения могут от него откло­няться. Если такие отклонения наблюдались в прошлом, то они будут наблюдаться и в будущем.

Интервальные прогнозы строятся на основе точечных прогнозов. До верительным интервалом называется такой интервал, относительно которого можно с заранее выбранной вероятностью утверждать, что он содержит значение прогнозируемого показателя. Ширина интервала зависит от качества модели, т.е. степени ее близости к фактическим данным, числа наблюдений, горизонта прогнозирования и выбранного пользователем уровня вероятности.

При построении доверительного интервала прогноза рассчитывается величина U(к), которая для линейной модели имеет вид

(3.11)

Стандартная ошибка (среднеквадратическое откло­нение от модели);

m - количество факторов в модели, для линейной моде­ли т = 1 .

Коэффициент является табличным значением t -статистики Стьюдента при заданном уровне значимости и числе наблюде­ний. Если исследователь задает уровень вероятности попадания прогнозируемой величины внутрь доверительного интервала, равной 70%, то при n = 9 = 1,12. При вероятности, равной 95%, = 2,36.

Для других моделей величина U(к) рассчитывается аналогичным образом, но имеет более громоздкий вид. Как видно из формулы (3.10), величина U зависит прямо пропорционально от точности модели, коэффициента доверительной вероятности степени углубления в будущее на k шагов вперед, т.е. на момент t = n + k и обратно пропорциональна объему наблюдений. Доверительный интервал прогноза будет иметь следующие границы:

Верхняя граница прогноза = Y прогноз (n + к) + U(к);

Нижняя граница прогноза = Y прогноз (n + к) - U(к).

Если построенная модель адекватна, то с выбранной пользова­телем вероятностью можно утверждать, что при сохранении сло­жившихся закономерностей развития прогнозируемая величина попадает в интервал, образованный верхней и нижней границей.

После получения прогнозных оценок необходимо убедиться в их разумности и непротиворечивости оценкам, полученным иным способом.

3.2. ИСПОЛЬЗОВАНИЕ НАДСТРОЙКИ EXCEL АНАЛИЗ ДАННЫХ ДЛЯ МОДЕЛИРОВАНИЯ ВРЕМЕННЫХ РЯДОВ

Установка Пакета анализа

Ни в одном меню стандартной конфигурации программы Excel вы не найдете указания на Пакет анализа. Даже после установки с компакт-диска Excel он не появится в меню Сервис до тех пор, пока вы не выполните следующие действия:

1) выберите команду Сервис => Надстройки;

2) в диалоговом окне Надстройки (рис. 3.2) установите флажок Пакет анализа, а затем нажмите кнопку 0К;

3) выберите команду Сервис => Анализ данных. Если в меню отсут­ствует команда Анализ данных, то необходимо выполнить установку Пакета анализа с компакт-диска Excel. После этого в нижней части меню Сервис появится новая команда Анализ данных, которая предоставляет доступ к средствам анализа. Для активизации надстройки Пакет анализа следует установить соответствующий флажок.

Пример 3.1. Проверка наличия тренда.

Один из способов проверки обнаружения тренда основан на сравнении средних уровней ряда: временной ряд разбивают на две примерно равные по числу уровней части, каждая из которых рассматривается как некоторая самостоятельная выборочная со­вокупность, имеющая нормальное распределение. Если времен­ной ряд имеет тенденцию к тренду, то средние, вычисленные для каждой совокупности, должны существенно (значимо) различаться между собой. Если же расхождение незначительно, несуществен­но (случайно), то временной ряд не имеет тенденции. Таким об­разом, проверка наличия тренда в исследуемом ряду сводится к проверке гипотезы о равенстве средних двух нормально распре­деленных совокупностей.

Определим наличие основной тенденции (тренда) по данным табл. 3.1 (рис. 3.3).

Для расчета доверительного интервала прогноза необходимо определить среднюю ошибку положения линии регрессии при заданном значении Другими словами, необходимо определить стандартную ошибку, предсказываемого по линии регрессии среднего значения экономического результата, при заданном значении Из предположения о независимости ошибок и следует независимость случайной величины (которая зависит только от ) и случайной величины (которая не зависит от в силу предпосылок МНК о случайности остатков). Тогда –по правилу сложения дисперсий независимых случайных величин.

В уравнении регрессии проведем усреднение и выделим параметр : . Последнее слагаемое равно 0 в силупредпосылок МНК. Теперь перепишем уравнение регрессии в виде:

Отсюда, зависит от дисперсии ошибки среднего значения величины , определенной при участии и дисперсии коэффициента . Имеем

Поскольку суммы теоретических (генеральных) и выборочных значений результативного признака совпадают, т.е. , то совпадают и средние значения этих рядов . Отсюда следует выражение для дисперсии первого слагаемого . Дисперсия коэффициента регрессии , как уже было показано, дается формулой .

Таким образом, формула для расчета стандартной дисперсии ошибки, предсказываемого по линии регрессии значения, имеет вид

Отсюда, ошибка положения лини регрессии при , дается формулой

Вычисленное значение позволяет сделать вывод, что в генеральной совокупности линия регрессии для фактора окажется в интервале

Очевидно, что величина стандартной ошибки будет минимальной, если и она будет возрастать при отклонении от . Таким образом, ошибка будет малой, если признак-фактор находится где-то вблизи центра корреляционного облака.

Если необходимо с некоторой вероятностью сделать прогноз расчетного значения ,по уравнению регрессии имея в виду уже генеральную совокупность статистических данных, то доверительный интервал дается выражением

Пусть , тогда .

Для интервального прогноза индивидуального значения (а не только одной линии регрессии, в целом, как прежде), найдем среднюю стандартную ошибку предсказываемого значения объема продаж. Она вычисляется как корень квадратный из суммы квадрата ошибки положения линии регрессии и остаточной (необъясненной) дисперсии

Индивидуальные значения y могут отклоняться от на величину случайной ошибки ε , рассчитываемой по остаточной дисперсии на одну степень свободы. Поэтому ошибка, предсказываемого отдельного значения, должна включать не только стандартную ошибку , которая характеризует положение линии регрессии, но и случайную ошибку (это добавляет 1-цу под знак корня).



Для индивидуального значения прогноза

где величина представляет собой табличное значение t- критерия Стьюдента на уровне значимости α при числе степеней свободы n –2.

Напомним, что доверительным интервалом называется такой интервал, для которого с наперед заданной вероятностью можно утверждать, что прогнозируемый показатель не выйдет за его пределы. Ширина интервала зависит от качества модели и выбранной вероятности.

К интервальному оцениванию прибегают при малых выборках, когда точечные оценки не являются устойчивыми. Объем выборки берется за основу, когда невозможно организовать сплошное наблюдение генеральной совокупности. Главная проблема эконометрического анализа, связанная с малой выборкой состоит в том, что случайные ошибки, измеряемой характеристики, подчиняются не гауссовскому закону распределения, а закону Стьюдента. В то время как распределение ошибок, исследуемой характеристики в генеральной совокупности, подчиняется гауссовскому закону или близкому к нему.

С точки зрения исходных статистических данных и уравнения регрессии качество модели определяется двумя показателями: адекватностью и точностью.

В общем случае различают два вида статистического прогнозирования: 1) факторное прогнозирование, основанное на количественном измерении параметров регрессии, в частности, коэффициента корреляции, значение которого предполагается неизменным; 2) авторегрессионное прогнозирование – по тренду и цикличности. К настоящему моменту мы рассматриваем – первое.

Вопросы для обсуждения

1. Объясните, чем вызвано появление в модели парной регрессии случайной переменной ε ?



2. Почему перед построением модели парной линейной регрессии необходимо рассчитывать коэффициент корреляции?

3. Объясните смысл понятия «число степеней свободы».

4. По каким вычислениям можно судить о значимости модели в целом?

5. Зачем необходимо рассчитывать t -критерий Стьюдента?

6. Зачем необходимо оценивать интервалы прогноза по линейному уравнению регрессии?

7. В каких пределах должна находиться ошибка аппроксимации, чтобы можно было сделать вывод о хорошем подборе модели к исходным данным?

8. В чем суть предсказания индивидуальных значений зависимой переменной?

9. В каких пределах находится коэффициент детерминации?

10. С увеличением объема выборки: а) увеличивается точность оценок; б) уменьшается ошибка регрессии; в) расширяются интервальные оценки; г) уменьшается коэффициент детерминации; д) увеличивается точность прогноза по модели. (Да; нет; не определено.Ответ поясните).