МГУА (часть 2)
Таким образом, критерий регулярности,
заключающийся в минимизации среднеквадратической ошибки на точках контрольной
последовательности:
;
(5)
максимизации коэффициента
корреляции:
.
(6)
Для получения результатов,
сравнимых для различных моделей, величины в вышеприведённых выражениях
необходимо нормировать:
, . (7)
Преимуществом критерия регулярности есть плавность
его изменения при увеличении сложности модели. Недостатком его есть низкая
точность при решении экстраполяционных задач.
Поэтому рекомендуется его применять для
краткосрочного прогноза или идентификации.
Таблица
3
По-прежнему
считаем исходные данные задан-
ными в таблице 3 и . Для применения
критерия регулярности данные необходимо разделить
на обучающую последовательность и проверочную. Очевидно, что
в обучающую последовательность
необходимо собрать узлы с большей дисперсией, а в проверочную - с
меньшей. Это вызвано тем, что область обучения должна быть как можно
шире, а контрольные узлы, в большинстве своём находится внутри неё.
Алгоритм разделения имеет
такой вид:
Шаг 0. Определить процентное
соотношение между количеством элементов в обучающей и контрольной
последовательности.
Шаг 1. Для каждого столбца , рассчитать среднее
значение его элементов
;
(8)
получим середину множества узлов (, ,.., ).
Шаг 2. Найти выборочные дисперсии
для каждого узла таблицы по формуле
. (9)
Шаг 3. Для упорядочивания таблицы переставить строки так, чтобы первой была
строка с наибольшей дисперсией, а последней – с наименьшей.
Шаг 4. В соответствии с допущением шага 0, разделить данные в таблице на
обучающую и контрольную последовательности.
Если
решается задача краткосрочного прогноза (на один такт времени вперёд), то ищут
ещё и оптимальное соотношение количества узлов в обучающей последовательности
к количеству узлов в проверочной с целью получения наиболее простой и достоверной
модели.
Известны три вида критерия несмещённости: основанные на анализе решений, на анализе
коэффициентов, и “критерий относительной несмещённости”.
- Критерий несмещённости, основанный на анализе решений (КН1).
Для расчёта КН1 необходимо
ранжировать по возрастанию или убыванию дисперсии все точки экспериментов.
Процедура вычисления дисперсии описана выше. Пос-
ле ранжирования точки экспериментов
нумеруют и делят на две последовательности:
-
к первой относят точки с чётными номерами, их ;
-
ко второй – с нечётными, их ; .
На первом ряду селекции первая
последовательность является обучающей, вторая – контрольной. Полученные на
обучающей последовательности () уравнения регрессии обозначим . Далее первая последовательность будет контрольной, вторая
– обучающей. На обучающей последовательности находим уравнения регрессии . Количество уравнений и должно совпадать,
случай невыполнения этого условия здесь не рассматриваем. Для каждого из рассматриваем
среднеквадратическое отклонение
.
(10)
Из всех уравнений выбираем уравнений, имеющих
меньшую оценку (можно из или ). Среднее
значение критерия несмещённости на первом ряду
селекции вычисляем по формуле:
.
(11)
На втором и последующих рядах селекции
процедура остаётся той же. Селекция продолжается до тех пор, пока среднее
значение критерия несмещённости
убывает.
- Критерий несмещённости, основанный на анализе коэффициентов (КН2).
Точки коэффициентов ранжируем по дисперсии и делим на
обучающую и контрольную последовательности пополам. Точки с
большей дисперсией попадают в обучающую последовательность, с меньшей – в
контрольную. Особенность критерия в том, что на каждом ряду селекции
ранжирование и разделение точек выполняется заново. Кроме того, уменьшается
свобода выбора, согласно формулы , где - число переменных,
пропущенных на этом ряду селекции, - номер ряда, - число входных
переменных, , . Формула и процедура, с ней связанные дают возможность
ускорения решения задач большой размерности.
|