Экология тепловой и атомной энергетики

Выбор методов многомерного анализа и особенности их реализации

Не только отклик Y модели (2.5), но и варьируемые переменные Xвi, Xиj могут быть измерены в различных шкалах: количественной, порядковой или бинарной (альтернативной). В зависимости от размерности признакового пространства и шкал представления данных, могут быть использованы различные математические методы обработки многомерных наблюдений, каждый из которых имеет свою область и особенности применения. В рамках настоящей монографии мы были не в состоянии детально описать и выполнить расчеты для всех многочисленных алгоритмов параметрической статистики и распознавания образов, поэтому в главе 8 ограничились некоторым "джентльменским" набором, руководствуясь при отборе соображениями популярности, доступности и личными симпатиями. Область применения каждого из использованных методов для различных шкал переменных представлена в табл. 2.4.

Таблица 2.4

Условия применения некоторых математических методов обработки многомерных наблюдений

Наименование метода

или алгоритма

Шкала измерения отклика Y

Использование обобщенных индексов

Шкала измерения обилия видов

Количественная

Порядковая

Альтернативная

Количественная

Порядковая

Альтернативная

1. Множественный регрессионный анализ

Å

nи > 0

2. Логистическая регрессия и упорядоченный пробит-анализ

Å

Å

nи > 0

3. Линейный дискриминантный анализ

Å

Å

nи > 0

4. Алгоритм вычисления индикаторных валентностей

Å

Å

nи = 0

Å

Å

Å

5. Построение разделяющей гиперплоскости (метод обобщенного портрета)

Å

nи = 0

Å

Å

6. Алгоритмы алгебры логики (метод «Кора»)

Å

nи = 0

Å

При использовании параметрических методов статистики, представленных в табл. 2.4 пунктами 1-3, надежность получаемых результатов может в значительной мере зависеть от характера распределения исходных переменных. При анализе моделей часто используются такие предположения, как равенство дисперсионных матриц, равенство условных вероятностей событий в пределах класса и априорных вероятностей наблюдения классов, равенство функций потерь и т.д. Размерность признакового пространства практически не должна превышать 250-300, иначе могут возникнуть трудности вычислительного характера при матричных преобразованиях.

Как убедительно свидетельствует работа В.Н. Максимова с соавт. [1999], применение методов математической статистики, основанных на стандартном анализе дисперсий и ковариаций, оказывается малоэффективным для оценки причинно-следственных связей в пространстве гидробиологических переменных, которые представляют собой сильно разреженные матрицы большой размерности, заполненные в основном нулями. Поскольку основная часть таксономических групп зообентоса встречается всего в нескольких пробах из ста, нельзя говорить о сколько-нибудь приблизительной нормальности распределения обилия видов: признаковое пространство очень обширно, плохо обусловлено и скорее дискретно, чем непрерывно. 

В связи с этим, применение классических параметрических методов 1-3 для обработки таблиц наблюдений в пространстве видов оказалось невозможным и, в качестве переменных моделей, использовались обобщенные индексы или показатели обилия таксонов, объединяющих группы видов. При использовании эвристических и непараметрических методов моделирования 4-6, которые не предъявляют жестких требований к таким свойствам исходных выборок, как нормальность распределения переменных, однородность дисперсий и т.п., имеется возможность детализации признакового пространства до уровня показателей обилия отдельных видов.


На главную