Экология тепловой и атомной энергетики

Эмпирико-статистические модели

Мем № 16: «Мы имеем по крайней мере одно весьма серьезное преимущество – владеем вероятностным мышлением» А.Н. Колмогоров [цит. по: Леонов, URLв].

Сущность, определения, классификация

Эмпирико-статистические модели объединяют в себе практически все биометрические методы первичной обработки экспериментальной информации. Основная цель построения этих моделей состоит в следующем:

упорядочение или агрегирование экологической информации;

поиск, количественная оценка и содержательная интерпретация причинно-следственных отношений между переменными экосистемы;

оценка достоверности и продуктивности различных гипотез о взаимном влиянии наблюдаемых явлений и воздействующих факторов;

идентификация параметров расчетных уравнений различного назначения.

Часто эмпирико-статистические модели являются "сырьем" и обоснованием подходов к построению моделей других типов (в первую очередь, имитационных).

Важным методологическим вопросом является определение характера зависимости между факторами и результативными показателями: функциональная она или стохастическая, прямая или обратная, прямолинейная или криволинейная и т.д. Здесь используются теоретико-статистические критерии, практический опыт, а также способы сравнения параллельных и динамичных рядов, аналитических группировок исходной информации, графические методы и др.

Детерминированный анализ представляет собой методику исследования влияния факторов, связь которых с результативным показателем носит явно выраженный функциональный характер, т.е. когда результативный показатель представляется в виде произведения, частного или алгебраической суммы исходных факторов. Многочисленными примерами детерминированного подхода являются методики расчета различных гидрохимических и гидробиологических индексов, приведенных в части 2. В этих случаях исследователь сам берет на себя ответственность в том, что:

причинно-следственная связь между изучаемыми явлениями действительно существует;

эта связь носит именно постулируемый функциональный характер (аддитивный, мультипликативный, кратный или смешанный с заранее подобранными коэффициентами, отражающими субъективный опыт разработчика).

Стохастический анализ представляет собой обширный класс методов, опирающихся на теоретико-вероятностные представления, теоремы, критерии и методы параметрической и непараметрической статистики.

Исходный объект в любой системе обработки данных – это эмпирический ряд наблюдений или выборка. Выборки, описывающие явления и процессы в экосистеме, находятся во взаимосвязи, взаимозависимости и обусловленности. При этом каждое явление можно рассматривать и как причину, и как следствие. Одни выборки могут быть непосредственно связаны между собой, образуя подмножества сопряженных данных, другие могут соотноситься друг с другом косвенно.

Согласно классификации статистических методов, принятой в [Прикладная статистика.., 1987; Орлов, URLа,б], прикладная статистика делится на следующие четыре области:

статистика (числовых) случайных величин;

многомерный статистический анализ;

статистика временных рядов и случайных процессов;

статистика объектов нечисловой природы.

В вероятностной теории статистики выборка – это совокупность независимых одинаково распределенных случайных элементов. Природа этих элементов может быть различной. В классической математической статистике (той, что обычно преподают студентам) элементы выборки – это числа. Многомерный статистический анализ оперирует с векторами и матрицами данных. В нечисловой статистике элементы выборки – это объекты нечисловой природы, которые нельзя складывать и умножать на числа (другими словами, объекты нечисловой природы лежат в пространствах, не имеющих формальной векторной структуры).

Следует оговориться, что не существует какой-либо однозначной классификации эмпирико-статистических методов. Например, широкий пласт методов кластерного анализа, распознавания образов, анализа экспертных оценок и др., подробно описанных в части 3, занимают промежуточное положение: используя некоторые теоремы классической теории вероятностей, они имеют принципиально детерминированные механизмы поиска и основаны на эвристических алгоритмах. В связи с этим, говоря в дальнейшем о «статистике», мы будем понимать ее в широком смысле, в полном соответствии с приведенными ниже цитатами

«Статистика – это бюджет вещей» [Наполеон Бонапарт, цит. по: Las Gases, "Memorial de Sainte-Helene", 1835];

«Существует три вида лжи – невинная ложь, наглая ложь и статистика» [Марк Твен];

«Математическая статистика – это ветвь теории вероятностей. В ней рассматриваются задачи, связанные с оперативными характеристиками правил индуктивного поведения, основанных на случайных экспериментах» [Ю. Нейман, 1968];

«Статистика – это математическая теория того, как узнать нечто о мире через опыт» [У. Томпсон, W. Thompson, "The Future of Statistics"];

«Статистика – это искусство уточнять то, что является неизвестным» [Д. Хуфф, D. Huff, "How to Lie with Statistics"];

«Статистика – это часть запутанной и переплетенной сети, связывающей математику, научную философию и другие отрасли наук…» [Дж. Тьюки, J. Tukey];

«Маркс и Энгельс стали, таким образом, основателями принципиально новой социалистической статистики… Данные пролетарской статистики применяются для ведения классовой борьбы и укрепления международного движения за мир путем разоблачения махинаций империалистов» [А. Киндельбергер, A. Kindelberger, "Wie arbeitet die Statistik?"];

«Я думаю, было вообще большой ошибкой изобрести термин "математическая статистика". Этот крупный промах привел к возникновению большого числа трудностей» [Дж. Бокс, G. Box].

Несмотря на неопределенность в трактовке самого термина «статистика», мировой научной общественностью предпринимаются последовательные шаги по унификации конкретных методик статистического анализа. Например, в 1978 г. редакторы нескольких ведущих медицинских и биологических журналов собрались в Ванкувере (Канада), где и сделали первую попытку выработать технические требования к схемам представления результатов статистической обработки в рукописях, направляемых в редактируемые ими журналы. В настоящее время "Единые требования к рукописям", подготовленные Ванкуверской группой, становятся международным стандартом в статистике и действенным механизмом в стремлении повысить доказательность и надежность публикуемых сообщений.

В.П. Леонов, редактор электронного журнала БИОМЕТРИКА (www.biometrica.tomsk.ru); взял на себя труд перевести требования Ванкуверской группы, дополнив их рекомендациями ведущих российских статистиков и собственным опытом. Мы приводим без сокращений эту достаточно обширную таблицу, любезно предоставленную В.П. Леоновым, еще и потому, что она является своеобразным расширенным "классификатором" статистических методов и критериев.


На главную