Экология тепловой и атомной энергетики

Классификация методов распознавания образов; области их применения, наличие ограничений и недостатков [Луценко, 1996]

Классификация
методов распознавания

Область
применения

Ограничения
(недостатки)

 

Методы, основанные на операциях с признаками

(интенсиональные методы)

Методы, основанные на оценках плотностей распределения значений признаков

Задачи с известным распределением (как правило, нормальным), необходимость набора большой статистики.

Необходимость перебора всей обучающей выборки при распознавании, высокая чувствительность к репрезентативности обучающей выборки и артефактам.

Методы, основанные на предположениях о классе решающих функций

Классы должны быть хорошо разделяемыми, система признаков - ортонормированной

Должен быть заранее известен вид решающей функции. Невозможность учета новых знаний о корреляциях между признаками.

Логические методы

Задачи небольшой размерности пространства признаков.

При отборе логических решающих правил (конъюнкций) необходим полный перебор. Высокая вычислительная трудоемкость.

Лингвистические (структурные) методы

Задачи небольшой размерности пространства признаков.

Задача восстановления (определения) грамматики по некоторому множеству высказываний (описаний объектов), является трудно формализуемой.

Методы, основанные на операциях с объектами

(экстенсиональные методы)

Метод сравнения с прототипом

Задачи небольшой размерности пространства признаков.

Высокая зависимость результатов классификации от меры расстояния (метрики).

Метод k-ближайших соседей

Задачи небольшой размерности по количеству классов и признаков.

Высокая зависимость результатов классификации от меры расстояния (метрики). Необходимость полного перебора обучающей выборки при распознавании. Вычислительная трудоемкость.

Алгоритмы вычисления оценок
(голосования) АВО

Задачи небольшой размерности по количеству классов и признаков.

Зависимость результатов классификации от меры расстояния (метрики). Необходимость полного перебора обучающей выборки при распознавании. Высокая техническая сложность метода.

Коллективы решающих правил

Задачи небольшой размерности по количеству классов и признаков.

Очень высокая техническая сложность метода, теоретические проблемы, как при определении областей компетенции частных методов, так и в самих частных методах.

Основными операциями в распознавании образов с помощью методов второй группы являются операции определения сходства и различия объектов. Дальнейшее разделение экстенсиональных методов на подклассы основано на различии в количестве диагностических прецедентов, которые используются для процесса решения: от одного в каждом распознаваемом классе (метод сравнения с прототипом) до полного объема выборки (алгоритмы АВО Ю.И. Журавлева [1978, Журавлев, Никифоров, 1971]). В частности, при классификации неизвестного объекта по методу k-ближайших соседей [Гренандер, 1979, 1981, 1983] находится заданное число (k) геометрически ближайших к нему в пространстве признаков других объектов с уже известной принадлежностью к распознаваемым классам. Дальнейшее решение принимается, например, с помощью простого подсчета голосов.

Так как различные алгоритмы распознавания проявляют себя по-разному на одной и той же выборке объектов, то закономерно встает вопрос о синтетическом решающем правиле, адаптивно использующем сильные стороны этих алгоритмов [Растригин, Эренштейн, 1981; Брусиловский, Розенберг, 1983; Брусиловский, 1987; Розенберг с соавт., 1994]. В коллективах решающих правил применяется двухуровневая схема распознавания. На первом уровне работают частные алгоритмы распознавания, результаты которых объединяются на втором уровне в блоке синтеза. Наиболее распространенные способы такого объединения основаны на выделении "областей компетентности", для которых доказана успешность работы какого-либо частного алгоритма распознавания.

Наряду с формальными методами распознавания образов полное и адекватное развитие в различных областях получили различные эвристические алгоритмы классификации и прогнозирования. Этот подход основывается на трудно формализуемых знаниях и интуиции исследователя, который сам определяет, какую информацию и каким образом нужно использовать для достижения требуемого эффекта распознавания. Примерами таких "авторских" методов являются процедура автоматической классификации геоботанических описаний [Розенберг, 1984] и алгоритм расчета индикаторных валентностей, представленный в главе 8.


На главную