КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Методом общего расстояния
Алгоритм классификации методом общего расстояния является типичным примером эвристического алгоритма, основная идея которого заключается в том, что совокупность объектов, находящихся на одинаковом расстоянии от каждого из k эталонов, образует компактную группу. Пусть для классификации имеется выборка A1.….AN. представленная в виде матриц размером в m профилей и n пикетов, причем каждый объект этой выборки характеризуется вектором признаков
Тогда схема алгоритма имеет вид: -для всех
-каждый признак центрируется на соответствующее значение среднего aijk = aijk - Sк. -для всех
-каждый признак нормируется на соответствующее значение среднеквадратического отклонения:
-для каждого из признаков выбирается -рассчитывается матрица (для каждого признака) средних расстояний от объекта до эталонов. -выбирается общий порог d0 . -осуществляется классификация приведенных к однородности признаков по правилу, каждому объекту Xi ставится в соответствие код из k двоичных символов Выборка разбивается на классы. Объекты, относящиеся к одному классу, имеют одинаковый код. Существенно повысить качество конечной классификации данного алгоритма позволяет учет следующих замечаний: 1.Нормировка данных по каждому признаку только на обычную дисперсию, из-за специфики геофизических наблюдений, для которых характерно наличие “ураганных” значений, не позволяет решать задачу нормировки корректно. Как показали исследования, качество классификации значительно улучшается, если стандартную нормировку на дисперсию, дополнить нормировкой на межэталонную дисперсию:
2.Мера сходства, также является важнейшим фактором качества классификации. Наиболее эффективным является следующий подход решения этой задачи: -по каждому признаку рассчитываются средние расстояния от всех анализируемых точек исходной сети до эталонов s1=…=sp. -находится общее среднее по всем признакам -величина 0.3
Дата добавления: 2015-06-26; Просмотров: 443; Нарушение авторских прав?; Мы поможем в написании вашей работы! |