ОПТИМИЗАЦИЯ ПРОЦЕССА ПРЕДОБРАБОТКИ ИНФОРМАЦИИ В СИСТЕМАХ КЛАСТЕРИЗАЦИИ ВЫСОКОРАЗМЕРНЫХ ДАННЫХ

S. A. Babichev

Анотація


Представлена методика выбора оптимального метода нормализации при построении кластерной структуры объектов, отличительной особенностью которых является высокая размерность признакового пространства. В качестве основного критерия оценки качества предобработки данных использовался критерий энтропия Шеннона и относительное изменение энтропии в процессе трансформации данных. Понижение размерности признакового пространства исследуемых объектов производилось при помощи компонентного анализа. Построена модель системы кластеризации с использованием алгоритма нечеткой кластеризации fuzzy C-means, при помощи которой произведена оценка качества кластеризации при использовании различных методов предобработки данных. Показано, что для исследуемых данных наилучшим методом  нормализации является метод десятичного масштабирования, при котором энтропия обработанного сигнала принимает наименьшее значение, при этом в процессе трансформации данных компонентным анализом относительное изменение энтропии не превышает допустимых норм.

Ключові слова


Кластеризация, размерность признакового пространства, нормализация, энтропия.

Повний текст:

PDF




Адреса редакції журналу:
Редакція журналу «РІУ», Запорізький національний технічний університет, 
вул. Жуковського, 64, м. Запоріжжя, 69063, Україна. 
Телефон: 0 (61) 769-82-96 – редакційно-видавничий відділ
E-mail: rvv@zntu.edu.ua

При повному або частковому використаннi матерiалiв посилання на журнал є обов’язковим.