Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал: https://dspace.uzhnu.edu.ua/jspui/handle/lib/58076
Повний запис метаданих
Поле DCЗначенняМова
dc.contributor.authorBoyko, N. I.-
dc.contributor.authorTkachuk, O. A.-
dc.date.accessioned2024-01-30T16:14:47Z-
dc.date.available2024-01-30T16:14:47Z-
dc.date.issued2023-
dc.identifier.citationBoyko, N. I. Clustering algorithms and methods for diverse data / N. I. Boyko, O. A. Tkachuk // Науковий вісник Ужгородського університету : серія: Математика і інформатика / редкол. М. М. Маляр (гол. ред.), Г. І. Сливка-Тилищак, Ю. В. Андрашко та ін. – Ужгород : Говерла, 2023. – Т. 1, Вип. 42. – С. 129–147. – Рез.: англ., укр. – Бібліогр.: с. 145–147 (15 назв)uk
dc.identifier.issn2616-7700-
dc.identifier.urihttps://dspace.uzhnu.edu.ua/jspui/handle/lib/58076-
dc.description.abstractThe study is dedicated to the comprehensive investigation of clustering methods for diverse data. The research is focused on the problems of graphic format algorithms, which is conditioned by the presence of 12 different features for clustering, 7 of which were categorical. The data is presented along 12 axes in a graphical format. To solve the problem the PCA algorithm was applied with further transformation of categorical features into numerical for dimensionality reduction to 2 components and further orthogonal superimposition of clusters on them. Clustering using the k-prototype method was provided. A sixfold decrease in PCA algorithm has drawbacks such as enormous data loss which was presented. Based on the list of conducted experiments on hierarchical clustering the pros and cons can be seen for this approach. The complexity of clustering which consists in representation of results from the analysis of big data was provided. The KAMILA algorithm that is based on distributed computing models MapReduce and gives a significant advantage was described.uk
dc.description.abstractДослiдження присвячено комплексному вивченню методiв кластеризацiї рiзнотипових даних. Дослiджуються проблеми алгоритмiв графiчного формату, що зумовленi наявнiстю 12-ти рiзних ознак для кластеризацiї, 7 з яких були категорiальнi. Представлене подання даних по 12-ти осях в графiчному форматi. Було вирiшено застосувати алгоритм PCA з перетворенням категорiальних ознак в числовi для зменшення розмiрностi даних до 2-х компонент й подальшого ортогонального накладання кластерiв на них. Наводиться застосування кластеризацiї методу к-прототипiв. Показане використання PCA для зменшення розмiрностi в 6 разiв приводить до значної втрати iнформацiї. Проведенi експерименти щодо iєрархiчної кластеризацiї рiзнотипових даних, можна вiдзначити переваги й недолiки даного пiдходу. Наведена складнiсть проведення кластеризацiї, яка полягає у представленнi результатiв аналiзу великих даних. Описаний алгоритм KAMILA, який реалiзований на моделi розподiлених обчислень MapReduce i дає значну перевагу по швидкодiї.uk
dc.language.isoenuk
dc.publisherВидавництво УжНУ "Говерла"uk
dc.relation.ispartofseriesМатематика і інформатика;-
dc.subjectexpectation-maximizationuk
dc.subjectStructural equation modelinguk
dc.subjectKAy-means for MIxedLArge datauk
dc.subjectLowest common ancestoruk
dc.subjectself-organizing mapuk
dc.subjectAdaptive resonance theoryuk
dc.subjectKernel Density Estimationuk
dc.subjectмаксимiзацiя очiкуванняuk
dc.subjectмоделювання структурних рiвняньuk
dc.subjectKAy- середнi для даних MIxedLArgeuk
dc.subjectнайменший спiльний предокuk
dc.subjectкарта самоорганiзацiїuk
dc.subjectтеорiя адаптивного резонансуuk
dc.subjectоцiнка щiльностi ядраuk
dc.titleClustering algorithms and methods for diverse datauk
dc.title.alternativeАлгоритми та методи кластеризацiї для рiзноманiтних данихuk
dc.typeTextuk
dc.pubTypeСтаттяuk
Розташовується у зібраннях:Науковий вісник УжНУ Серія: Математика і інформатика. Том 42 №1 - 2023

Файли цього матеріалу:
Файл Опис РозмірФормат 
CLUSTERING ALGORITHMS AND METHODS.pdf1.26 MBAdobe PDFПереглянути/Відкрити


Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.