Please use this identifier to cite or link to this item: https://dspace.uzhnu.edu.ua/jspui/handle/lib/38101
Title: Використання мiр подiбностi в методах класифiкацiї
Other Titles: Use of similarity measures in classification methods.
Authors: Кондрук, Наталія Емерихівна
Keywords: класифiкацiя, алгоритм k-найближчих сусiдiв, KNN, мiра подiбностi, контрольоване машинне навчання
Issue Date: 2021
Publisher: Видавництво УжНУ "Говерла"
Citation: Кондрук, Н. Е. Використання мiр подiбностi в методах класифiкацiї [Текст] / Н. Е. Кондрук // Науковий вісник Ужгородського університету : серія Математика і Інформатика / редкол. М. М. Маляр. – Ужгород : Говерла, 2021. – Вип. 38№1. – С. 143-148. – Бібліогр.: с. 146-148 (12 назв). – Рез. укр., англ.
Series/Report no.: Математика і інформатика;
Abstract: Дане дослiдження є розвитком напрямку застосування рiзних видiв мiр подiбно- стi в задачах iнтелектуального аналiзу даних. Майнiнг даних – це процес видобутку неявної iнформацiї з бази даних, якa характеризує прихованi зв’язки та структури. Прогнозується, що цей вид аналiзу стане надзвичайно затребуваним протягом насту- пного десятилiття. В роботi наведено огляд сучасних напрямкiв контрольованої класи- фiкацiї. Найпопулярнiшим прийомом класифiкацiї об’єктiв iз числовими атрибутами вважається метод K-найближчих сусiдiв (KNN). Встановлено, що прогнозне значен- ня мiтки класу можна покращити, якщо використовувати зважений вплив кожного сусiда на результат. Таким чином, доцiльно модифiкувати метод KNN. При цьому, запропоновано ввести функцiю, що характеризує схожiсть немiченого об’єкта iз йо- го найближчими сусiдами у виглядi мiри подiбностi. На її основi введено iндикатори зваженого пiдрахунку голосiв <сусiдiв> за певну мiтку класу. Розроблено програм- не забезпечення, що реалiзує описаний пiдхiд. Проведення практичних експериментiв показало його ефективнiсть при розв’язаннi певних класiв прикладних задач. Ключовi слова: класифiкацiя, алгоритм k-найближчих сусiдiв, KNN, мiра подiбно- нтрольоване машинне навчання.
This study is a development of the application of different types of similarity measures in data mining problems. Data mining is the process of extracting implicit information from a database, which characterizes hidden connections and structures. This type of analysis is projected to be extremely popular over the next decade. One of the methods of data extraction is classification. The paper provides an overview of modern areas of supervised classification. The most popular method of classifying objects with numerical attributes is the method of K-nearest neighbors (KNN). It has been found that the predictive value of a class label can be improved by using the weighted influence of each neighbor on the result. Thus, it is advisable to modify the KNN method. In this case, it is proposed to introduce a function that characterizes the similarity of the unlabeled object with its nearest neighbors in the form of a measure of similarity. Based on it, indicators of weighted counting of votes of neighbors for a certain class mark are introduced. Software has been developed that implements the described approach. Practical experiments have shown its effectiveness in solving certain classes of applied problems. Keywords: classification, algorithm k-nearest neighbors, KNN, similarity measures, su- pervised machine learning.
Type: Text
Publication type: Стаття
URI: https://dspace.uzhnu.edu.ua/jspui/handle/lib/38101
ISSN: 2708-9568
Appears in Collections:Науковий вісник УжНУ Серія: Математика і інформатика. Випуск №1 (38) - 2021

Files in This Item:
File Description SizeFormat 
Використання мір.pdf476.63 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.