Please use this identifier to cite or link to this item: https://dspace.uzhnu.edu.ua/jspui/handle/lib/42208
Title: Комбіновані методи ідентифікації неповних дублікатів у наукових публікаціях
Authors: Лізунов, Петро Петрович
Білощицький, Андрій Олександрович
Кучанський, Олександр Юрійович
Андрашко, Юрій Васильович
Keywords: послідовності збігів, неповні дублікати, плагіат, наукова публікація
Issue Date: 2021
Publisher: КНУБА
Citation: Лізунов П. П., Білощицький А. О., Кучанський О. Ю., Андрашко Ю. В. Комбіновані методи ідентифікації неповних дублікатів у наукових публікаціях.Управління розвитком складних систем.Київ, 2021. No 48.С. 85–94, dx.doi.org\10.32347/2412-9933.2021.48.85-94.
Abstract: Розглянуто розпізнавання неповних дублікатів зображень та таблиць. З метою розпізнавання графічних даних (для класифікації та стиснення зображень) використовується вейвлет-аналіз з набором класичних характеристичних функцій: вейвлети Морле і Хаара, вейвлет мексиканський капелюх тощо. Застосовуються також особливі види фільтрів, що будуються на основі так званих риджлет-, курвлет-та бимлет-перетворень. Розглянуто основні класичні методи кластеризації колекції зображень, що можуть бути використані для пошуку неповних дублікатів у графічнихданих електронних документів. Проаналізовано метод Гарріса, який дає змогу визначати опорні точки зображень за рахунок вимірювання інтенсивності яскравості зображення. Також проаналізовано технологію SIFT (масштабно-інваріантне перетворення ознак), яка є потужним засобом формування системи інваріантних структурних ознак, розглянуто ще один клас методів, які вирізняються простотою реалізації та застосування для виявлення неповних дублікатів зображень –хеш-методи. Описано, що для RGB-зображення існує три таких сигнали: яскравість у каналах Red, Green та Blue. В обробці сигналів і суміжних галузей перетворення Фур'є зазвичай розглядається декомпозиція сигналу на частоти та амплітуди. Розглянуто метод виявлення контекстно-залежних значень та індексації текстових даних, який допомагає знаходити неповні дублікати в таблицях з урахуванням текстового і числового представлення даних. Аналогічно за описаним методом можна провести індексацію даних числового і текстового типів, якщо вони розміщуються не в таблиці, а всередині контенту електронного документа. Результати дослідження використовуються в комплексі із системою виявлення неповних дублікатів у наукових документах, зокрема дисертаціях на здобуття наукового ступеня
Type: Text
Publication type: Стаття
URI: https://dspace.uzhnu.edu.ua/jspui/handle/lib/42208
ISSN: 2412-9933
Appears in Collections:Наукові публікації кафедри cистемного аналізу та теорії оптимізації

Files in This Item:
File Description SizeFormat 
259416-Текст статті-596919-1-10-20220619.pdf496.61 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.