Please use this identifier to cite or link to this item:
https://dspace.uzhnu.edu.ua/jspui/handle/lib/42208
Title: | Комбіновані методи ідентифікації неповних дублікатів у наукових публікаціях |
Authors: | Лізунов, Петро Петрович Білощицький, Андрій Олександрович Кучанський, Олександр Юрійович Андрашко, Юрій Васильович |
Keywords: | послідовності збігів, неповні дублікати, плагіат, наукова публікація |
Issue Date: | 2021 |
Publisher: | КНУБА |
Citation: | Лізунов П. П., Білощицький А. О., Кучанський О. Ю., Андрашко Ю. В. Комбіновані методи ідентифікації неповних дублікатів у наукових публікаціях.Управління розвитком складних систем.Київ, 2021. No 48.С. 85–94, dx.doi.org\10.32347/2412-9933.2021.48.85-94. |
Abstract: | Розглянуто розпізнавання неповних дублікатів зображень та таблиць. З метою розпізнавання графічних даних (для класифікації та стиснення зображень) використовується вейвлет-аналіз з набором класичних характеристичних функцій: вейвлети Морле і Хаара, вейвлет мексиканський капелюх тощо. Застосовуються також особливі види фільтрів, що будуються на основі так званих риджлет-, курвлет-та бимлет-перетворень. Розглянуто основні класичні методи кластеризації колекції зображень, що можуть бути використані для пошуку неповних дублікатів у графічнихданих електронних документів. Проаналізовано метод Гарріса, який дає змогу визначати опорні точки зображень за рахунок вимірювання інтенсивності яскравості зображення. Також проаналізовано технологію SIFT (масштабно-інваріантне перетворення ознак), яка є потужним засобом формування системи інваріантних структурних ознак, розглянуто ще один клас методів, які вирізняються простотою реалізації та застосування для виявлення неповних дублікатів зображень –хеш-методи. Описано, що для RGB-зображення існує три таких сигнали: яскравість у каналах Red, Green та Blue. В обробці сигналів і суміжних галузей перетворення Фур'є зазвичай розглядається декомпозиція сигналу на частоти та амплітуди. Розглянуто метод виявлення контекстно-залежних значень та індексації текстових даних, який допомагає знаходити неповні дублікати в таблицях з урахуванням текстового і числового представлення даних. Аналогічно за описаним методом можна провести індексацію даних числового і текстового типів, якщо вони розміщуються не в таблиці, а всередині контенту електронного документа. Результати дослідження використовуються в комплексі із системою виявлення неповних дублікатів у наукових документах, зокрема дисертаціях на здобуття наукового ступеня |
Type: | Text |
Publication type: | Стаття |
URI: | https://dspace.uzhnu.edu.ua/jspui/handle/lib/42208 |
ISSN: | 2412-9933 |
Appears in Collections: | Наукові публікації кафедри cистемного аналізу та теорії оптимізації |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
259416-Текст статті-596919-1-10-20220619.pdf | 496.61 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.