Please use this identifier to cite or link to this item: https://dspace.uzhnu.edu.ua/jspui/handle/lib/33154
Title: Методика виокремлення термінів ветеринарної медицини з корпусу ветеринарних текстів
Other Titles: Methods of veterinary terms retrival from the corpus of medical texts
Authors: Рожков, Ю. Г.
Keywords: корпусна лінгвістика, ветеринарна медицина, корпус текстів, терміни, термінологія, корпусная лингвистика, корпус текстов, терминология, ветеринарная медицина, corpus linguistics, corpus of texts, terminology, veterinary medicine
Issue Date: 2019
Publisher: Видавничий дім "Гельветика"
Citation: Рожков, Ю. Г. Методика виокремлення термінів ветеринарної медицини з корпусу ветеринарних текстів [Текст] / Ю. Г. Рожков // Закарпатські філологічні студії : науковий журнал/ голов. ред. І. М. Зимомря. – Ужгород : Видавничий дім "Гельветика", 2019. – Т. 2.– Вип. 9. – С. 33–36. – Бібліогр.: с. 36 (9 назв)
Series/Report no.: Закарпатські філологічні студії;
Abstract: Стаття присвячена створенню корпусу текстів ветеринарної тематики. Основна увага зосереджена навколо принципів виокремлення термінів із корпусу ветеринарних текстів. Для вищезазначених цілей було використано інструмент для класифікацій текстів. Для навчання класифікатора був підготовлений набір текстів, які були вручну класифіковані і завантажені в систему засобами сервісу класифікації. У роботі використаний гібридний метод: спочатку відбираються всі іменники, з яких потім за результатами статистичного аналізу з використанням інформації про семантику слів формується список можливих термінів. Для підвищення точності відбору в нашому дослідженні застосовувався кластерний аналіз англомовного тексту, який використовує адаптивний алгоритм Леска «за допомогою знаходження перетинів значень слів у WordNet». Результати застосування методу порівнювалися з результатами, отриманими під час використання частотного словника, частотного семантичного словника і позиційного методу. Таким чином, можна стверджувати, що послідовне застосування методів лінгвістичного і кількісного аналізу до спеціалізованого корпусу текстів дозволяє створити список кандидатів у терміни, різко скорочує роботу термінолога і дозволяє створювати реальні глосарії предметної області.
Статья посвящена созданию корпуса текстов ветеринарной тематики. Основное внимание сосредоточено вокруг принципов выделения терминов из корпуса ветеринарных текстов. Для вышеуказанных целей были использованы инструменты для классификации текстов. Для обучения классификатора был подготовлен набор текстов, который был вручную классифицирован и загружен в систему средствами сервиса классификации. В работе использован гибридный метод: сначала отбираются все существительные, из которых затем по результатам статистического анализа с использованием информации о семантике слов формируется список возможных терминов. Для повышения точности отбора в нашем исследовании применялся кластерный анализ англоязычного текста, который использует адаптивный алгоритм Леска «посредством нахождения пересечений значений слов в WordNet». Результаты применения метода сравнивались с результатами, полученными при использовании частотного словаря, частотного семантического словаря и позиционного метода. Таким образом, можно утверждать, что последовательное применение методов лингвистического и количественного анализа в специализированном корпусе текстов позволяет создать список кандидатов в термины, резко сокращает работу терминологов и позволяет создавать реальные глоссарии предметной области.
The article is dedicated to creation of veterinary oriented texts corpus. The attention is focused on the principles of finding and retrieval of terms from the veterinary oriented texts corpus. For the targets mentioned above we used various instruments for texts classification. In order to teach classificator the collection of texts, which was selected manually and downloaded into the system by means of classification services, was prepared. We used the hybrid method: at first we selected all the nouns which eventually form the list of plausible term candidates. To increase the precision of selection cluster analysis of English text which uses adoptive pattern of Lesk was implemented. The results of implemented method were compared to the results received while using frequency dictionary, frequency semantic dictionary and positional method. Thus one may claim that sequential usage of linguistic and quantitative analysis in specialized texts corpus allows creating the list of term candidates, rapidly minimizes the work of terminologists and creates real glossaries of subject area.
Type: Text
Publication type: Стаття
URI: https://dspace.uzhnu.edu.ua/jspui/handle/lib/33154
ISSN: 2663-4899
Appears in Collections:Закарпатські філологічні студії Випуск 9 Том 2 (2019)



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.