Please use this identifier to cite or link to this item:
https://dspace.uzhnu.edu.ua/jspui/handle/lib/62296
Title: | Statistical methods for determining the differential characteristics in grammar phenomena of texts (on the material of text corpora of technical specialties) |
Other Titles: | Статистичні методи визначення диференційних характеристик у граматичних явищах текстів (на матеріалі корпусів текстів технічних спеціальностей) |
Authors: | Tsapenko, L. E. Lebedeva, E. V. Gvozd, O. V. |
Keywords: | aspectual-temporal paradigmatic forms, frequency of occurring, scientific and technical discourse, token, contextual analysis, видо-часові парадигматичні форми, частота вживання, науково-технічний дискурс, слововжитки, контекстуальний аналіз |
Issue Date: | 2022 |
Publisher: | Видавничий дім "Гельветика" |
Citation: | Tsapenko, L. E. Statistical methods for determining the differential characteristics in grammar phenomena of texts (on the material of text corpora of technical specialties) / L. E. Tsapenko, E. V. Lebedeva, O. V. Gvozd // Закарпатські філологічні студії / редкол.: І. М. Зимомря (голов. ред.), М. М. Палінчак, Ю. М. Бідзіля та ін. – Ужгород : Видавничий дім "Гельветика", – 2022. – Т. 1, вип. 25. – С. 250–254. – Бібліогр.: с. 254 (17 назв); рез. англ., укр. URL http://zfs-journal.uzhnu.uz.ua/archive/25/part_1/47.pdf |
Series/Report no.: | Закарпатські філологічні студії; |
Abstract: | The article presents a description of statistical methods for determining units that function in the texts of different fields
of knowledge, but related to the common scientific and technical discourse and having different quantitative values at the
grammatical level. The object to which statistical calculations were applied was the aspect-temporal paradigmatic forms of
finite verbs. Three text corpora, respectively, of three specialties – “Acoustics”, “Chemical Engineering” and “Automation
of Heat and Power Processes” were used as the research material. Each corpus includes 100 thousand tokens each. The
total sample size is thus 300 thousand tokens. The source for the material were articles from scientific journals published in
England and the USA. Text corpora of specialties were used that are not thematically related to each other, which makes it
possible to generalize the results obtained and determine some integral and differential characteristics inherent in the texts
of scientific and technical discourse as a whole. The main research methods were the following: the method of structural
and probabilistic analysis, contextual analysis and elements of distributive analysis, the method of expert assessment,
the method of rank correlation. In addition a quantitative analysis of the studied units was used, explaining the causes of
frequency and taking into account extralinguistic factors that determine some specific features of the scientific style. The
analysis of the frequencies of occuring the aspectual-temporal paradigmatic forms of a finite verb in each text corpus and
their comparison by the overall frequency makes it possible to trace the peculiarity of the paradigmatic forms-of-verb
implementation in specific conditions. The authors have found that although the principle of the statistical parameter of
frequency is rather rigidly preserved in the presented text corpora (meaning they belong to the same type of discourse in
terms of the frequency of usage of the text units under consideration), nevertheless, we can talk about probable cases of
discrepancy in the frequency of occurring of some of them in different text corpora included in the scientific and technical
discourse. In our case, these are some forms of aspect-temporal verbal paradigm that have different statistical parameters
in the texts of these technical specialties. Стаття представляє опис статистичних методів для визначення одиниць, що функціонують у текстах різних галузей знання, але належать до загального науково-технічного дискурсу та мають на граматичному різні кількісні показники. Об'єктом, до якого застосовувалися статистичні обчислення, було обрано видо-часові парадигматичні форми фінітних дієслів. Як матеріал дослідження були використані три текстові корпуси відповідно трьох спеціальностей – “Acoustics”, “Chemical Engineering” та “Automation of Heat and Power Processes”. Кожен корпус включав 100 тисяч слововжитків кожен. Загальний обсяг вибірки становить таким чином 300 тис. слововжитків. Джерелом для формування корпусів послужили статті з наукових журналів, виданих в Англії та США. Були використані текстові корпуси спеціальностей, які тематично не пов'язані між собою, що дає змогу узагальнити отримані результати та визначити деякі інтегральні та диференціальні характеристики, властиві текстам науково-технічного дискурсу загалом. Основними методами дослідження були такі: метод структурно-ймовірнісного аналізу, контекстуальний аналіз та елементи дистрибутивного аналізу, метод експертної оцінки, метод рангової кореляції. Крім того, використовувався кількісний аналіз досліджуваних одиниць з поясненням причин частотності та врахуванням екстралінгвістичних факторів, які детермінують деякі специфічні особливості наукового стилю. Аналіз частот вживання видо-часових парадигматичних форм фінітного дієслова в кожному текстовому корпусі та їх зіставлення за загальною частотою дає можливість простежити своєрідність реалізації парадигматичних форм дієслова у конкретних умовах. Було встановлено, що хоча принцип статистичного параметра частотності досить жорстко зберігається у представлених текстових корпусах (мається на увазі їх віднесеність до одного типу дискурсу по частотності вживання текстових одиниць), проте можна говорити про можливі випадки розбіжності за частотою використання деяких з них в різних текстових корпусах, включених до науково-технічного дискурсу. У нашому випадку це деякі форми видо-часової дієслівної парадигми, які мають різні статистичні параметри в текстах зазначених технічних спеціальностей. |
Type: | Text |
Publication type: | Стаття |
URI: | https://dspace.uzhnu.edu.ua/jspui/handle/lib/62296 |
ISSN: | 2663-4899 |
Appears in Collections: | Закарпатські філологічні студії Випуск 25 Том 1 2022 |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
STATISTICAL METHODS FOR DETERMINING THE DIFFERENTIAL.pdf | 448.88 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.