Please use this identifier to cite or link to this item:
https://dspace.uzhnu.edu.ua/jspui/handle/lib/76062
Title: | Statistical features of engineering texts |
Other Titles: | Статистичні особливості технічних текстів |
Authors: | Nevreva, M. M. Prysyazhnyuk, O. A. Vorobyova, K. V. |
Keywords: | semantic space, probabilistic-statistical model, token, frequency dictionary, frequency zone, семантичний простір, ймовірнісно-статистична модель, слововживання, частотний словник, частотна зона |
Issue Date: | 2025 |
Publisher: | Видавничий дім «Гельветика» |
Citation: | Nevreva, M. M. Statistical features of engineering texts / M. M. Nevreva, O. A. Prysyazhnyuk, K. V. Vorobyova // Закарпатські філологічні студії / редкол.: І. М. Зимомря (голов. ред.), М. М. Палінчак, Ю. М. Бідзіля та ін. – Ужгород : Видавничий дім "Гельветика", – 2025. – Т. 2, вип. 40. – С. 177–181. – Бібліогр.: с. 180–181 (14 назв); рез. укр., англ. URL http://zfs-journal.uzhnu.uz.ua/archive/40/part_2/31.pdf |
Series/Report no.: | Закарпатські філологічні студії; |
Abstract: | The presented article describes statistical data that characterize probabilistic-statistical models of three technical specialties.
The material was text corpora of the specialties chemical engineering, automotive engineering and electrical
engineering. The text corpora were compiled on the basis of scientific articles published in the corresponding journals in
the USA and Great Britain. At the beginning, the authors assumed that since all three text corpora relate to scientific and
technical discourse and do not interact in terms of general scientific topics, but represent completely different branches
of technology, they could create an example of style-distinguishing marker in the course of the procedure of comparison.
However, different approaches to the formation of text corpora, and, above all, the principles and goals of creating the
semantic space of all three specialties led to a sharp difference between the quantitative values of all three frequency
dictionaries. The authors of the probabilistic-statistical model of chemical engineering sought to evenly distribute text units
across the frequency dictionary and, for this purpose, selected texts that had practically common technical problems, and,
accordingly, repeated lexical units that described these problems. This was easily achieved by creating a simple and fairly
limited scheme of semantic space, including a few problems that relate to the subjects of this specialty. The same was
done by the authors of the text corpus of automotive engineering. As to the authors of the text corpus of electrical engineering
they attempted to include practically all scientific and technical problems of this specialty in the semantic space.
Therefore, firstly, within the frequency dictionary of electrical engineering itself, sharp differences in quantitative values
were observed between the high-frequency and low-frequency zones. Secondly, when comparing the quantitative values
of three probabilistic-statistical models, which were expected to be practically identical, the data of the dictionary of electrical
engineering were completely different from the dictionaries of chemical engineering and automobile engineering. As
a result of the study, the authors proposed to observe one of two conditions when forming text corpora: if it is supposed
to consider as many technical problems as possible, then it is necessary to either significantly increase the size of text
corpus, or to approach the selection of texts more carefully. У представленій статті описано статистичні дані, що характеризують ймовірнісно-статистичні моделі трьох технічних спеціальностей. Матеріалом слугували текстові корпуси спеціальностей хімічного машинобудування, автомобілебудування та електротехніки. Текстові корпуси були складені на основі наукових статей, опублікованих у відповідних журналах США та Великої Британії. Спочатку автори припускали, що оскільки всі три текстові корпуси стосуються науково-технічного дискурсу та не взаємодіють з точки зору наукових тем, а представляють абсолютно різні галузі техніки, вони можуть створити приклад стилістичного розрізнювального маркера в ході процедури порівняння. Однак, різні підходи до формування текстових корпусів, і, перш за все, принципи та цілі створення семантичного простору всіх трьох спеціальностей, призвели до різкої різниці між кількісними значеннями всіх трьох частотних словників. Автори ймовірнісно-статистичної моделі хімічного машинобудування прагнули рівномірно розподілити текстові одиниці по частотному словнику та для цього відбирали тексти, що мали практично спільні технічні проблеми, і, відповідно, повторювані лексичні одиниці, що описували ці проблеми. Цього було легко досягти, створивши просту та досить обмежену схему семантичного простору, що включає кілька проблем, які стосуються проблем цієї спеціальності. Те ж саме зробили й автори текстового корпусу автомобілебудування. Що ж до авторів текстового корпусу електротехніки, то вони намагалися включити практично всі науково-технічні проблеми цієї спеціальності до семантичного простору. Тому, по-перше, в межах самого частотного словника електротехніки спостерігалися різкі відмінності в кількісних значеннях між високочастотною та низькочастотною зонами. По-друге, при порівнянні кількісних значень трьох ймовірнісно-статистичних моделей, які очікувалися практично ідентичними, дані словника з електротехніки повністю відрізнялися від значень словників хімічного та автомобільного будування. В результаті дослідження автори запропонували дотримуватися однієї з двох умов при формуванні текстових корпусів: якщо передбачається врахування якомога більшої кількості технічних проблем, то необхідно або значно збільшити розмір текстового корпусу, або ретельніше підійти до відбору текстів. |
Type: | Text |
Publication type: | Стаття |
URI: | https://dspace.uzhnu.edu.ua/jspui/handle/lib/76062 |
ISSN: | 2663-4899 |
Appears in Collections: | 2025 / Закарпатські філологічні студії. Випуск 40 (Том 2) |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
STATISTICAL FEATURES OF ENGINEERING TEXTS.pdf | 347.55 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.