Title: Роль мовних корпусів у вивченні варіативності мови та мовлення
Other Titles: The role of language corpora in the study of language and speech variation
Authors: Пироговська, В. О.
Дзюбак, Н. М.
Юлдашева, С. А.
Keywords: управління даними, збір даних, створення корпусу, транскрипція даних, усні дані, варіаційна соціолінгвістика, data management, data collection, corpus creation, data transcription, oral data, variation sociolinguistics
Issue Date: 2023
Publisher: Видавничий дім "Гельветика"
Citation: Пироговська, В. О. Роль мовних корпусів у вивченні варіативності мови та мовлення / В. О. Пироговська, Н. М. Дзюбак, С. А. Юлдашева // Закарпатські філологічні студії / редкол.: І. М. Зимомря (голов. ред.), М. М. Палінчак, Ю. М. Бідзіля та ін. – Ужгород : Видавничий дім "Гельветика", – 2023. – Т. 1, вип. 32. – С. 107–112. – Бібліогр.: с. 111–112 (13 назв); рез. англ., укр. URL
Series/Report no.: Закарпатські філологічні студії;
Abstract: Мовні корпуси відіграють важливу роль у вивченні варіативності мови та мовлення. Вони є великими зібраннями автентичних мовних даних, які репрезентують різноманітність мовних вживань. Наявність великих корпусів і можливість обробки дуже великих обсягів мовних даних є джерелом відновлення інтересу до лінгвостатистики, яка безпосередньо пов’язана з лінгвістикою. У поєднанні ці дві науки мають на меті вивчення варіативності мови, що передбачає аналіз різних варіантів використання мовних одиниць, таких як фонетичні, морфологічні, синтаксичні та лексичні. Мовні корпуси забезпечують дослідникам доступ до великого обсягу даних, які являють собою різноманітні варіанти мовної вживаності. У свою чергу оновлення техніки автоматичної обробки з практичними цілями спонукало учених до розробки нових теоретичних концепцій мови. Мета представленої роботи – детально описати принципи й методи керування даними, які діють у межах традицій корпусної лінгвістики, лінгвостатистики та соціолінгвістики. Результати роботи показали, що вивчення живої мови і, зокрема, її лінгвістичних варіацій і змін, особливо в контексті меншин і двомовності, можливе за допомогою корпусів. Мовні корпуси дають змогу вивчати різноманіття мови шляхом порівняння текстів різних жанрів, стилів, соціальних груп і регіонів. Вони уможливлюють вивчення мовлення з погляду функціональних характеристик, таких як загальна тематика, цільова аудиторія, комунікативна ситуація тощо. Висновуємо, що реалізація вивчення варіативності будь-якої мови передбачає систематичне вивчення усних корпусів, побудованих відповідно до наукових принципів, заснованих на теоріях і методах варіаційної соціолінгвістики, корпусної лінгвістики й лінгвостатистики. Для відтворення та підтвердження емпіричних результатів у роботі проведено детальний науковий аналіз дотичної літератури. Методи, описані в роботі, є безцінними ресурсами для дослідження мовних варіацій та збереження живих мов.
Language corpora play an important role in studying language and speech variability. They are large collections of authentic linguistic data that represent the diversity of language usage. The availability of large corpora and the ability to process very large volumes of linguistic data have led to a renewed interest in linguistics statistics, which is directly related to linguistics. In combination, these two fields aim to study language variability. The study of language variability involves analyzing different variants of linguistic units, such as phonetic, morphological, syntactic, and lexical variations. Language corpora provide researchers with access to a large volume of data that represent various uses of language. In turn, advancements in automated processing techniques for practical purposes have prompted scholars to develop new theoretical concepts of language. The goal of this paper is to provide a detailed description of the principles and methods of data management that are employed within the frameworks of corpus linguistics, linguistic statistics, and sociolinguistics. The results of this study have shown that the study of living language and its linguistic variations and changes, particularly in the context of minorities and bilingual contexts, is possible with the help of corpora. Language corpora allow for the investigation of language diversity by comparing texts from different genres, styles, social groups, and regions. They enable the study of speech from functional characteristics, such as overall themes, target audiences, and communicative situations, among others. It is concluded that the implementation of such a study of language variability necessitates the systematic examination of oral corpora constructed according to scientific principles based on variation sociolinguistics, corpus linguistics, and linguistic statistics theories and methods. To reproduce and confirm empirical results, this work includes a detailed scientific analysis of relevant literature. The methods described in this paper are invaluable resources for studying language variations and preserving living languages.
