Створення часткового словника сленгу в соціальних мережах (на основі Twitter (X) або Reddit)

Вороновська, А. О.; Кауза, І. Б.

Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал: https://dspace.uzhnu.edu.ua/jspui/handle/lib/75780

Назва:	Створення часткового словника сленгу в соціальних мережах (на основі Twitter (X) або Reddit)
Інші назви:	Creating a partial dictionary of slang in social networks (based on Twitter (X) or Reddit)
Автори:	Вороновська, А. О. Кауза, І. Б.
Ключові слова:	сленг, частотний словник, соціальні мережі, Twitter, Reddit, цифрова лінгвістика, онлайн-комунікація, токенізація, лексикографія, інтернет-дискурс, slang, frequency dictionary, social networks, Twitter, Reddit, digital linguistics, online communication, tokenization, lexicography, internet discourse
Дата публікації:	2025
Видавництво:	Видавничий дім «Гельветика»
Бібліографічний опис:	Вороновська, А. О. Створення часткового словника сленгу в соціальних мережах (на основі Twitter (X) або Reddit) / А. О. Вороновська, І. Б. Кауза // Закарпатські філологічні студії / редкол.: І. М. Зимомря (голов. ред.), М. М. Палінчак, Ю. М. Бідзіля та ін. – Ужгород : Видавничий дім "Гельветика", – 2025. – Т. 1, вип. 40. – С. 35–40. – Бібліогр.: с. 40 (10 назв); рез. укр., англ. URL http://zfs-journal.uzhnu.uz.ua/archive/40/part_1/8.pdf
Серія/номер:	Закарпатські філологічні студії;
Короткий огляд (реферат):	Стаття присвячена аналізу створення частотного словника сучасного сленгу на основі глибокого аналізу текстів, отриманих із соціальних мереж Twitter (X) та Reddit. Ці платформи обрано як джерело матеріалу через їхню активну комунікативну природу, високу щоденну активність користувачів та широке використання неформальної мови. Аналіз доповнено вивченням особливостей зазначених соціальних мереж, того , як вони відображають мовні тенденції в реальному часі, як швидко реагують на події й дозволяють відстежувати динаміку мовних змін, зокрема появу та закріплення нових сленгових одиниць. Дослідження ґрунтується на корпусному підході, який передбачає обробку великого масиву мовного матеріалу за допомогою цифрових інструментів. Такий підхід забезпечує об’єктивність і репрезентативність результатів, дозволяє виявляти закономірності в уживанні слів, їхню частотність, контекстуальну варіативність тощо. У межах роботи було здійснено низку етапів: збирання текстових даних (твітів, коментарів, дописів), їх очищення від шумів (посилань, технічних символів, емодзі тощо), а також токенізація – розбиття тексту на окремі мовні одиниці. Подальша лематизація дозволила звести слова до їх початкових форм, що є необхідним кроком для частотного аналізу. Особлива увага приділялася формуванню чітких критеріїв відбору сленгових одиниць. Серед них – неформальний характер слова, його популярність серед молодіжної або онлайн-аудиторії, експресивне забарвлення та відповідність певним семантичним або функціональним ознакам. Зібрані одиниці класифікувались за частотою вживання, що дало змогу визначити ядро сучасного сленгу та провести його порівняльний аналіз між платформами. Отримані результати мають практичну цінність як для лексикографії, так і для подальших лінгвістичних, соціолінгвістичних та прикладних досліджень. This study presents an attempt to develop a frequency dictionary of contemporary slang based on an in-depth analysis of texts collected from the social networks Twitter (X) and Reddit. These platforms were chosen as sources due to their dynamic communicative nature, high daily user activity, and the prevalence of informal language. One of their distinctive features is the reflection of real-time linguistic trends, which allows for the observation of how new slang units emerge, evolve, and become entrenched in digital discourse. The research is grounded in a corpus-based approach, which involves processing a large volume of linguistic material using digital tools. This approach ensures objectivity and representativeness of the results and allows for the identification of regularities in word usage, frequency, and contextual variation. The study included several stages: data collection (tweets, comments, posts), noise removal (links, symbols, emojis, etc.), and tokenization – splitting texts into individual language units. Further lemmatization was applied to reduce words to their base forms, an essential step for frequency analysis. Special attention was paid to defining clear criteria for selecting slang units. These included the informal nature of the word, its popularity among youth or online communities, expressive coloration, and correspondence to specific semantic or functional features. The collected units were classified according to frequency of use, enabling the identification of a core slang vocabulary and its comparative analysis across platforms. The results have practical value for lexicography, as well as for further linguistic, sociolinguistic, and applied research.
Тип:	Text
Тип публікації:	Стаття
URI (Уніфікований ідентифікатор ресурсу):	https://dspace.uzhnu.edu.ua/jspui/handle/lib/75780
ISSN:	2663-4899
Розташовується у зібраннях:	2025 / Закарпатські філологічні студії. Випуск 40 (Том 1)

Файли цього матеріалу:

Файл	Опис	Розмір	Формат
СТВОРЕННЯ ЧАСТКОВОГО СЛОВНИКА СЛЕНГУ.pdf		381.51 kB	Adobe PDF	Переглянути/Відкрити

Показати повний опис матеріалу Перегляд статистики

Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.