Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
https://dspace.uzhnu.edu.ua/jspui/handle/lib/75780
Название: | Створення часткового словника сленгу в соціальних мережах (на основі Twitter (X) або Reddit) |
Другие названия: | Creating a partial dictionary of slang in social networks (based on Twitter (X) or Reddit) |
Авторы: | Вороновська, А. О. Кауза, І. Б. |
Ключевые слова: | сленг, частотний словник, соціальні мережі, Twitter, Reddit, цифрова лінгвістика, онлайн-комунікація, токенізація, лексикографія, інтернет-дискурс, slang, frequency dictionary, social networks, Twitter, Reddit, digital linguistics, online communication, tokenization, lexicography, internet discourse |
Дата публикации: | 2025 |
Издательство: | Видавничий дім «Гельветика» |
Библиографическое описание: | Вороновська, А. О. Створення часткового словника сленгу в соціальних мережах (на основі Twitter (X) або Reddit) / А. О. Вороновська, І. Б. Кауза // Закарпатські філологічні студії / редкол.: І. М. Зимомря (голов. ред.), М. М. Палінчак, Ю. М. Бідзіля та ін. – Ужгород : Видавничий дім "Гельветика", – 2025. – Т. 1, вип. 40. – С. 35–40. – Бібліогр.: с. 40 (10 назв); рез. укр., англ. URL http://zfs-journal.uzhnu.uz.ua/archive/40/part_1/8.pdf |
Серия/номер: | Закарпатські філологічні студії; |
Краткий осмотр (реферат): | Стаття присвячена аналізу створення частотного словника сучасного сленгу на основі глибокого аналізу текстів,
отриманих із соціальних мереж Twitter (X) та Reddit. Ці платформи обрано як джерело матеріалу через їхню активну
комунікативну природу, високу щоденну активність користувачів та широке використання неформальної мови. Аналіз доповнено вивченням особливостей зазначених соціальних мереж, того , як вони відображають мовні тенденції
в реальному часі, як швидко реагують на події й дозволяють відстежувати динаміку мовних змін, зокрема появу та
закріплення нових сленгових одиниць.
Дослідження ґрунтується на корпусному підході, який передбачає обробку великого масиву мовного матеріалу
за допомогою цифрових інструментів. Такий підхід забезпечує об’єктивність і репрезентативність результатів, дозволяє виявляти закономірності в уживанні слів, їхню частотність, контекстуальну варіативність тощо. У межах роботи
було здійснено низку етапів: збирання текстових даних (твітів, коментарів, дописів), їх очищення від шумів (посилань, технічних символів, емодзі тощо), а також токенізація – розбиття тексту на окремі мовні одиниці. Подальша
лематизація дозволила звести слова до їх початкових форм, що є необхідним кроком для частотного аналізу.
Особлива увага приділялася формуванню чітких критеріїв відбору сленгових одиниць. Серед них – неформальний характер слова, його популярність серед молодіжної або онлайн-аудиторії, експресивне забарвлення та
відповідність певним семантичним або функціональним ознакам. Зібрані одиниці класифікувались за частотою
вживання, що дало змогу визначити ядро сучасного сленгу та провести його порівняльний аналіз між платформами. Отримані результати мають практичну цінність як для лексикографії, так і для подальших лінгвістичних,
соціолінгвістичних та прикладних досліджень. This study presents an attempt to develop a frequency dictionary of contemporary slang based on an in-depth analysis of texts collected from the social networks Twitter (X) and Reddit. These platforms were chosen as sources due to their dynamic communicative nature, high daily user activity, and the prevalence of informal language. One of their distinctive features is the reflection of real-time linguistic trends, which allows for the observation of how new slang units emerge, evolve, and become entrenched in digital discourse. The research is grounded in a corpus-based approach, which involves processing a large volume of linguistic material using digital tools. This approach ensures objectivity and representativeness of the results and allows for the identification of regularities in word usage, frequency, and contextual variation. The study included several stages: data collection (tweets, comments, posts), noise removal (links, symbols, emojis, etc.), and tokenization – splitting texts into individual language units. Further lemmatization was applied to reduce words to their base forms, an essential step for frequency analysis. Special attention was paid to defining clear criteria for selecting slang units. These included the informal nature of the word, its popularity among youth or online communities, expressive coloration, and correspondence to specific semantic or functional features. The collected units were classified according to frequency of use, enabling the identification of a core slang vocabulary and its comparative analysis across platforms. The results have practical value for lexicography, as well as for further linguistic, sociolinguistic, and applied research. |
Тип: | Text |
Тип публикации: | Стаття |
URI (Унифицированный идентификатор ресурса): | https://dspace.uzhnu.edu.ua/jspui/handle/lib/75780 |
ISSN: | 2663-4899 |
Располагается в коллекциях: | 2025 / Закарпатські філологічні студії. Випуск 40 (Том 1) |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
СТВОРЕННЯ ЧАСТКОВОГО СЛОВНИКА СЛЕНГУ.pdf | 381.51 kB | Adobe PDF | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.