Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал: https://dspace.uzhnu.edu.ua/jspui/handle/lib/71257
Назва: Розподіл частих слів у коротких текстових повідомленнях
Інші назви: Distribution of frequent words in short text messages
Автори: Турчин, Є. В.
Федорченко, Ю. С.
Ключові слова: розподiл частот слiв, математична лiнгвiстика, критерiй хi-квадрат, критерiй AIC, критерiй BIC, word frequency distribution, mathematical linguistics, chi-square test, AIC criterion, BIC criterion
Дата публікації: 2024
Видавництво: Вид-во УжНУ "Говерла"
Бібліографічний опис: Турчин, Є. В. Розподіл частих слів у коротких текстових повідомленнях / Є. В. Турчин, Ю. С. Федорченко // Науковий вісник Ужгородського університету : серія: Математика і інформатика / редкол. : М.М. Маляр (голов. ред.), Г.І. Сливка-Тилищак та ін. – Ужгород : Вид-во УжНУ "Говерла", 2024. – Т. 45, вип. 2. – С. 115–125. – рез. укр., англ. – Бібліогр.: с. 123–125 (20 назв)
Серія/номер: Математика і інформатика;
Короткий огляд (реферат): Розглядається задача про розподiл частот слiв у текстовому корпусi, що складається з коротких повiдомлень (акцент зроблено на частих словах). Серед декiлькох сiмей розподiлiв знайденi найбiльш адекватнi (використовувався критерiй хi-квадрат, а також порiвняння за допомогою статистик AIC та BIC).
We consider a problem of word frequency distribution in a text corpus which consists of short messages (the emphasis is put on frequent words). The most adequate distributions were found among several distribution families (the chi-square test was used, the distributions were compared using the AIC and BIC statistics).
Тип: Text
Тип публікації: Стаття
URI (Уніфікований ідентифікатор ресурсу): https://dspace.uzhnu.edu.ua/jspui/handle/lib/71257
ISSN: 2616-7700
Розташовується у зібраннях:Науковий вісник УжНУ Серія: Математика і інформатика. Випуск 45 № 2 - 2024

Файли цього матеріалу:
Файл Опис РозмірФормат 
РОЗПОДIЛ ЧАСТИХ СЛIВ.pdf617.27 kBAdobe PDFПереглянути/Відкрити


Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.