Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
https://dspace.uzhnu.edu.ua/jspui/handle/lib/66517
Название: | ПРОГНОЗУВАННЯ ПАСАЖИРІВ, ЯКІ ВИЖИЛИ ПІД ЧАС КАТАСТРОФИ «ТИТАНІКА», ЗА ДОПОМОГОЮ ДЕРЕВА ПРИЙНЯТТЯ РІШЕНЬ |
Другие названия: | Predicting passengers who survived the Titanic disaster using a decision tree. |
Авторы: | Морохович, Василь Степанович Лях, Ігор Михайлович Хом’як, Максим Ігорович Морохович, Богдан Васильович |
Ключевые слова: | застосування методу дерева прийняття рішень для прогнозування пасажирів, які вижили в результаті катастрофи лайнера «Титанік»., машинне навчання, аналіз даних, дерева прийняття рішень, прогнозування, платформа Kaggle |
Дата публикации: | 16-июн-2024 |
Библиографическое описание: | У статті запропоновано застосування методу дерева прийняття рішень для прогнозування пасажирів, які вижили в результаті катастрофи лайнера «Титанік». У якості вхідних даних використано набори даних «Titanic – Machine Learning from Disaster», що наявні у відкритому доступі на платформі Kaggle. Дерева прийняття рішень добре підходять для вирішення задач класифікації, а їхня простота інтерпретації робить цей метод кращим вибором серед інших алгоритмів машинного навчання. У навчальному наборі даних було виконано модифікацію, щоб заповнити відсутні значення. Оцінку розподілу якісних і кількісних ознак даних та пошуку в них закономірностей здійснено за допомогою візуального аналізу даних, що дало змогу виділити ознаки пасажирів, які корелюють з їхнім виживанням найбільше, і відповідно покращити набір даних. Дерево прийняття рішень для кінцевого набору даних побудовано за допомогою бібліотеки scikit-learn (sklearn), яка надає потужні інструменти для машинного навчання в Python. Точність побудованого дерева рішень становить 77% на відкладеній вибірці. Подальше дослідження застосування дерева прийняття рішень для даного набору даних може бути проведено шляхом використання методу налаштування гіперпараметрів дерева (hyperparameter tuning), який допоможе покращити точність побудованого дерева рішень. Ключові слова: машинне навчання, аналіз даних, дерева прийняття рішень, прогнозування, платформа Kaggle. |
Серия/номер: | Науковий журнал "Комп’ютерно-інтегровані технології: освіта, наука, виробництво";55 (2024) |
Краткий осмотр (реферат): | У статті запропоновано застосування методу дерева прийняття рішень для прогнозування пасажирів, які вижили в результаті катастрофи лайнера «Титанік». У якості вхідних даних використано набори даних «Titanic – Machine Learning from Disaster», що наявні у відкритому доступі на платформі Kaggle. Дерева прийняття рішень добре підходять для вирішення задач класифікації, а їхня простота інтерпретації робить цей метод кращим вибором серед інших алгоритмів машинного навчання. У навчальному наборі даних було виконано модифікацію, щоб заповнити відсутні значення. Оцінку розподілу якісних і кількісних ознак даних та пошуку в них закономірностей здійснено за допомогою візуального аналізу даних, що дало змогу виділити ознаки пасажирів, які корелюють з їхнім виживанням найбільше, і відповідно покращити набір даних. Дерево прийняття рішень для кінцевого набору даних побудовано за допомогою бібліотеки scikit-learn (sklearn), яка надає потужні інструменти для машинного навчання в Python. Точність побудованого дерева рішень становить 77% на відкладеній вибірці. Подальше дослідження застосування дерева прийняття рішень для даного набору даних може бути проведено шляхом використання методу налаштування гіперпараметрів дерева (hyperparameter tuning), який допоможе покращити точність побудованого дерева рішень. Ключові слова: машинне навчання, аналіз даних, дерева прийняття рішень, прогнозування, платформа Kaggle. |
Описание: | У статті запропоновано застосування методу дерева прийняття рішень для прогнозування пасажирів, які вижили в результаті катастрофи лайнера «Титанік». У якості вхідних даних використано набори даних «Titanic – Machine Learning from Disaster», що наявні у відкритому доступі на платформі Kaggle. Дерева прийняття рішень добре підходять для вирішення задач класифікації, а їхня простота інтерпретації робить цей метод кращим вибором серед інших алгоритмів машинного навчання. У навчальному наборі даних було виконано модифікацію, щоб заповнити відсутні значення. Оцінку розподілу якісних і кількісних ознак даних та пошуку в них закономірностей здійснено за допомогою візуального аналізу даних, що дало змогу виділити ознаки пасажирів, які корелюють з їхнім виживанням найбільше, і відповідно покращити набір даних. Дерево прийняття рішень для кінцевого набору даних побудовано за допомогою бібліотеки scikit-learn (sklearn), яка надає потужні інструменти для машинного навчання в Python. Точність побудованого дерева рішень становить 77% на відкладеній вибірці. Подальше дослідження застосування дерева прийняття рішень для даного набору даних може бути проведено шляхом використання методу налаштування гіперпараметрів дерева (hyperparameter tuning), який допоможе покращити точність побудованого дерева рішень. Ключові слова: машинне навчання, аналіз даних, дерева прийняття рішень, прогнозування, платформа Kaggle. |
Тип: | Text |
Тип публикации: | Стаття |
URI (Унифицированный идентификатор ресурса): | https://dspace.uzhnu.edu.ua/jspui/handle/lib/66517 |
ISSN: | 2524-0552 |
Располагается в коллекциях: | Наукові публікації кафедри інформатики та фізико-математичних дисциплін |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
572-Article Text-1826-2-10-20240620.pdf | Stattja | 438.53 kB | Adobe PDF | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.