ChatGPT для саморазвития: Освоения программирования, консалтинга и изучения иностранных языков - страница 7

Шрифт
Интервал


Шаг 4 Построение модели машинного обучения

Далее в книге мы предоставляем код, который поможет вам построить модель машинного обучения на основе подготовленного датасета и обучить ее предсказывать значения столбца "Survived" (выживший). С помощью этой модели вы сможете оценить вероятность своего выживания, если бы вы оказались на Титанике в тот роковой день.

Пользователь:

Библиотека pandas, matplotlib, seaborn уже установлены и наш файл titanic.csv уже загружен в переменную data.

Файл titanic.csv содержит следующие столбцы:

Survived: int64, Pclass: int64, Name: object, Sex: object, Age: float64, Siblings/Spouses Aboard: int64, Parents/Children Aboard: int64, Fare: float64

Столбец Survived – это целевая переменная, которую необходимо научится предсказывать на основании переменных Pclass, Name, Sex, Age, Siblings/Spouses Aboard, Parents/Children Aboard, Fare

Построй модель на языке python и обучи ее.

Предобработка данных на проверку дублей, пустых значений уже выполнена.

Чат:

Поскольку предобработка данных уже выполнена, приступим к построению и обучению модели. В качестве модели я выберу случайный лес (Random Forest) из библиотеки sklearn.

Сначала разделим данные на обучающую и тестовую выборки, а затем обучим модель.



Теперь, когда модель обучена, вы можете использовать её для предсказания выживаемости на новых данных.

Пример:



Таким образом, вы можете использовать обученную модель для предсказания выживаемости на основе данных о пассажирах.

Внимание:

Как вы заметили на представленном выше скриншоте, пользователь использовал слово "продолжай". Мы используем это слово в случае, когда по каким-то неизвестным нам причинам ChatGPT не завершает свой ответ до конца и обрывается на полпути.

Написание слова "продолжай" воспринимается чатом как инструкцию продолжить с того места, где он остановился. Однако, если мы напишем это слово, когда чат уже завершил свою мысль, то он воспримет это как просьбу дать нам еще примеров или информации по данному запросу.

Результат:

Выполняем все рекомендации Чата и посмотрим смотрим что из этого получилось.



Пользователь:

Что означает Accuracy: 0.76 и Survived prediction: 0

Чат:

Accuracy: 0.76 означает, что точность вашей модели составляет 76%. Точность (accuracy) – это доля правильно классифицированных объектов от общего количества объектов. В данном случае, модель правильно предсказала выживаемость пассажиров в 76% случаев на тестовой выборке. Это одна из метрик оценки качества классификации.