​一个航班票价预测数据挖掘实战案例
​一个航班票价预测数据挖掘实战案例
⏰ 剪存时间:2022-08-03 13:57:26 (UTC+8)
✂️ 本文档由 飞书剪存 一键生成
在本文中,云朵君将和大家一起学习将使用机器学习数据集使用基本的探索性数据分析技术分析航班票价预测,然后根据某些特征(例如航空公司的类型、到达时间)得出一些关于航班价格的预测时间,出发时间,飞行时间,来源,目的地等等。
Figure 1 airplane-wallpaper 来源: Kaggle
写在前面
在本文中,我们使用机器学习进行预测,得出以下结论:
  1. EDA: 了解EDA的完整流程
  1. 数据分析: 学会在数据集中从数学和可视化等上面获得一些见解。
  1. 数据可视化: 可视化数据方便挖掘更加直观的结论。
  1. 特征工程: 将在特征工程部分挖掘我们可以做的工作。
  1. 机器学习模型:学习做一个经过数据预处理等步骤的机器学习模型。
  1. 比较模型:将研究多个模型,并选择最佳模型。
关于数据集
  1. Airline航空公司: 因此,本列将包含所有类型的航空公司,例如 Indigo、Jet Airways、Air India 等等。
  1. Date_of_Journey旅程日期: 此列将告知我们乘客旅程的开始日期。
  1. Source来源: 此列包含乘客旅程开始的地点名称。
  1. Destination目的地: 此列包含乘客想要前往的地点的名称。