课程笔记 可不是瞎算 打车费的模型算法

课程名称

可不是瞎算,打车费的模型算法 ———— 网络AI实战指南:基于jupyterlab交互式开发体验

课程目录

naie-devrun-20200514-car-cost.png

课程链接

学习笔记

  1. 处理流程
    1. 数据预处理
    2. 模型训练
    3. 模型评估
    4. 模型部署
  2. 数据分析与处理
    1. 数据探索
      1. 基础统计量分析
      2. 直方图,箱式图等可视化分析
      3. 特征间关系分析
    2. 数据清洗
      1. 缺失值处理
      2. 无效值处理
      3. 数据去重
      4. 错误值处理
    3. 特征处理
      1. 归一化或标准化
      2. 指数或对数转换
      3. one-hot或数值化
      4. 特征重命名
      5. 特征类型或格式转换
    4. 特征提取
      1. 时间特征信息的自动提取
      2. 时序数据特征提取
      3. 多项式特征提取
      4. 特征算数运算提取
  3. NAIE交互式特征工程基于jupyterlab扩展机制
    1. 高度扩展的前端插件机制 - 预置丰富多样的数据分析处理操作界面
    2. 高度灵活的内核替换机制 - 预置python和pyspark两种数据处理引擎
    3. 高度开放的python库导入机制 - 预置NAIE丰富多样的数据处理分析库
  4. NYC Taxi Data分析与处理的处理流程
    1. 导入数据
    2. 分析数据缺失值
    3. 数据缺失值处理
    4. 数据无效值分析
    5. 数据无效值处理
    6. 特征关系分析
    7. 特征选择处理
    8. 分类型数据处理
    9. 数值型数据处理
    10. 特征重名
    11. 保存数据
  5. 统计项
    1. 平均值
    2. 方差
    3. 最大值
    4. 最小值
    5. 25%分位数
    6. 50%分位数
    7. 75%分位数
  6. 图表
    1. 折线图
    2. 散点图
    3. 直方图
    4. 箱线图
    5. 散点图矩阵
    6. 3D散点图

备注

  1. 感谢老师的教学与课件
  2. 欢迎各位同学一起来交流学习心得^_^
  3. 笔记只包含了部分知识点,若是对相关内容感兴趣的话,建议观看视频
(完)