【跟李沐学AI】2.1 探索性数据分析

【跟李沐学AI】2.1 探索性数据分析,第1张

【跟李沐学AI】2.1 探索性数据分析

文章目录

2.1 探索性数据分析【斯坦福21秋季:实用机器学习中文版】

视频地址:https://www.bilibili.com/video/BV1Xh411p7M9?spm_id_from=333.999.0.0

文字地址:https://www.bilibili.com/read/cv13353927?from=note

教学大纲:https://c.d2l.ai/stanford-cs329p/syllabus.html#deep-network-tuning

课程代码:https://c.d2l.ai/stanford-cs329p/_static/notebooks/cs329p_notebook_eda.slides.html#/12

数据集获取:
!wget https://c.d2l.ai/stanford-cs329p/_static/house_sales.ftr
data = pd.read_feather('house_sales.ftr')
data = pd.read_csv('house_sales.zip')

收获:

  1. csv文件存下来相对比较大,可以先压缩成一个zip或一个tar,主流的读取文件都可以从压缩文件中读取。建议存成压缩文件,在传输存储都会比较好,甚至还会比直接读取还要好(这个方法可用于文本)
  2. In[6] 中的 inplace的作用是,直接将要去掉的列给改写掉(直接对数进行修改),可以省些内存,但是这个只能跑一次
  3. from IPython import display display.set_matplotlib_formats('svg') svg格式,显示图片更清晰
  4. 箱型图:搞懂箱形图分析
  5. 协方差矩阵 分析 相关性

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5698623.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-17
下一篇 2022-12-17

发表评论

登录后才能评论

评论列表(0条)

保存