工作中使用hive进行数据预处理,有时候需要对数据抽样来做一些评估分析。下面记录通过python进行分层随机抽样的过程。 使用python连接数据库读取数据请参考:使用python连接数据库 im