exp和expdp这两个都是数据库冷备份的方法,备份的目的是防止数据库异常导致数据丢失,但是冷备份只能讲数据还原到指定时间点的数据。
一周一次备份,频率还是太低了。就一般生产库而已,基本上都是一天一备份的。exp对数据库没啥影响,只要是在业务相对少的情况下进行就好。
建议使用expdp数据泵方式备份,可以添加parallel参数,很快的。
Python与R相比速度要快。Python可以直接处理上G的数据;R不行,R分析数据时需要先通过数据库把大数据转化为小数据(通过groupby)才能交给R做分析,因此R不可能直接分析行为详单,只能分析统计结果。所以有人说:Python=RSQL/Hive,并不是没有道理的。
Python的一个最明显的优势在于其胶水语言的特性,很多书里也都会提到这一点,一些底层用C写的算法封装在Python包里后性能非常高效
(Python的数据挖掘包Orangecanve
中的决策树分析50万用户10秒出结果,用R几个小时也出不来,8G内存全部占满)。但是,凡事都不绝对,如果R矢量化编程做得好的话(有点小难度),会
使R的速度和程序的长度都有显著性提升。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)