怎么提高R语言读取数据库的速度

怎么提高R语言读取数据库的速度,第1张

会有影响的,机器性能对数据的导出速度有很大的影响。

exp和expdp这两个都是数据库备份的方法,备份的目的是防止数据库异常导致数据丢失,但是冷备份只能讲数据还原到指定时间点的数据。

一周一次备份,频率还是太低了。就一般生产库而已,基本上都是一天一备份的。exp对数据库没啥影响,只要是在业务相对少的情况下进行就好。

建议使用expdp数据泵方式备份,可以添加parallel参数,很快的。

Python与R相比速度要快。Python可以直接处理上G的数据;R不行,R分析数据时需要先通过数据库把大数据转化为小数据(通过groupby)才能交给R做分析,因此R不可能直接分析行为详单,只能分析统计结果。所以有人说:Python=RSQL/Hive,并不是没有道理的。

Python的一个最明显的优势在于其胶水语言的特性,很多书里也都会提到这一点,一些底层用C写的算法封装在Python包里后性能非常高效

(Python的数据挖掘包Orangecanve

中的决策树分析50万用户10秒出结果,用R几个小时也出不来,8G内存全部占满)。但是,凡事都不绝对,如果R矢量化编程做得好的话(有点小难度),会

使R的速度和程序的长度都有显著性提升。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/12049177.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-20
下一篇 2023-05-20

发表评论

登录后才能评论

评论列表(0条)

保存