海量日志数据,提取出某日访问百度次数最多的那个IP?

海量日志数据,提取出某日访问百度次数最多的那个IP?,第1张

海量日志数据,提取出某日访问百度次数最多的那个IP?

利用hash映射,将数据映射到小文件中,取1000为例,然后在各个小文件中进行hashmap统计各个串的出现频数,对应进行快排序或者堆排序,找出每个文件中最大频数的,最后将每个文件中最多的取出再进行快排,得到总的出现最多的字符

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/4894752.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-11-12
下一篇 2022-11-12

发表评论

登录后才能评论

评论列表(0条)

保存