有一个10 G 的文件，你只有有一个 2 G 的内存，找出重复最多的数字

转载

mb5fdb0a4002420 2020-03-06 19:53:00

就是先遍历一遍全部数字，用hash先划分成10个文件(比如对10取模)，然后统计每个文件中数字的出现次数(如果这个文件大于1G，就把这个文件继续分成小文件)，找出出现最多的，最后把所有文件中找出的数的进行比较。

划分出的文件存在硬盘里(比如用FileOutputStream写到a1.txt..a10.txt)，这些txt肯定都存在硬盘里，而不是在内存中，所以可以分出来。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客