就是先遍历一遍全部数字,用hash先划分成10个文件(比如对10取模),然后统计每个文件中数字的出现次数(如果这个文件大于1G,就把这个文件继续分成小文件),找出出现最多的,最后把所有文件中找出的数的进行比较。
划分出的文件存在硬盘里(比如用FileOutputStream写到a1.txt..a10.txt),这些txt肯定都存在硬盘里,而不是在内存中,所以可以分出来。
就是先遍历一遍全部数字,用hash先划分成10个文件(比如对10取模),然后统计每个文件中数字的出现次数(如果这个文件大于1G,就把这个文件继续分成小文件),找出出现最多的,最后把所有文件中找出的数的进行比较。
划分出的文件存在硬盘里(比如用FileOutputStream写到a1.txt..a10.txt),这些txt肯定都存在硬盘里,而不是在内存中,所以可以分出来。
下一篇:python模块简单使用
今天在写模拟购物车的时候需要统计列表中相同元素出现的次数,百度一顿搜搜终于找到比较 好的方法, 第一种: >>>
举报文章
请选择举报类型
补充说明
0/200
上传截图
格式支持JPEG/PNG/JPG,图片不超过1.9M