首页  >  文章  >  后端开发  >  面试题,给你256M的内存,对10G的文件进行排序(文件每行1个数字)

面试题,给你256M的内存,对10G的文件进行排序(文件每行1个数字)

WBOY
WBOY原创
2016-08-10 09:07:185511浏览

给你256M的内存,对10G的文件进行排序(文件每行1个数字),如何实现? 对10G的文件进行查找如何实现?统计10G文件每个关键字出现的次数如何实现

回复内容:

给你256M的内存,对10G的文件进行排序(文件每行1个数字),如何实现? 对10G的文件进行查找如何实现?统计10G文件每个关键字出现的次数如何实现

用时间换空间呗
具体的实现都是分批载入文件,然后计算

java吗 用nio和用mapreduce的思想

不懂php,但是看这个题目似曾相识。
说说思路吧。
1、排序的实现
这是一个单机外部排序的典型题目。具体的方法就是先分块进行排序然后多路归并成输出文件。
2、查找
如果不能对文件进行处理的话,只能遍历进行查找。
如果是可以对文件进行处理的话,那么上面已经排序好了文件,就可以进行二分查找
3、统计
如果不能对文件进行处理的话,还是没有好的办法,只能是遍历一遍。
如果已经拍好序了,那么就可以直接二分查找。在找到的位置向两头搜索出现的个数。

可以看看《编程珠玑》这本书,好像就有这个问题。

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn