Rumah  >  Artikel  >  pembangunan bahagian belakang  >  面试题,给你256M的内存,对10G的文件进行排序(文件每行1个数字)

面试题,给你256M的内存,对10G的文件进行排序(文件每行1个数字)

WBOY
WBOYasal
2016-08-10 09:07:185511semak imbas

给你256M的内存,对10G的文件进行排序(文件每行1个数字),如何实现? 对10G的文件进行查找如何实现?统计10G文件每个关键字出现的次数如何实现

回复内容:

给你256M的内存,对10G的文件进行排序(文件每行1个数字),如何实现? 对10G的文件进行查找如何实现?统计10G文件每个关键字出现的次数如何实现

用时间换空间呗
具体的实现都是分批载入文件,然后计算

java吗 用nio和用mapreduce的思想

不懂php,但是看这个题目似曾相识。
说说思路吧。
1、排序的实现
这是一个单机外部排序的典型题目。具体的方法就是先分块进行排序然后多路归并成输出文件。
2、查找
如果不能对文件进行处理的话,只能遍历进行查找。
如果是可以对文件进行处理的话,那么上面已经排序好了文件,就可以进行二分查找
3、统计
如果不能对文件进行处理的话,还是没有好的办法,只能是遍历一遍。
如果已经拍好序了,那么就可以直接二分查找。在找到的位置向两头搜索出现的个数。

可以看看《编程珠玑》这本书,好像就有这个问题。

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn