index_ids.splice(idx, 0, id);
我发现执行一万条数据,注释掉这行代码,整个程序执行减少了10秒钟的时间。我的代码有两行这样的,总共多花了20秒的时间,如果有比这个更快的插入方式,我可以省下好多时间。
怪我咯2017-04-11 13:18:30
var arrInsert = [5, 6, 7];
var newArray = [];
var index = 0;
for(var i in index_ids){
var now = index_ids[i];
if(index < arrInsert.length && index_ids[i] < arrInsert[index]){
newArray.push(index_ids[i]);
}else{
if(index < arrInsert.length){
newArray.push(arrInsert[index]);
index++;
}
newArray.push(index_ids[i]);
}
}
大概就是这个意思吧,可能语法有错误。
还要注意数组别越界。
假设你原来的代码是:
for(var i in index_ids){ //这里一个循环,是n次(2)
var idx = index_ids.find_somthing(id);
index_ids.splice(idx, 0, id); //这个算法的复杂度是O(n)的(1)
}
splice()
是O(n)的,原因是,当你在中间插入一个,插入位置之后的元素都要集体向后移动一个位置,这就相当于你先找到了第x位置,插入了一个元素,而后面n-x个元素为了空出这个空,都往后移动了一个,这就是遍历所有的n个元素了,所以这个for
会特别慢。
但如果,你将id排成有序的,你只需要在index_ids中循环一遍,找到每个id所应该插入的位置,然后为了不进行所有元素位移,那就用新的数组存放id和index_ids
,这样计算次数只是id和index_ids
的数量之和,也不用先查找到idx。
两个有序链表合并为一个有序链表也是这个方法。但链表的好处是插入不用移动元素。但即便如此,链表的插入在查找的时候就是得遍历部分的元素或者所有的元素。
既然arrInsert
没办法一次行算出来,那这个问题已经不是有序链表合并的问题了。
平衡树能解决这个问题,{}
对象就是个平衡树。但这个平衡树的问题是,应用在前面的方案上,你会处于一个平衡树与数组之间不断来回转换,如果转换次数太多,那只能是解决当前问题又会出新的问题。
我想到一个可能可行的方法:每当一个数据insert的时候,你把这个数据的索引存到{}
中,然后呢,当{}
对象的大小达到1w个(10w也行,时间越长,回滚越麻烦,但不能1k,100,越晚执行约节省计算)的时候,你把{}
中的元素挨个取出来存到val
数组里(在取的过程中,{}
不能进行插入了,你需要给它加上锁;此时如果有新的insert来了,你得需要用备用{}
来存储,当{}
取完了,把备用的放进去),然后再清空{}
,这是防止在合并val
与index_ids
时又有insert数据来,然后给val
数组排序,执行:
function array_insert(val, index_ids){
var newArray = [];
let arrInsert = val;
var index = 0;
for(var i in index_ids){
var now = index_ids[i];
if(index < arrInsert.length && index_ids[i] < arrInsert[index]){
newArray.push(index_ids[i]);
}else{
if(index < arrInsert.length){
newArray.push(arrInsert[index]);
index++;
}
newArray.push(index_ids[i]);
}
}
return newArray;
}
然后清空val
,把返回的newArray
赋值给index_ids
,继续用{}
装接下来的insert请求。
怪我咯2017-04-11 13:18:30
splice 性能杀手.
我真的很没太看懂, 第一个答案是要干嘛. 可能是我太菜.
当数据过多时, splice能不用就别用, 无论是数组去重还是插入, 都很耗费性能.
题外话: 数组去重可以参考这个 https://www.zhihu.com/questio...
这种情况, 建议用JavaScript链表.(自定义)
废话不多说, 数据说明一切: (insert是我自己定义的一个方法)
var arrInsert = [1, 2, 3];
var arrSplice = [1, 2, 3];
var arrList = new LinkedList();
arrList.append(1);
arrList.append(2);
arrList.append(3);
console.time("insert");
for(var i = 0; i < 10000; i++) {
arrInsert = insert(2, 5, arrInsert);
}
console.timeEnd("insert");
console.log(arrInsert.length);
console.time("splice");
for(var j = 0; j < 10000; j++) {
arrSplice.splice(2, 0, 5);
}
console.timeEnd("splice");
console.log(arrInsert.length);
console.time("arrList");
for(var k = 0; k < 10000; k++) {
arrList.insert(2, 0, 5);
}
console.timeEnd("arrList");
console.log(arrList.size());
function insert(index, e, arr) {
var curIndex = arr.length;
while(curIndex > index) {
arr[curIndex--] = arr[curIndex];
}
arr[curIndex] = e;
return arr;
}
function LinkedList() {
var Node = function(element){
this.element = element;
this.next = null;
};
var length = 0;
var head = null;
this.append = function(element){
var node = new Node(element),
current;
if (head === null){
head = node;
} else {
current = head;
while(current.next){
current = current.next;
}
current.next = node;
}
length++;
};
this.insert = function(position, element){
if (position >= 0 && position <= length){
var node = new Node(element),
current = head,
previous,
index = 0;
if (position === 0){
node.next = current;
head = node;
} else {
while (index++ < position){
previous = current;
current = current.next;
}
node.next = current;
previous.next = node;
}
length++;
return true;
} else {
return false;
}
};
this.getHead = function(){
return head;
};
this.size = function() {
return length;
};
}
以上代码的测试结果:
可以看出, splice虽然臭名昭著, 但是相比一般人(本人)三脚猫的代码能力, 还是占了天大的优势的. 但是也差了链表几条街.
同时, 这个实验充分地说明了, 数据结构和算法的重要性.
巴扎黑2017-04-11 13:18:30
先说点题外话,每当这个时候我就会想起《数据结构》书中所讲的链表
,多么美妙的结构~
相对而言,js这硬梆梆的数组真是毫无美感
so,我的解决方案就是仿照Array
的对外公共API,自己封装一个链表的类喽。