从数据结构分析看：用for each...in 比 for...in 要快些

lebronchen

2013-04-17

之前听说火狐的JS引擎支持for each in的语法，例如下述的代码：

代码如下：

var arr = [10,20,30,40,50];
for each(var k in arr)
    console.log(k);

即可直接遍历出arr数组的内容。

由于只有FireFox才支持，所以几乎所有的JS代码都不用这一特征。

不过在ActionScript里天生就支持for each的语法，不论Array还是Vector，还是Dictionary，只要是可枚举的对象都可以for in和for each in。

之前并没有感觉有太大的差异，为了懒得敲一个each单词，一直用熟悉的for in来遍历。

不过今天仔细琢磨了会，从数据结构的角度分析了下，觉得for in和for each in效率上有着本质的区别，无论是JS还是AS。

原因很简单：Array不是真正意义上的数组！

何为真正意义的数组？当然就是传统语言里type[]定义的数据类型，所有元素都是连续保存的。

“Array”虽然也是数组的意思，但熟悉JS的都知道，它其实是个非线性的伪数组，下标可以是任意数字。写入arr[1000000]并非真正申请容纳一百万个元素的空间，而是把1000000转换成相应的哈希值，对应到很小一块储存空间里，从而节省了大量内存。

例如有如下数组：

代码如下：

var arr = [];
  arr[10] = 1000;
  arr[20] = 2000;
  arr[30] = 5000;
  arr[40] = 8000;
  arr[200] = 9000;

用for...in遍历Array，是个很累赘的过程：

从数据结构分析看：用for each...in 比 for...in 要快些

遍历时每次访问arr[k]，都要进行一次Hash(k)计算，根据散列表的容量取模，最终在冲突链表里找到结果。

如果支持for each...in的语法，其内部的数据结构就决定了会快很多：

从数据结构分析看：用for each...in 比 for...in 要快些

Array里储存存了keys的列表，也把每个values值作为链表关联起来。每当有值添加或删除，就更新其链接关系。

当for each...in遍历时，只需从第一个节点往后迭代即可，无需任何Hash计算。

当然，对于AS3里Vector这样的线性数组来说，两者相差不大；同理，HTML5里支持二进制的数组ArrayBuffer也是如此。不过从理论上来看，即使arr是个连续的线性数组，for each in还是要快一点：

for...in遍历时，每次访问arr[k]都要进行下标越界检查；而for each in则根据内部链表，直接从底层反馈出迭代变量，节省了越界检查的过程。

数据结构遍历 arr 链表数组

安科网

从数据结构分析看：用for each...in 比 for...in 要快些

lebronchen

lebronchen

相关推荐

数据结构--二叉树（Java）

数据结构——树与二叉树的遍历

详解Redis数据结构之跳跃表

Java实现单链表、栈、队列三种数据结构

python的链表基础知识点

图解！24张图彻底弄懂九大常见数据结构！原创 Amazing10 业余码农 5月24日

数据结构 & Java中的内存

比较JavaScript中的数据结构（数组与对象）

java数据结构与算法一：稀疏数组

数据结构之利用PHP实现二分搜索树

泛型和元编程的模型：Java, Go, Rust, Swift, D等

万能Python的秘诀：操纵数据的内置工具

Map和Set两种数据结构在ES6的作用

「算法与数据结构」带你看回溯算法之美

学c++需要先学c语言吗？

动图演示：手撸堆栈的两种实现方法！

技术人员思维和认知升级

数据结构 4

HBase/TiDB都在用的数据结构：LSM Tree，不得了解一下？

编写更简洁的Python代码的5个技巧

lebronchen