JavaScript与异步编程

JavaScript与异步编程

【引自老帖子的博客】什么是异步(Asynchrony)

按照维基百科上的解释:独立于主控制流之外发生的事件就叫做异步。比如说有一段顺序执行的代码

void function main() { 


  fA(); 


  fB(); 


}(); 

fA => fB 是顺序执行的,永远都是 fA 在 fB 的前面执行,他们就是 同步 的关系。加入这时使用 setTimeout 将 fB 延后

void function main() { 


  setTimeout(fA, 1000); 


  fB(); 


}(); 

这时,fA 相对于 fB 就是异步的。main 函数只是声明了要在一秒后执行一次 fA,而并没有立刻执行它。这时,fA 的控制流就独立于 main 之外。

JavaScript——天生异步的语言

因为 setTimeout 的存在,至少在被 ECMA 标准化的那一刻起,JavaScript 就支持异步编程了。与其他语言的 sleep 不同,setTimeout 是异步的——它不会阻挡当前程序继续往下执行。

然而异步编程真正发展壮大,Ajax 的流行功不可没。Ajax 中的 A(Asynchronous)真正点到了异步的概念——这还是 IE5、IE6 的时代。

回调函数——异步编程之痛

异步任务执行完毕之后怎样通知开发者呢?回调函数是最朴素的,容易想到的实现方式。于是从异步编程诞生的那一刻起,它就和回调函数绑在了一起。

例如 setTimeout。这个函数会起一个定时器,在超过指定时间后执行指定的函数。比如在一秒后输出数字 1,代码如下:

setTimeout(() => { 


  console.log(1); 


}, 1000); 

常规用法。如果需求有变,需要每秒输出一个数字(当然不是用 setInterval),JavaScript 的初学者可能会写出这样的代码:

for (let i = 1; i < 10; ++i) { 


  setTimeout(() => { // 错误! 


    console.log(i); 


  }, 1000); 


} 

执行结果是等待 1 秒后,一次性输出了所有结果。因为这里的循环是同时启了 10 个定时器,每个定时器都等待 1 秒,结果当然是所有定时器在 1 秒后同时超时,触发回调函数。

解法也简单,只需要在前一个定时器超时后再启动另一个定时器,代码如下:

setTimeout(() => { 


  console.log(1); 


  setTimeout(() => { 


    console.log(2); 


    setTimeout(() => { 


      console.log(3); 


      setTimeout(() => { 


        console.log(4); 


        setTimeout(() => { 


          console.log(5); 


          setTimeout(() => { 


            // ... 


          }, 1000); 


        }, 1000); 


      }, 1000) 


    }, 1000) 


  }, 1000) 


}, 1000); 

层层嵌套,结果就是这样的漏斗形代码。可能有人想到了新标准中的 Promise,可以改写如下:

function timeout(delay) { 


  return new Promise(resolve => { 


    setTimeout(resolve, delay); 


  }); 


} 


 


timeout(1000).then(() => { 


  console.log(1); 


  return timeout(1000); 


}).then(() => { 


  console.log(2); 


  return timeout(1000); 


}).then(() => { 


  console.log(3); 


  return timeout(1000); 


}).then(() => { 


  console.log(4); 


  return timeout(1000); 


}).then(() => { 


  console.log(5); 


  return timeout(1000); 


}).then(() => { 


  // .. 


}); 

漏斗形代码是没了,但代码量本身并没减少多少。Promise 并没能干掉回调函数。

因为回调函数的存在,循环就无法使用。不能循环,那么只能考虑递归了,解法如下:

let i = 1; 


function next() { 


  console.log(i); 


  if (++i < 10) { 


    setTimeout(next, 1000); 


  } 


} 


setTimeout(next, 1000); 

注意虽然写法是递归,但由于 next 函数都是由浏览器调用的,所以实际上并没有递归函数的调用栈结构。

Generator——JavaScript 中的半协程

很多语言都引入了协程来简化异步编程,JavaScript 也有类似的概念,叫做 Generator。

MDN 上的解释:Generator 是一种可以中途退出之后重入的函数。他们的函数上下文在每次重入后会被保持。简而言之,Generator 与普通 Function 最大的区别就是:Generator 自身保留上次调用的状态。

举个简单的例子:

function *gen() { 


  yield 1; 


  yield 2; 


  return 3; 


} 


 


void function main() { 


  var iter = gen(); 


  console.log(iter.next().value); 


  console.log(iter.next().value); 


  console.log(iter.next().value); 


}(); 

代码的执行顺序是这样:

  1. 请求 gen,得到一个迭代器 iter。注意此时并未真正执行 gen 的函数体。
  2. 调用 iter.next(),执行 gen 的函数体。
  3. 遇到 yield 1,将 1 返回,iter.next() 的返回值即为 { done: false, value: 1 },输出 1
  4. 调用 iter.next()。从上次 yield 出去的地方继续往下执行 gen。
  5. 遇到 yield 2,将 2 返回,iter.next() 的返回值即为 { done: false, value: 2 },输出 2
  6. 调用 iter.next()。从上次 yield 出去的地方继续往下执行 gen。
  7. 遇到 return 3,将 3 返回,return 表示整个函数已经执行完毕。iter.next() 的返回值即为 { done: true, value: 3 },输出 3

调用 Generator 函数只会返回一个迭代器,当用户主动调用了 iter.next() 后,这个 Generator 函数才会真正执行。

你可以使用 for ... of 遍历一个 iterator,例如

for (var i of gen()) { 


  console.log(i); 


} 

输出 1 2,最后 return 3 的结果不算在内。想用 Generator 的各项生成一个数组也很简单,Array.from(gen()) 或直接用 [...gen()] 即可,生成 [1, 2] 同样不包含最后的 return 3。

Generator 是异步的吗

Generator 也叫半协程(semicoroutine),自然与异步关系匪浅。那么 Generator 是异步的吗?

既是也不是。前面提到,异步是相对的,例如上面的例子

function *gen() { 


  yield 1; 


  yield 2; 


  return 3; 


} 


 


void function main() { 


  var iter = gen(); 


  console.log(iter.next().value); 


  console.log(iter.next().value); 


  console.log(iter.next().value); 


}(); 

我们可以很直观的看到,gen 的方法体与 main 的方法体在交替执行,所以可以肯定的说,gen 相对于 main 是异步执行的。然而此段过程中,整个控制流都没有交回给浏览器,所以说 gen 和 main 相对于浏览器是同步执行的。

用 Generator 简化异步代码

回到最初的问题:

for (let i = 0; i < 10; ++i) { 


  setTimeout(() => { 


    console.log(i); 


  }, 1000); 


  // 等待上面 setTimeout 执行完毕 


} 

关键在于如何等待前面的 setTimeout 触发回调后再执行下一轮循环。如果使用 Generator,我们可以考虑在 setTimeout 后 yield 出去(控制流返还给浏览器),然后在 setTimeout 触发的回调函数中 next,将控制流交还回给代码,执行下一段循环。

let iter; 


 


function* run() { 


  for (let i = 1; i < 10; ++i) { 


    setTimeout(() => iter.next(), 1000); 


    yield; // 等待上面 setTimeout 执行完毕 


    console.log(i); 


  } 


} 


 


iter = run(); 


iter.next(); 

代码的执行顺序是这样:

  • 请求 run,得到一个迭代器 iter。注意此时并未真正执行 run 的函数体。
  • 调用 iter.next(),执行 run 的函数体。
  • 循环开始,i 初始化为 1。
  • 执行 setTimeout,启动一个定时器,回调函数延后 1 秒执行。
  • 遇到 yield(即 yield undefined),控制流返回到最后的 iter.next() 之后。因为后面没有其他代码了,浏览器获得控制权,响应用户事件,执行其他异步代码等。
  • 1 秒后,setTimeout 超时,执行回调函数 () => iter.next()。
  • 调用 iter.next()。从上次 yield 出去的地方继续往下执行,即 console.log(i),输出 i 的值。
  • 一次循环结束,i 自增为 2,回到第 4 步继续执行
  • ……

这样即实现了类似同步 sleep 的要求。

async、await——用同步语法写异步代码

上面的代码毕竟需要手工定义迭代器变量,还要手工 next;更重要的是与 setTimeout 紧耦合,无法通用。

我们知道 Promise 是异步编程的未来。能不能把 Promise 和 Generator 结合使用呢?这样考虑的结果就是 async 函数。

用 async 得到代码如下

function timeout(delay) { 


  return new Promise(resolve => { 


    setTimeout(resolve, delay); 


  }); 


} 


 


async function run() { 


  for (let i = 1; i < 10; ++i) { 


    await timeout(1000); 


    console.log(i); 


  } 


} 


run(); 

按照 Chrome 的设计文档,async 函数内部就是被编译为 Generator 执行的。run 函数本身会返回一个 Promise,用于使主调函数得知 run 函数什么时候执行完毕。所以 run() 后面也可以 .then(xxx),甚至直接 await run()。

注意有时候我们的确需要几个异步事件并行执行(比如调用两个接口,等两个接口都返回后执行后续代码),这时就不要过度使用 await,例如:

const a = await queryA(); // 等待 queryA 执行完毕后 


const b = await queryB(); // 执行 queryB 


doSomething(a, b); 

这时 queryA 和 queryB 就是串行执行的。可以略作修改:

const promiseA = queryA(); // 执行 queryA 


const b = await queryB(); // 执行 queryB 并等待其执行结束。这时同时 queryA 也在执行。 


const a = await promiseA(); // 这时 queryB 已经执行结束。继续等待 queryA 执行结束 


doSomething(a, b); 

我个人比较喜欢如下写法:

const [ a, b ] = await Promise.all([ queryA(), queryB() ]); 


doSomething(a, b); 

将 await 和 Promise 结合使用,效果更佳!

结束语

相关推荐