异步编程——协同式多任务

翻译自Asynchronous programming. Cooperative multitasking,阅读需要6分钟

这是关于异步编程的系列文章的第一篇文章。整个系列试图回答一个简单的问题:“什么是异步?”。

起初,当我刚开始深入研究这个问题时,我以为我知道它是什么。但是事实是,我甚至没找到异步是什么的线索。所以,让我们找出来!

全系列:

在上一篇文章中,我们讨论了如何确保多个请求的并发处理,以及可以使用线程或进程实现它。但是还有一个选择——协同式多任务。

这个选择是最困难的。在这里,我们不得不说,操作系统当然很赞,它有调度程序/计划程序,它可以处理进程,线程,组织它们之间的切换,处理锁等,但它仍然不知道应用程序是如何工作的,而这些东西作为开发者的我们是知道的。我们知道我们的应用会有短暂的时刻在CPU上执行某些计算操作,但大多数时候都是在等待网络I / O,并且我们更清楚何时应该处理各个请求之间的切换。

从操作系统的角度来看,协同式多任务只是一个执行线程,但在其中,应用程序在处理各个请求/命令之间切换。就之前的网络示例而言,只要一些数据到达,就会读取数据,解析请求,将数据发送到数据库,这是一个阻塞操作,而不是等待来自数据库的响应,它可以开始处理另一个请求。它被称为“协作”,因为所有任务/命令必须协作以使整个调度方案起作用。它们彼此交错,但是在一个被称为协作调度程序的控制线程中,将其角色减少到启动进程并让它们自动将控制权返回给它。

这比线程的多任务处理更简单,因为程序员总是知道哪一个任务在执行,而另一个任务不在执行。虽然在单处理器系统中,线程应用程序也将以交错模式执行,但使用线程的程序员仍应考虑此方法的缺陷,以免应用程序在移动到多处理器系统时工作不正常。但是,即使在多处理器系统上,单线程异步系统也总是以交错方式执行。

编写这样的程序的困难在于,这种切换,维护上下文的过程,以及将每个任务组织为一系列间歇性执行的较小步骤的重任,都落在了开发人员身上。另一方面,我们获得了效率,因为没有不必要的切换,例如,没有在切换线程和切换进程时需要切换处理器上下文的问题。

有两种方法可以实现协同式多任务 – 回调绿色线程

回调

由于所有阻塞操作都会导致操作将在未来的某个时间发生,并且我们的执行线程应该在准备就绪时返回结果。因此,为了获得结果,我们必须注册回调——当请求/操作成功时,它将调用一个回调,或者如果它不成功,它将调用另一个回调。回调是一个明确的选项——当开发人员不知道应该在何时调用某个函数的时候,他就应该以这样的方式编写程序。

这是最常用的选项,因为它是显式的,并且得到了大多数现代语言的支持。

利弊:

  • 与多线程程序不同,没有多线程程序的问题;
  • 线程/协同程序对程序员来说是不可见的;
  • 回调会吞下异常;
  • 回调后的回调会使人困惑,并且难以调试。

绿色线程

第二个选项是隐含的——当开发人员以这样的方式编写程序时,似乎没有协同式多任务。我们像之前一样做了一个阻塞操作,我们希望结果就像这里只有一个进程或线程一样。但是有一个黑魔法“在幕后”——框架或编程语言使阻塞操作无阻塞并将控制转移到其他的执行线程,但不是在操作系统线程的意义上,而是在逻辑线程(用户级别线程)。它们由“普通”用户级进程调度,而不是由内核调度。此选项称为绿色线程

利弊:

  • 控制是在应用程序级别而不是OS;
  • 使用他们感觉就像是线程;
  • 除CPU上下文切换之外,普通基于多线程编程的所有问题都有。

反应器模式

在协同式多任务中,总有一个处理内核负责所有I / O处理。在设计模式里被称为反应器。反应器接口说:“给我一堆你的接口和你的回调,当这个接口准备好进行I / O时,我会调用你的回调函数。”

反应器提供了第二个接口,称为定时器 – “在X毫秒内给我回调,这是我需要调用的回调方法。” 这个东西在协同式多任务里到处都是,无论是明确的还是隐含的。

“在幕后的”反应堆非常简单。它有一个按响应时间排序的计时器列表。它获取了提供给它的接口列表,并将它们发送到轮询准备机制中。可用性轮询机制总是有一个参数——它说明了如果没有网络活动他将阻塞多长时间。阻塞时间表示最近的计时器的响应时间。因此,要么存在某种网络活动,一些套接字将为I / O做好准备,要么我们等待下一个定时器触发,解锁并将控制转移到一个或另一个回调,基本上是一个逻辑流程的执行。

最好的方法

但实际上,这些选项都不是理想选择。合并后的版本效果最好,因为通常协同式多任务会带来好处,特别是如果您的连接会挂起很长时间。例如,Web套接字是一种长期连接。如果分配一个进程或一个线程来处理单个Web套接字,显然你会受限于同时在一个后端服务器上可以拥有的连接数。由于连接存在很长时间,因此保持多个同时连接非常重要,而每个连接的工作量却很少。

缺乏协同式多任务使程序只能使用一个处理器核心。当然,您可以在同一台机器上运行应用程序的多个实例(这并不总是方便的并且有其缺点),因此在每个进程内运行多个进程并使用reactor进行协同多任务处理会很不错。

这种组合一方面可以在我们的系统中使用所有可用的处理器内核,另一方面,它可以在每个内核中高效工作,而无需分配大量资源来处理每个单独的连接。

结论

编写使用协同式多任务的应用程序的困难在于,这些切换过程和上下文的维护,放到了可怜的开发人员肩上。另一方面,使用这种方法我们获得了效率,因为没有了不必要的切换,没有了在切换线程和切换进程时的问题。

在下一篇文章中,我们将讨论异步编程本身以及它与同步编程的区别,是旧概念,但会在新的层面用新的术语。

翻译参考:

发表评论