电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

一个“蝇量级”C语言协程库

15页
  • 卖家[上传人]:工****
  • 文档编号:431521223
  • 上传时间:2023-05-01
  • 文档格式:DOCX
  • 文档大小:30.71KB
  • / 15 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、一个轻量级的协助程框架协程(coroutine)顾名思义就是“协作的例程”(co-operative routines)。跟具有操作系统概念的线程不一样,协程是在用户空间利用程序语言的语法语义就能实现逻辑上类似多任务的编程技巧。实际上协程的概念比线程还要早,按照 Knuth 的说法“子例程是协程的特例”,一个子例程就是一次子函数调用,那么实际上协程就是类函数一样的程序组件,你可以在一个线程里面轻松创建数十万个协程,就像数十万次函数调用一样。只不过子例程只有一个调用入口起始点,返回之后就结束了,而协程入口既可以是起始点,又可以从上一个返回点继续执行,也就是说协程之间可以通过 yield 方式转移执行权,对称(symmetric)、平级地调用对方,而不是像例程那样上下级调用关系。当然 Knuth 的“特例”指的是协程也可以模拟例程那样实现上下级调用关系,这就叫非对称协程(asymmetric coroutines)。基于事件驱动模型我们举一个例子来看看一种对称协程调用场景,大家最熟悉的“生产者-消费者”事件驱动模型,一个协程负责生产产品并将它们加入队列,另一个负责从队列中取出产品并使用它。

      2、为了提高效率,你想一次增加或删除多个产品。伪代码可以是这样的:12345678910111213# producer coroutineloopwhile queue is not fullcreate some new itemsadd the items to queueyield to consumer# consumer coroutineloopwhile queue is not emptyremove some items from queueuse the itemsyield to producer大多数教材上拿这种模型作为多线程的例子,实际上多线程在此的应用还是显得有点“重量级”,由于缺乏 yield 语义,线程之间不得不使用同步机制来避免产生全局资源的竟态,这就不可避免产生了休眠、调度、切换上下文一类的系统开销,而且线程调度还会产生时序上的不确定性。而对于协程来说,“挂起”的概念只不过是转让代码执行权并调用另外的协程,待到转让的协程告一段落后重新得到调用并从挂起点“唤醒”,这种协程间的调用是逻辑上可控的,时序上确定的,可谓一切尽在掌握中。当今一些具备协程语义的语言

      3、,比较重量级的如C#、erlang、golang,以及轻量级的python、lua、javascript、ruby,还有函数式的scala、scheme等。相比之下,作为原生态语言的 C 反而处于尴尬的地位,原因在于 C 依赖于一种叫做栈帧的例程调用,例程内部的状态量和返回值都保留在堆栈上,这意味着生产者和消费者相互之间无法实现平级调用,当然你可以改写成把生产者作为主例程然后将产品作为传递参数调用消费者例程,这样的代码写起来费力不讨好而且看起来会很难受,特别当协程数目达到十万数量级,这种写法就过于僵化了。这就引出了协程的概念,如果将每个协程的上下文(比如程序计数器)保存在其它地方而不是堆栈上,协程之间相互调用时,被调用的协程只要从堆栈以外的地方恢复上次出让点之前的上下文即可,这有点类似于 CPU 的上下文切换,遗憾的是似乎只有更底层的汇编语言才能做到这一点。难道 C 语言只能用多线程吗?幸运的是,C 标准库给我们提供了两种协程调度原语:一种是setjmp/longjmp,另一种是ucontext 组件,它们内部(当然是用汇编语言)实现了协程的上下文切换,相较之下前者在应用上会产生相当的

      4、不确定性(比如不好封装,具体说明参考联机文档),所以后者应用更广泛一些,网上绝大多数 C 协程库也是基于 ucontext 组件实现的。“蝇量级”的协程库在此,我来介绍一种“蝇量级”的开源 C 协程库protothreads。这是一个全部用 ANSI C 写成的库,之所以称为“蝇量级”的,就是说,实现已经不能再精简了,几乎就是原语级别。事实上 protothreads 整个库不需要链接加载,因为所有源码都是头文件,类似于 STL 这样不依赖任何第三方库,在任何平台上可移植;总共也就 5 个头文件,有效代码量不足 100 行;API 都是宏定义的,所以不存在调用开销;最后,每个协程的空间开销是 2 个字节(是的,你没有看错,就是一个 short 单位的“栈”!)当然这种精简是要以使用上的局限为代价的,接下来的分析会说明这一点。先来看看 protothreads 作者,Adam Dunkels,一位来自瑞典皇家理工学院的计算机天才帅哥。话说这哥们挺有意思的,写了好多轻量级的作品,都是 BSD 许可证。顺便说一句,轻量级开源软件全世界多如牛毛,可像这位哥们写得如此出名的并不多。比如嵌入式网络

      5、操作系统Contiki,国人耳熟能详的 TCP/IP 协议栈uIP和lwIP也是出自其手。上述这些软件都是经过数十年企业级应用的考验,质量之高可想而知。很多人会好奇如此“蝇量级”的代码究竟是怎么实现的呢?在分析 protothreads 源码之前,我先来给大家补一补 C 语言的基础课;-)简而言之,这利用了 C 语言特性上的一个“奇技淫巧”,而且这种技巧恐怕连许多具备十年以上经验的 C 程序员老手都不见得知晓。当然这里先要声明我不是推荐大家都这么用,实际上这是以破坏语言的代码规范为代价,在一些严肃的项目工程中需要谨慎对待,除非你想被炒鱿鱼。C 语言的“yield 语义”下面的教程来自于一位 ARM 工程师、天才黑客Simon Tatham(开源 Telnet/SSH 客户端PuTTY和汇编器NASM的作者,吐槽一句,PuTTY的源码号称是所有正式项目里最难 hack 的 C,你应该猜到作者是什么语言出身)的博文:Coroutines in C。中文译文在这里。我们知道 python 的 yield 语义功能类似于一种迭代生成器,函数会保留上次的调用状态,并在下次调用时会从上个返回点继续

      6、执行。用 C 语言来写就像这样:12345int function(void) int i;for (i = 0; i 10; i+)return i; /* wont work, but wouldnt it be nice */连续对它调用 10 次,它能分别返回 0 到 9。该怎样实现呢?可以利用 goto 语句,如果我们在函数中加入一个状态变量,就可以这样实现:12345678910111213int function(void) static int i, state = 0;switch (state) case 0: goto LABEL0;case 1: goto LABEL1;LABEL0: /* start of function */for (i = 0; i 10; i+) state = 1; /* so we will come back to LABEL1 */return i;LABEL1:; /* resume control straight after the return */这个方法是可行的。我们在所有需要 yield 的位置都加上标签:起始位

      7、置加一个,还有所有 return 语句之后都加一个。每个标签用数字编号,我们在状态变量中保存这个编号,这样就能在我们下次调用时告诉我们应该跳到哪个标签上。每次返回前,更新状态变量,指向到正确的标签;不论调用多少次,针对状态变量的 switch 语句都能找到我们要跳转到的位置。但这还是难看得很。最糟糕的部分是所有的标签都需要手工维护,还必须保证函数中的标签和开头 switch 语句中的一致。每次新增一个 return 语句,就必须想一个新的标签名并将其加到 switch 语句中;每次删除 return 语句时,同样也必须删除对应的标签。这使得维护代码的工作量增加了一倍。仔细想想,其实我们可以不用 switch 语句来决定要跳转到哪里去执行,而是直接利用 switch 语句本身来实现跳转:1234567891011int function(void) static int i, state = 0;switch (state) case 0: /* start of function */for (i = 0; i 10; i+) state = 1; /* so we will come

      8、 back to case 1 */return i;case 1:; /* resume control straight after the return */酷!没想到 switch-case 语句可以这样用,其实说白了 C 语言就是脱胎于汇编语言的,switch-case 跟 if-else 一样,无非就是汇编的条件跳转指令的另类实现而已(这也间接解释了为何汇编程序员经常揶揄 C 语言是“大便一样的代码”)。我们还可以用 _LINE_ 宏使其更加一般化:1234567891011int function(void) static int i, state = 0;switch (state) case 0: /* start of function */for (i = 0; i 10; i+) state = _LINE_ + 2; /* so we will come back to case _LINE_ */return i;case _LINE_:; /* resume control straight after the return */这样一来我们可以用宏提炼出一种范式,封装成组件:12345678910#define Begin() static int state=0; switch(state) case 0:#define Yield(x) do state=_LINE_; return x; case _LINE_:; while (0)#define End() int function(void) static int i;Begin();for (i = 0; i 10; i+)Yield(i);End();怎么样,看起来像不像发明了一种全新的语言?实际上我们利用了 switch-case 的分支跳转特性,以及预编译的 _LINE_ 宏,实现了一种隐式状态机,最终实现了“yield 语义”。还有一个问题,当你欢天喜地地将这种鲜为人知的技巧运用到你的项目中,并成功地拿去向你的上司邀功问赏的时候,你的上司会怎样看待你的代码呢?你的宏定义中大括号没有匹配完整,在代码块中包含了未用到的 case,Begin 和 Yield 宏里面不完整的七拼八凑你简直就是公司里不遵守编码规范的反面榜样!别着急,在原文中 Sim

      《一个“蝇量级”C语言协程库》由会员工****分享,可在线阅读,更多相关《一个“蝇量级”C语言协程库》请在金锄头文库上搜索。

      点击阅读更多内容
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.