• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    公众号

C10K问题探讨

原作者: [db:作者] 来自: [db:来源] 收藏 邀请

编写连接数巨大的高负载服务器程序时,经典的多线程模式和select模式都不再适用。 应当抛弃它们,采用epoll,kqueue,dev/poll来捕获I/O事件。最后简要介绍了AIO。
由来
网络服务在处理数以万计的客户端连接时,往往出现效率低下甚至完全瘫痪,这被称为C10K问题。随着互联网的迅速发展,越来越多的网络服务开始面临C10K问题,作为大型网站的开发人员有必要对C10K问题有一定的了解。
本文的主要参考文献是<http://www.kegel.com/c10k.html>。
C10K问题的最大特点是:设计不够良好的程序,其性能和连接数及机器性能的关系往往是非线性的。举个例子:如果没有考虑过C10K问题,一个经典的基于 select的程序能在旧服务器上很好处理1000并发的吞吐量,它在2倍性能新服务器上往往处理不了并发2000的吞吐量。
这是因为在策略不当时,大量操作的消耗和当前连接数n成线性相关。会导致单个任务的资源消耗和当前连接数的关系会是O(n)。而服务程序需要同时对数以万 计的socket进行I/O处理,积累下来的资源消耗会相当可观,这显然会导致系统吞吐量不能和机器性能匹配。为解决这个问题,必须改变对连接提供服务的 策略。
基本策略
主要有两方面的策略:
1.应用软件以何种方式和操作系统合作,获取I/O事件并调度多个socket上的I/O操作;
2. 应用软件以何种方式处理任务和线程/进程的关系。
前者主要有阻塞I/O、非阻塞I/O、异步I/O这3种方案,
后者主要有每任务1进程、每任务1线程、单线程、多任务共享线程池以及一些更复杂的变种方案。
常用的经典策略如下:
1. Serve on

e client with each thread/process, and use blocking I/O
这是小程序和java常用的策略,对于交互式的长连接应用也是常见的选择(比如BBS)。 这种策略很难满足高性能程序的需求,好处是实现极其简单,容易嵌入复杂的交互逻辑。Apache、ftpd等都是这种工作模式。
2. Serve many clients with single thread, and use nonblocking I/O and readiness notification
这是经典模型,datapipe等程序都是如此实现的。优点在于实现较简单,方便移植,也能提供足够的性能;缺点在于无法充分利用多CPU的机器。尤其是程序本身没有复杂的业务逻辑时。
3. Serve many clients with each thread, and use nonblocking I/O and readiness notification
对经典模型2的简单改进,缺点是容易在多线程并发上出bug,甚至某些OS不支持多线程操作readiness notification。
4. Serve many clients with each thread, and use asynchronous I/O
在有AIO支持的OS上,能提供相当高的性能。不过AIO编程模型和经典模型差别相当大,基本上很难写出一个框架同时支持AI/O和经典模型,降低了程序的可移植性。在Windows上,这基本上是唯一的可选方案。
本文主要讨论模型2的细节,也就是在模型2下应用软件如何处理Socket I/O。
select 与 poll
最原始的同步阻塞 I/O 模型的典型流程如下:
从应用程序的角度来说,read 调用会延续很长时间,应用程序需要相当多线程来解决并发访问问题。
同步非阻塞I/O对此有所改进:
经典的单线程服务器程序结构往往如下:
do {
    Get Readiness Notification of all sockets
    Dispatch ready handles to corresponding handlers
    If (readable) {
       read the socket
       If (read done)
           Handler process the request
    }
    if (writable)
       write response
    if (nothing to do)
       close socket
} while(True)
其中关键的部分是readiness notification,找出哪一个socket上面发生了I/O事件。
一般从教科书和例子程序中首先学到的是用select来实现。Select定义如下:
int select(int n, fd_set *rd_fds, fd_set *wr_fds, fd_set *ex_fds, struct timeval *timeout);
针对fd_set的问题,*nix提供了poll函数作为select的一个替代品。poll的接口如下:
int poll(struct pollfd *ufds, unsigned int nfds, int timeout);
第 1个参数ufds是用户提供的一个pollfd数组,数组大小由用户自行决定,因此避免了FD_SETSIZE带来的麻烦。ufds是fd_set的一个 完全替代品,从select到poll的移植很方便。到此为止,至少我们面对C10K,可以写出一个能work的程序了。
然而Select和 Poll在连接数增加时,性能急剧下降。这有两方面的原因:首先操作系统面对每次的select/poll操作,都需要重新建立一个当前线程的关心事件列 表,并把线程挂在这个复杂的等待队列上,这是相当耗时的。其次,应用软件在select/poll返回后也需要对传入的句柄列表做一次扫描来 dispatch,这也是很耗时的。这两件事都是和并发数相关,而I/O事件的密度也和并发数相关,导致CPU占用率和并发数近似成O(n2)的关系。
epoll, kqueue, /dev/poll
因为以上的原因,*nix的hacker们开发了epoll, kqueue, /dev/poll这3套利器来帮助大家,让我们跪拜三分钟来感谢这些大神。其中epoll是linux的方案,kqueue是freebsd的方案, /dev/poll是最古老的Solaris的方案,使用难度依次递增。
简单的说,这些api做了两件事:
1.避免了每次调用select/poll时kernel分析参数建立事件等待结构的开销,kernel维护一个长期的事件关注列表,应用程序通过句柄修改这个列表和捕获I/O事件。
2.避免了select/poll返回后,应用程序扫描整个句柄表的开销,Kernel直接返回具体的事件列表给应用程序。
在接触具体api之前,先了解一下边缘触发(edge trigger)和条件触发(level trigger)的概念。边缘触发是指每当状态变化时发生一个io事件,条件触发是只要满足条件就发生一个io事件。举个读socket的例子,假定经过 长时间的沉默后,现在来了100个字节,这时无论边缘触发和条件触发都会产生一个read ready notification通知应用程序可读。应用程序读了50个字节,然后重新调用api等待io事件。这时条件触发的api会因为还有50个字节可读从 而立即返回用户一个read ready notification。而边缘触发的api会因为可读这个状态没有发生变化而陷入长期等待。 因此在使用边缘触发的api时,要注意每次都要读到socket返回EWOULDBLOCK为止,否则
这个socket就算废了。而使用条件触发的api时,如果应用程序不需要写就不要关注socket可写的事件,否则就会无限次的立即返回一个write ready notification。大家常用的select就是属于条件触发这一类,以前本人就犯过长期关注socket写事件从而CPU 100%的毛病。
简单介绍一下kqueue和/dev/poll
kqueue是freebsd的宠儿,kqueue实际上是一个功能相当丰富的kernel事件队列,它不仅仅是select/poll的升级,而且可以处理signal、目录结构变化、进程等多种事件。kqueue是边缘触发的。
/dev/poll是Solaris的产物,是这一系列高性能API中最早出现的。Kernel提供一个特殊的设备文件/dev/poll。应用程序打开 这个文件得到操纵fd_set的句柄,通过写入pollfd来修改它,一个特殊ioctl调用用来替换select。由于出现的年代比较早,所以/dev /poll的接口现在看上去比较笨拙可笑。
异步I/O以及Windows
和经典模型不同,异步I/O提供了另一种思路。和传统的同步I/O不同,异步I/O允许进程发起很多I/O 操作,而不用阻塞或等待任何操作完成。稍后或在接收到 I/O 操作完成的通知时,进程就可以检索 I/O 操作的结果。
异步非阻塞 I/O 模型是一种处理与 I/O 重叠进行的模型。读请求会立即返回,说明read 请求已经成功发起了。在后台完成读操作时,应用程序然后会执行其他处理操作。当read的响应到达时,就会产生一个信号或执行一个基于线程的回调函数来完 成这次I/O处理过程。
异步I/O 模型的典型流程:
对于文件操作而言,AIO有一个附带的好处:应用程序将多个细碎的磁盘请求并发的提交给操作系统后,操作系统有机会对这些请求进行合并和重新排序,这对同步调用而言是不可能的——除非创建和请求数目同样多的线程。
Linux Kernel 2.6提供了对AIO的有限支持——仅支持文件系统。libc也许能通过线程来模拟socket的AIO,不过这对性能没意义。总的来说Linux的aio还不成熟。
Windows对AIO的支持很好,有IOCP队列和IPCP回调两种方式,甚至提供了用户级异步调用APC功能。Windows下AIO是唯一可用的高性能方案,详情请参考MSDN。

鲜花

握手

雷人

路过

鸡蛋
该文章已有0人参与评论

请发表评论

全部评论

专题导读
上一篇:
codeforces57CArray(简单排列组合)发布时间:2022-07-13
下一篇:
C++回顾day03---输入输出流发布时间:2022-07-13
热门推荐
阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap