教程阐明
C++高性能网络服务保姆级教程
首发地址
day02 真正的高并发还得看IO多路复用
本节目的
应用epoll实现一个高并发的服务器
从单过程讲起
上节从一个根底的socket服务说起咱们实现了一个根本的socket服务器,并留了个思考题
先启动server,而后启动一个client,不输出数据,这个时候在另外一个终端上再启动一个client,并在第二个client终端中输出数据,会产生什么呢?
实际操作后,咱们会发现,在第二个client输出后,服务端并没有响应,直到第一个client也输出数据实现交互后,第二个client才会有数据返回。
这是因为服务端accept获取到第一个client的套接字后,因为第一个client未输出数据,所以服务端过程会阻塞在期待客户端数据那一行。
...int read_num = read(accept_fd, read_msg, 100);...
所以,第二个client实现三次握手后,连贯始终在服务端的全连贯队列中,期待accept获取解决。
多线程,一个线程一个连贯
后续的client无奈失去解决是因为服务端只有一个线程,获取client套接字还有连贯通信全在一个线程中。
那咱们间接开多个线程就好了,主线程只负责accept获取客户端套接字。每来一个连贯,咱们就新起一个线程去解决客户端和服务端的通信。这样多个连贯之间就不会相互影响了。服务端程序如下:
// per_conn_per_thread_server.cpp#include <sys/socket.h>#include <netinet/in.h>#include <unistd.h>#include <thread>#include <arpa/inet.h>#include <string.h>#include <cstdio>#include <errno.h>void handleConn(int accept_fd) { char read_msg[100]; int read_num = read(accept_fd, read_msg, 100); printf("get msg from client: %s\n", read_msg); int write_num = write(accept_fd, read_msg, read_num); close(accept_fd);}int main() { int listen_fd = socket(AF_INET, SOCK_STREAM, 0); struct sockaddr_in server_addr; bzero(&server_addr, sizeof(server_addr)); server_addr.sin_family = AF_INET; server_addr.sin_addr.s_addr = inet_addr("127.0.0.1"); server_addr.sin_port = htons(8888); if (bind(listen_fd, (struct sockaddr *)&server_addr, sizeof(server_addr)) < 0) { printf("bind err: %s\n", strerror(errno)); close(listen_fd); return -1; } if (listen(listen_fd, 2048) < 0) { printf("listen err: %s\n", strerror(errno)); close(listen_fd); return -1; } struct sockaddr_in client_addr; bzero(&client_addr, sizeof(struct sockaddr_in)); socklen_t client_addr_len = sizeof(client_addr); int accept_fd = 0; while((accept_fd = accept(listen_fd, (struct sockaddr *)&client_addr, &client_addr_len)) > 0) { printf("get accept_fd: %d from: %s:%d\n", accept_fd, inet_ntoa(client_addr.sin_addr), ntohs(client_addr.sin_port)); std::thread handleThread(handleConn, accept_fd); // 将线程设置为后盾线程,防止阻塞主线程 handleThread.detach(); }}
应用thread库时,如果应用g++进行编译须要增加
-lpthread
,残缺编译命令:g++ -std=c++11 xxx.cpp -lpthread
看似解决阻塞问题了,但其实这种计划有大缺点,只有咱们略微加大下客户端的并发度,就会发现服务端会解决不过去。每来一个连贯都创立一个新线程,解决完后再销毁线程,这种解决形式老本太大。
IO多路复用和Reactor模型
咱们仔细分析下,「per connection per thread」呈现性能瓶颈有以下几个起因:
- 一个零碎能同时创立的线程数量是无限的,而且线程数量越多,占用内存也会变多,容易导致OOM。
- 每个连贯都用一个新线程去解决,解决完结后销毁对应线程,线程创立和销毁都须要较大开销。
- 一个线程当执行工夫片用完或者遇到零碎调用阻塞时,都会让出CPU。CPU会保留线程的现场信息,而后去执行其余线程(这个过程也称为CPU上下文切换)。所以当线程数很多时,CPU的线程上下文切换也会越频繁,真正用于解决连贯通信的工夫也会越少。也就是CPU在瞎忙活。
既然是因为并发量高时线程太多导致的性能问题,那如果有一种技术,能让一个线程负责N个连贯就能完满解决了。伪代码如下:
class HandleThread { std::vector<int> handle_fds; void addFd(int fd) {handle_fds.push_back(fd)}; void work();}HandleThread::work() { for(;;) { int readyFd = getReadyIOFd(); ... // 对readyFd读写解决 ... }}auto pool = createThreadPool(4);int accept_fd = accept(...);HandleThread thread = pool.getThread();thread.addFd(accept_fd);
下面代码大家应该很容易看懂,先创立一个指定线程数量的线程池,主线程获取到新连贯后,丢到线程池的一个线程去解决。每个线程初始化后会执行work函数,work函数是一个while死循环,外面的getReadyIOFd会阻塞线程,直到有可读可写的套接字时,才会唤醒线程,去进行连贯的读写。
扫盲点:个别咱们讲的因为零碎调用(比方read/write等)导致阻塞,这个时候阻塞的线程状态会被置为挂起,不会占用CPU。所以下面尽管有个while死循环,但在getReadyIOFd被阻塞了,getReadyIOFd底层也是个零碎调用(具体实现咱们前面会讲到),在没有可读写的套接字时线程并不会占用CPU。
下面的流程,其实就是赫赫有名的IO多路复用和Reactor多线程模型了。
epoll退场
这一节咱们具体聊聊一个handleThread是如何治理多个套接字的。
IO多路复用的实现模型大家多少听过一些,咱们先比拟下常见的select和epoll
select
select简略了解就是拿一个数组保留连贯套接字,调用select时,会将整个数组拷贝到内核空间中,如果以后数组中没有可读写的套接字,线程被阻塞。
等到数组中有可读写的套接字,或者超时(select能够设置阻塞的超时工夫),select调用会返回,而后线程遍历全副数组,找到可读写的套接字,进行读写解决。
select存在以下几个毛病:
- 数组中的套接字数量有限度。最多1024个,这个数是select代码中写死的,具体可看
/usr/include/bits/typesizes.h
中有定义。 - select返回后,只是通知咱们这些数组中有fd就绪了,但却没通知咱们具体是哪个fd可读写,咱们须要轮训整个数据,能力找到可操作的fd。效率比拟低
- 须要保护一个用来寄存大量fd的数据结构,这样会使得用户空间和内核空间在传递该构造时复制开销大。
epoll
epoll是linux2.6的时候提出的,epoll在內核中保护了一个eventpoll对象,eventpoll蕴含一个红黑树结构的期待队列wq和一个链表构造的就绪队列rdlist。
新获取到一个套接字后,将该套接字增加到wq中,等到套接字可读写时,操作系统会将该套接字从wq转到rdlist,而后线程间接解决rdlist中的套接字即可,不须要再遍历全副监听的套接字了。
与select相比,能够发现有以下几个长处:
- 没有套接字数量的限度
- 阻塞返回后,会明确告知哪些套接字是能够读写的,不须要全副轮训,效率较高
epoll根本应用
因为咱们的我的项目选用epoll,所以上面咱们具体讲讲epoll的应用办法
epoll_create
创立一个epoll实例int epoll_create(int size);int epoll_create1(int flags);
- size:用来告知內核冀望监控的套接字数量,但在2.6.8之后就废除了,由零碎自动化调配。
- flags: 如果设置为0,和
epoll_create
性能雷同。能够设置为EPOLL_CLOEXEC
, 示意当持有epoll句柄的过程fork出一个子过程时,子过程不会蕴含该epoll_fd。 - 返回值:胜利返回epoll_fd,失败返回-1
epoll_ctl
治理监听的描述符,并注册要监听的事件int epoll_ctl(int epfd, int op, int fd, struct epoll_event* event);
- epfd:
epoll_create
创立的epoll_fd - op: 要操作的类型:
a. EPOLL_CTL_ADD :注册事件
b. EPOLL_CTL_MOD:更改事件
c. EPOLL_CTL_DEL:删除事件 - fd: 要操作的文件描述符
event: 要注册的事件类型
typedef union epoll_data{ void *ptr; int fd; uint32_t u32; uint64_t u64;} epoll_data_t;struct epoll_event{ uint32_t events; /* Epoll events */ epoll_data_t data; /* User data variable */}// epoll_event.event示意具体的事件类型,常见有以下几种:// EPOLLIN:文件描述符可读// EPOLLOUT:文件描述符可写// EPOLLRDHUP:套接字对端断开// EPOLLET:边缘触发(前面细讲)
epoll_wait
期待事件产生,没有事件时,调用者过程会被挂起,等到事件产生/超时后返回int epoll_wait(int epfd, struct epoll_event* evlist, int maxevents, int timeout);
- epfd:
epoll_create
创立的epoll_fd - evlist: 返回给用户空间的能够解决的IO事件数组,即后面说的就绪队列
- maxevents:示意一次
epoll_wait
最多能够返回的事件数量 - timeout:
epoll_wait
阻塞的超时值,如果设置为-1,示意不超时,如果设置为0,即便没有IO事件也会立刻返回
epoll有EPOLLLT(程度触发)和EPOLLET(边缘触发)两种工作模式:
- 程度触发:只有socket处于可读状态(缓冲区有数据)或可写状态,无论什么时候进行epoll_wait都会返回该socket,也就是说咱们第一次
epoll_wait
返回后读了局部数据,在下一次的epoll_wait
调用还是会返回之前那个没读完数据的socket。 - 边缘触发:只有套接字的状态由不可写到可写或由不可读到可读时,才会触发
epoll_wait
返回。如果咱们第一次epoll_wait
返回中读了局部数据,如果该套接字没再收到新数据,那即便该套接字缓存区中还有一些数据没读,下一次的epoll_wait
也不会返回该套接字了。所以咱们须要在第一次读时通过循环read的形式把套接字中的数据全读出来。
边缘触发解决起来会比程度触发比拟麻烦,但性能会比程度触发高,因为缩小 epoll 相干零碎调用次数
讲完epoll的应用办法,咱们把后面的伪代码套上epoll的边缘触发模式,残缺代码如下:
#include <sys/socket.h>#include <netinet/in.h>#include <unistd.h>#include <thread>#include <arpa/inet.h>#include <string.h>#include <cstdio>#include <errno.h>#include <vector>#include <assert.h>#include <sys/epoll.h>#include <fcntl.h>int setfdNonBlock(int fd) { int flag = fcntl(fd, F_GETFL, 0); if (flag == -1) return -1; flag |= O_NONBLOCK; if (fcntl(fd, F_SETFL, flag) == -1) return -1; return 0;};void handleConn(int accept_fd) { char read_msg[100]; char *buf_ptr = read_msg; int total_read_num = 0; int read_num = 0; // 应用的是epollet边缘触发模式,须要把套接字缓存区中的数据全读完 do { read_num = read(accept_fd, buf_ptr, 100); buf_ptr += read_num; total_read_num += read_num; } while(read_num > 0); printf("get msg from client: %s\n", read_msg); int write_num = write(accept_fd, read_msg, total_read_num); close(accept_fd);}int listenServer(char *host, int port) { int listen_fd = socket(AF_INET, SOCK_STREAM, 0); struct sockaddr_in server_addr; bzero(&server_addr, sizeof(server_addr)); server_addr.sin_family = AF_INET; server_addr.sin_addr.s_addr = inet_addr("127.0.0.1"); server_addr.sin_port = htons(8888); if (bind(listen_fd, (struct sockaddr *)&server_addr, sizeof(server_addr)) < 0) { printf("bind err: %s\n", strerror(errno)); close(listen_fd); return -1; } if (listen(listen_fd, 2048) < 0) { printf("listen err: %s\n", strerror(errno)); close(listen_fd); return -1; } return listen_fd;}const int EPOLLWAIT_TIME = 10000;const int EVENTSMAXNUM = 4096;class HandleThread { public: HandleThread() : epoll_fd_(epoll_create1(EPOLL_CLOEXEC)), epoll_events_(EVENTSMAXNUM), thread_(std::bind(&HandleThread::work, this)) { assert(epoll_fd_ > 0); thread_.detach(); } ~HandleThread() { close(epoll_fd_); } // 线程理论运行函数 void work(); // 增加监听套接字 void addFd(int fd); // 不再监听指定套接字 void rmFd(int fd); private: int epoll_fd_; std::vector<epoll_event>epoll_events_; std::thread thread_;};void HandleThread::work() { for(;;) { int event_count = epoll_wait(epoll_fd_, &*epoll_events_.begin(), epoll_events_.size(), EPOLLWAIT_TIME); if (event_count < 0) { perror("epoll wait error"); continue; } for (int i = 0; i < event_count; i++) { epoll_event cur_event = epoll_events_[i]; int fd = cur_event.data.fd; // 不再监听fd,从epoll中去掉 rmFd(fd); // 解决连贯读写 handleConn(fd); } }}void HandleThread::addFd(int fd) { epoll_event event; event.data.fd = fd; // 只监听读事件 event.events = EPOLLIN | EPOLLET; if (epoll_ctl(epoll_fd_, EPOLL_CTL_ADD, fd, &event) < 0) { perror("epoll_add error"); }}void HandleThread::rmFd(int fd) { epoll_event event; event.data.fd = fd; event.events = EPOLLIN | EPOLLET; if (epoll_ctl(epoll_fd_, EPOLL_CTL_DEL, fd, &event) < 0) { perror("epoll_del error"); }}typedef std::shared_ptr<HandleThread> SP_HandleThread;class HandleThreadPool { public: HandleThreadPool(int thread_nums) : thread_nums_(thread_nums), next_thread_idx_(0) { for (int i = 0; i < thread_nums; i++) { SP_HandleThread t (new HandleThread()); thread_pool_.push_back(t); } } SP_HandleThread getThread(); private: int thread_nums_; int next_thread_idx_; std::vector<SP_HandleThread> thread_pool_;};// 从线程池中获取一个线程SP_HandleThread HandleThreadPool::getThread() { SP_HandleThread t = thread_pool_[next_thread_idx_]; next_thread_idx_ = (next_thread_idx_ + 1) % thread_nums_; return t;}int main() { int listen_fd = listenServer("127.0.0.1", 8888); // 创立线程池 HandleThreadPool pool(4); // 期待1秒 sleep(1); struct sockaddr_in client_addr; bzero(&client_addr, sizeof(struct sockaddr_in)); socklen_t client_addr_len = sizeof(client_addr); int accept_fd = 0; while((accept_fd = accept(listen_fd, (struct sockaddr *)&client_addr, &client_addr_len)) > 0) { printf("get accept_fd: %d from: %s:%d\n", accept_fd, inet_ntoa(client_addr.sin_addr), ntohs(client_addr.sin_port)); // 将fd设置为非阻塞 ? setfdNonBlock(accept_fd); // 从pool中获取一个线程解决连贯 SP_HandleThread t = pool.getThread(); t->addFd(accept_fd); }}
代码比拟长,但不难,大家能够fork下来缓缓看。
应用了智能指针,防止遗记回收堆上的资源。
大家可能会发现代码有两次正文增加了"?",第一处是在创立线程池后,sleep了1秒,这个当老本节的思考题,大家能够先思考,并想想有没有什么更好的解决办法?
第二处是在获取到accept_fd后,将fd设置为非阻塞了。上面咱们开展具体讲讲。
非阻塞与IO多路复用更搭
首先咱们先聊聊阻塞IO调用和非阻塞IO调用的区别。
阻塞IO调用:过程在调用IO操作时,如果没有数据可读或缓冲区没有闲暇空间可写,导致IO操作未实现,过程被阻塞挂起,后续操作将无奈执行。比方上面代码,如果客户端建设连贯后,始终不发送数据,那服务端执行就会阻塞在read
调用,前面的printf
无奈被执行到。
int accept_fd = accept(...);char read_msg[100];int read_num = read(accept_fd, read_msg, 100);printf("i am a log\n");
小提示:下面的代码即便客户端只发了1个字节的数据,服务端read
调用也会返回,并不是要等到读满100个字节才会返回。
非阻塞IO调用: 过程在调用IO操作时,即便IO操作未实现,该IO调用也会立即返回,之后过程能够进行后续操作。比方上面代码,将accept_fd设置为非阻塞后,再调用read
,这时即便客户端没有发数据,服务端也不会始终卡在read
调用上,前面的printf
能顺利打印进去。
int accept_fd = accept(...);// 将fd设置为非阻塞setfdNonBlock(accept_fd);char read_msg[100];int read_num = read(accept_fd, read_msg, 100);printf("i am a log\n");
上面咱们再说下为什么IO多路复用要搭配非阻塞IO?
在后面,咱们应用epoll实现了一个线程治理多个套接字,当某个套接字有读写事件时,epoll_wait
调用返回,通知咱们哪些套接字能读,但并不会通知咱们某个套接字上有多少数据可读。
- 应用非阻塞IO解决形式:咱们只有循环的read,直到读完全副的数据即可(read返回0)。
- 应用阻塞IO解决形式:每次只能调用一次read,因为咱们并不知道下一次循环中还有没有数据可读,如果没数据就会阻塞整个过程了,所以只能期待下一次的
epoll_wait
返回了。这对于程度触发还可行,但对于边缘触发就不行了,因为咱们不晓得这个套接字还会不会有新数据写入,如果对端不再写入新数据,那缓冲区中剩下的数据就再也读不到了。
残缺源码已上传到https://github.com/lzs123/CPr...,欢送fork and star!
参考文章
如果这篇文章说不清epoll的实质,那就过去掐死我吧!
写在最初
如果本文对你有用,点个赞再走吧!或者关注我,我会带来更多优质的内容。