I/O複用——epoll函式
select函式有效地解決了多個I/O埠的複用問題,但是select函式存在兩個缺陷:
一是程序所能同時開啟的檔案描述符個數受FD_SETSIZE大小的限制;
二是每個select函式返回可用的檔案描述符集合後,應用都必須對所有已註冊的檔案描述符進行遍歷對比,以確定哪個描述符上發生了事件,從而對其進行讀寫操作。
於是隨著檔案描述符的增加,系統的效能線性下降,從Linux核心2.6開始,提供了一種新的I/O模型,稱為事件I/O(epoll)。epoll有效解決了select存在的問題,稱為Linux平臺上逐漸流行的程式設計模式。
二、關於epoll函式的3個系統呼叫
1、epoll_create
#include<sys/epoll.h>
int epoll_create(int size)
返回值:檔案描述符表示成功; -1表示錯誤; errno記錄錯誤號
epoll_create()函式呼叫成功,則初始化一個epoll例項,並返回一個和此例項相關聯的檔案描述符,該檔案描述符實際並不指向任何真實的檔案,僅作為控制代碼用於後續使用此epoll例項,size引數表示應用預計需要核心監視的檔案描述符個數,注意該引數並不表示最大監視檔案描述符個數,而只是一個告訴核心的提示數目,核心可以根據此size引數分配合適的內部資料結構,因此該資料越準確,就越能獲得更好的效能。當發生錯誤時,epoll_create返回-1,並且設定錯誤程式碼errno為以下幾個值:
a. EINVAL 引數size不是一個整數
b. ENFILE 系統已經分配了最大限度的檔案描述符個數了
c. ENOMEM 無足夠記憶體完成此操作
2、epoll_ctl
#include<sys/epoll.h>
int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
epoll的事件註冊函式,它不同與select()是在監聽事件時告訴核心要監聽什麼型別的事件,而是在這裡先註冊要監聽的事件型別。
epfd是epoll_create()的返回值;op表示動作,用三個巨集來表示:EPOLL_CTL_ADD:註冊新的fd到epfd中;EPOLL_CTL_MOD:修改已經註冊的fd的監聽事件;EPOLL_CTL_DEL:從epfd中刪除一個fd;
fd是需要監聽的fd;
event是告訴核心需要監聽什麼事,struct epoll_event結構如下:
typedef union epoll_data {
void *ptr;
int fd;
__uint32_t u32;
__uint64_t u64;
} epoll_data_t;
struct epoll_event {
__uint32_t events; /* Epoll events */
epoll_data_t data; /* User data variable */
};
events可以是以下幾個巨集的集合:
EPOLLIN :表示對應的檔案描述符可以讀(包括對端SOCKET正常關閉);
EPOLLOUT:表示對應的檔案描述符可以寫;
EPOLLPRI:表示對應的檔案描述符有緊急的資料可讀(這裡應該表示有帶外資料到來);
EPOLLERR:表示對應的檔案描述符發生錯誤;
EPOLLHUP:表示對應的檔案描述符被結束通話;
EPOLLET: 將EPOLL設為邊緣觸發(Edge Triggered)模式,這是相對於水平觸發(Level Triggered)來說的。
EPOLLONESHOT:只監聽一次事件,當監聽完這次事件之後,如果還需要繼續監聽這個socket的話,需要再次把這個socket加入到EPOLL佇列裡。
3、epoll_wait
#include<sys/epoll.h>
int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);
返回值:準備好的檔案描述符個數表示成功,-1表示錯誤,errno記錄錯誤號
呼叫epoll_waith後,程序將等待事件的發生,直到timeout引數設定的超時值到時為止,當成功返回後,則返回值為發生了所監視事件的檔案描述符個數,並且引數events指向被返回的事件,本次epoll_wait最多可以返回maxevents個事件,因此可以通過遍歷的方式逐個處理髮生了事件的哪些檔案描述符,另外,如果epoll_wait返回了maxevents個事件,並不表示當前只有maxevents個事件發生,而只是說本次呼叫能處理的事件個數為maxevents,剩下已產生但是未處理的事件存放到epoll上下文的事件佇列中,因此將在下次呼叫epoll_wait並返回時進行處理,epoll_wait呼叫失敗返回-1,並設定錯誤碼如下值:
a. EBADF epfd為一個非法檔案描述符
b. EFAULT 程序沒有events引數所指向記憶體的寫許可權
c. EINTR epoll_wait系統呼叫被訊號中斷
d. EINVAL epfd不是合法epoll檔案描述符,或者maxevents小於或者等於0
注意:若引數timeout為0,則epoll_wait立即返回,即使沒有任何事件發生,並且返回值為0,若引數為-1,則不返回直到發生事件為止。
epoll.c
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <string.h>
#include <assert.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <sys/epoll.h>
#define MAXFD 10
void epoll_add(int epfd,int fd)//往核心事件表中新增檔案描述符
{
struct epoll_event ev;
ev.events = EPOLLIN;//註冊讀事件,設定關注
ev.data.fd = fd;
if(epoll_ctl(epfd,EPOLL_CTL_ADD,fd,&ev )== -1)
//EPOLL_CTL_ADD為操作方法新增
{
perror("epoll_ctl add error");
}
}
void epoll_del(int epfd,int fd)//從核心事件表中移除檔案描述符
{
if(epoll_ctl(epfd,EPOLL_CTL_DEL,fd,NULL) == -1 )
//EPOLL_CTL_ADD為操作方法移除
{
perror("epoll_ctl del error");
}
}
int main()
{
int sockfd = socket(AF_INET,SOCK_STREAM,0);
assert(sockfd != -1);
struct sockaddr_in saddr,caddr;
memset(&saddr,0,sizeof(saddr));
saddr.sin_family = AF_INET;
saddr.sin_port = htons(6000);
saddr.sin_addr.s_addr = inet_addr("127.0.0.1");
int res = bind(sockfd,(struct sockaddr *)&saddr,sizeof(saddr));
assert(res != -1);
listen(sockfd,5);
assert(sockfd != -1);
int epfd = epoll_create(MAXFD);
//系統呼叫,在核心空間中建立核心事件表,實際為一種紅黑樹的資料結構
if(epfd == -1)
{
perror("epoll_create failed");
}
epoll_add(epfd,sockfd);//把事件和檔案描述符新增到紅黑樹中的結點中去
struct epoll_event events[MAXFD];
//因為epoll_wait()會把就緒的檔案描述符存在一個數組中,所以定義這個陣列
while(1)
{
int n = epoll_wait(epfd,events,MAXFD,5000);
//檢查就緒並且將其新增到events這個陣列中
if(n == -1) //失敗
{
perror("epoll_wait error");
continue;
}
else if(n == 0)//超時
{
printf("time out\n");
continue;
}
//有n個數據元素就緒
else
{
int i = 0;
for(;i < n;i++)
{
int fd = events[i].data.fd;
if(events[i].events & POLLIN)
//因為有多種事件,因此要檢查是哪種型別的時間,在此關注檢查讀事件
{
if(fd == sockfd) //監聽套接字
{
int len = sizeof(caddr);
int c = accept(sockfd,&caddr,&len);
if(c <= 0)
{
continue;
}
printf("accept c=%d\n",c);
epoll_add(epfd,c); //新的連線產生,新增到核心事件表中
}
else
{
char buff[128] = {0};
int num = recv(fd,buff,127,0)
if( num <= 0) //對方關閉
{
//先epoll_del()移除再close()關閉,因為epoll_del()中epoll_ctl()這
//個系統呼叫要用到fd,所以不能先關閉,如果先關閉的話,就找不到了,在執
//行時會提示為無效描述符close()不會使值發生變化,但會使得值無效
epoll_del(epfd,fd);
close(fd);
printf("one client close\n");
continue;
}
printf("recv(%d):%s\n",fd,buff);
send(fd,"OK",2,0);
}
}
}
}
}
}
執行結果: