进程池和文件下载

#基础组件 2024-10-14

结合学过的文件操作、网络通信、以及进程和线程的知识, 实现一个基本的文件下载服务器模型。尽管线程池才是最常用的，但先从进程池谈起，实际上实现一个池，其余也没太大区别。

第一版

当前第一版还只是解决进程间共享文件对象的问题, 并且实现了服务器的主进程接收客户端连接请求, 并把客户端连接交给进程池中进程具体和客户端进行交互的功能。

代码地址：进程池第一版

主进程用以监听连接请求，建立连接得到的后续用于和客户端通信的 net_fd ，从进程池中选择一个空闲的进程来给 net_fd 发送一个消息，那就需要把 net_fd 给到子进程。

你以为轻松就能传递过去了？进程与进程之间是相互隔离，各自的文件描述符数组是不能被其他进程访问。你传递过去也不过是一个下标，但是你把这个下标拿给别的进程的文件描述符数组访问，得到的又不是一个东西。

两个进程共享一个文件对象

一般我们使用 socketpair 的目的：为了在两个进程之间, 传输一个文件对象的描述信息（可以让两个进程共享一个文件对象）, 而不是单单只传输一个文件描述符数组的下标。

#include <sys/types.h> 
#include <sys/socket.h>
// create a pair of connected sockets
int socketpair(
       int domain, // 指定socket使用的协议族, 本地通信我们使用: AF_LOCAL
       int type, // 指定socket的类型: SOCK_STREAM(TCP), SOCK_DGRAM(UDP)
       int protocol, // 指定协议, 默认设置0即可
       int sv[2] // 用于返回两个连接的socket描述符(等价与socket的fd), 父子进程可以通过这个文件描述符进行通信(任何发送到sv[0]的数据都可以从sv[1]读取，反之任何发送到sv[1]的数据都可以从sv[0]读取。)
);

// 返回值: 成功返回0, 失败返回-1

socketpair 函数用于创建一对互相连接的全双工通信 socket。相比较普通的用于网络间不同主机通信的 socket; socketpair 函数创建的socket主要用于在同一台机器上的进程间通信（我们可以称其为本地 socket ）。

如果你想通过 socketpair 函数实现两个本地进程间的文件对象描述符的传输，除了需要 socketpair 函数创建通信的端点, 还需要借助 sendmsg 函数和 recvmsg 函数来实现具体的数据传输。但是具体的实现代码不用去记，更不用去写，直接从提供的代码地址中的 LocalSocekt.c 文件中获取封装好的函数即可。

// 工作线程用来读取main线程accept的客户端连接对象
// 参数一: 工进程程用来和main进程通信的特制本地socket
// 参数二: 用来存储从本地socket中读到的客户端连接对象的文件描述符
int read_net_fd(int socket_local_fd, int *net_fd)

// main进程accept获得的客户端连接对象发送给工作进程
// 参数一: main进程用来和工作进程通信的本地socket
// 参数二: main进程accept获得到的客户端连接文件对象的文件描述符
int write_net_fd(int socket_local_fd, int* net_fd)

write_net_fd 传递套接字 net_fd，read_net_fd 接受套接字 net_fd。

核心代码解读

socketpair 第四个参数是一个数组，即两个本地 socket_fd 组成的数组。我们也知道 socketpair 是全双公通信，那在代码中只使用一条通道就可以，故而进程把用不到的关闭即可。父进程传输，子进程接受的这样一条单通道。核心代码如下：

int initProcessPool(Worker_Status* subProcess,int size){
  for (int i = 0; i < size; ++i) {
    int socket_fd[2];
    socketpair(AF_LOCAL,SOCK_STREAM,0,socket_fd);

    int pid = fork();

    if (pid == 0){  
      close(socket_fd[1]);	// 关闭用不到的
      startWorker(socket_fd[0]);
    }else{
      close(socket_fd[0]);	// 关闭用不到的
      subProcess[i].pid = pid;	
      subProcess[i].status = FREE;
      subProcess[i].socket_local_fd = socket_fd[1];
    }
  }

  return 0;
}

下面这份代码把子进程存储的本地套接字加入监听，是为了让子进程完成任务之后，让主进程收到消息（消息内容随便写，主要是唤醒作用）之后把子进程的状态改为 FREE。

1
2
3

for (int i = 0; i < PROCESS_SIZE; ++i) {
    epoll_add(epfd, subProcess[i].socket_local_fd);
}

1 2	`pid_t pid = getpid(); send(socket_local_fd,&pid,sizeof(pid),0);`

for (int j = 0; j < PROCESS_SIZE; ++j) {
    if (subProcess[j].socket_local_fd == tmp_fd) {
        subProcess[i].status = FREE;
    }
}

第二版

在上一版本的基础上, 如果客户端的请求是想获得一份在服务端的文件，我们该如何做到呢？

我们需要多次和客户端交流，交换文件的相关信息，但由于 TCP 是流协议，没有边界，就不得不考虑粘包和半包问题。解决方案如下：

粘包：自定义协议

半包：等待满足指定文件长度才停止接受

自定义协议已在其他文章讨论过，而半包问题此前的 Asio 提供这样一种接口，就等待指定长度的消息才解除阻塞。Linux 网络编程一样提供。

#include <sys/types.h>
#include <sys/socket.h>
ssize_t recv(
      int sockfd,
      void *buf,
      size_t len,
      int flags		// 定接收行为的标志位:MSG_WAITALL(等待所有请求的数据才返回)，大多数情况下，flags设置为0。
);

还有关于 send 接口要注意的一个地方，即发送大文件的时候, 客户端有可能在发送的时候提前终止, 这会导致发送端/写端（send）因为抛出SIGPIPE导致进程终止。我们肯定不喜欢我们的进程受到影响。

#include <sys/types.h>
#include <sys/socket.h>
ssize_t send(
  int sockfd, 
  const void *buf, 
  size_t len, 
  int flags// 额外选项:MSG_NOSIGNAL防止发送时由于连接断开而引发的SIGPIPE信号，大多数情况下，flags参数设置为0。
);

代码地址：简单的文件传输

此份代码却有不足，下面会继续迭代，但是对于基本的文件传输已无大碍。由于服务端这边只是读取一次文件且不是重复读取，再者读取的缓冲区大小设置 4096，超过此范围就会丢失。因此，核心的代码解读将放在下面来谈。

下面我们要迭代的将是支持大文件的传输，将存在如下三种版本。

底层原理推荐链接：零拷贝

send/read 通过循环读取并跟踪偏移量实现大文件传输

代码地址：send/read 通过循环读取并跟踪偏移量实现大文件传输

代码解读和优化

int sendFile(int net_fd,int open_fd,off_t file_size){
  while (file_size > 0){
    char buf[BUFFER_SIZE] = {0};
    ssize_t rn = read(open_fd,buf,sizeof(buf));
    if (rn < 0) {
      error(1, errno, "read");
      close(open_fd);
      return -1;
    }
    ssize_t sn = send(net_fd,buf,rn,MSG_NOSIGNAL);
    if (sn < 0) {
      error(1, errno, "send");
      close(open_fd);
      return -1;
    }
    file_size -= sn;
  }
  return 1;
}

每次发送的字节大小为 BUFFER_SIZE，循环发送，直到总的需要传送到文件大小 file_size 不大于 0。

但是这份代码还有待完善的地方，即 rn 是实际读取的长度，sn 是实际发送的长度，可能存在 sn < rn 的情况（套接字的发送缓冲区可能已满，网络的带宽或状态等因素可能限制一次发送的字节数），导致有部分文件丢失。

int sendFile(int net_fd, int open_fd, off_t file_size) {
  while (file_size > 0) {
    char buf[BUFFER_SIZE] = {0};
    ssize_t rn = read(open_fd, buf, sizeof(buf));
    if (rn < 0) {
      error(1, errno, "read");
      close(open_fd);
      return -1;
    }
    if (rn == 0) { 
      break;
    }

    ssize_t total_sent = 0; 
    while (total_sent < rn) {
      ssize_t sn = send(net_fd, buf + total_sent, rn - total_sent, MSG_NOSIGNAL);
      if (sn < 0) {
        error(1, errno, "send");
        close(open_fd);
        return -1;
      }
      total_sent += sn; 
    }
    
    file_size -= total_sent; 
  }
  return 1;
}

还有一个地方需要提及，那就是告知客户端文件大小函数的地方，核心代码如下：

1
2
3

char send_buf[MESSAGE_WAIT] = {0};
memcpy(send_buf,&file_size, sizeof(send_buf));
ssize_t send_len = send(net_fd,send_buf,sizeof(send_buf),MSG_NOSIGNAL);

MESSAGE_WAIT 为 4字节，而客户端那边是有符号整型存储这个数据，就算你是无符号整型来存储，你也顶多告知对方文件大小为4GB，意味着我们只能传输 4GB，这是一种限制。

可以考虑更改为 8 字节，这样传输的文件大小可以在 0~16EB范围，完全不用担心受到限制。源代码不用动，修改 MESSAGE_WAIT 大小即可。

1	`#define MESSAGE_WAIT sizeof(off_t)`

经过测试，成功传输 3GB 大文件。

如何生成大文件？

1 2	`dd if=/dev/urandom of=large_random_file bs=1G count=3 status=progress`

重点关注如下命令，根据需要更改：

bs=1G：

bs 表示块大小（block size），设置为 1GB。dd 每次将读取和写入 1GB 的数据块。

count=3：

count 指定要复制的块数。在这个命令中，设置为 3，这意味着总共会生成 3GB 的随机数据（1GB * 3）。

mmap通过内存映射传输文件

代码地址：mmap 传输小文件

服务器和客户端都映射，但是有几个注意点：

open 文件的时候需要 O_RDWR，避免 mmap 权限不足
mmap 需要用 (char *) 强转
客户端拿到文件具体大小之后，需要用 ftruncate 方法提前把文件大小设置为相应的大小，以便接受文件
最后，记得 munmap 取消映射

当我们强调客户端和服务端都要映射的时候，并不是说服务器这边采用 mmap ，客户端也要用 mmap，反之亦然（包括下面要讲的 sendfile）。mmap 只是一种相较于 read 少一次拷贝，这是一种策略的选择。

真的要传输大文件，你还是需要循环的发送分割的文件，而不是发送整个大文件，否则超过 2G 就会卡住。

int sendFile(int net_fd, int open_fd, off_t file_size) {
  // 映射
  char* mapped = mmap(NULL, file_size, PROT_READ, MAP_SHARED, open_fd, 0);
  if (mapped == MAP_FAILED) {
    error(1, errno, "sendFile mmap");
    close(open_fd);
    return -1;
  }

  // 发送
  ssize_t total_sent = 0;
  while (total_sent < file_size) {
    ssize_t sent_bytes = send(net_fd, mapped + total_sent, file_size - total_sent, MSG_NOSIGNAL);
    if (sent_bytes < 0) {
      error(1, errno, "send");
      munmap(mapped, file_size);
      close(open_fd);
      return -1;
    }
    total_sent += sent_bytes;
  }

  // 解除映射
  if (munmap(mapped, file_size) == -1) {
    error(1, errno, "sendFile munmap");
    return -1;
  }
  close(open_fd);

  return 1;
}

sendfile通过零拷贝传输文件

int sendFile(int net_fd, int open_fd, off_t file_size) {
  off_t offset = 0; // 用于跟踪已经发送的字节
  ssize_t total_sent = 0; // 用于跟踪总共发送的字节数

  while (total_sent < file_size) {
    ssize_t sent_bytes = sendfile(net_fd, open_fd, &offset, file_size - total_sent);
    if (sent_bytes < 0) {
      error(1, errno, "sendFile sendfile");
      close(open_fd);
      return -1;
    }
    total_sent += sent_bytes;
    offset += sent_bytes; 
  }

  close(open_fd);
  return 1;
}

进度条

如果我们想模仿日常下载文件的时候，进度条显示的效果。我们可以在文件传输之前，先传输文件大小给客户端，在客户端不断接收文件的时候，根据已经接收的文件的大小/总文件的大小，显示进度条。

ssize_t recv_len = 0;
ssize_t total_len = 0;
off_t last_update_size = 0; // 每更新一次百分比增加
while (total_len < file_size) { // 循环接收
    recv_len = recv(sock_fd, mapped + total_len, BUFFER_SIZE, 0);
    if (recv_len <= 0) {
        error(1, errno, "recv failed");
        break;
    }
    total_len += recv_len;
    // 计算相比上一次打印, 增加的百分比
    double num = (double) total_len * 100 / file_size - (double) last_update_size * 100 / file_size;
    if (num > 1) {
        // 进度增加了百分之一
        last_update_size = total_len;
        // 打印进度条
        printf("\rnow: %.2f%%", (double) last_update_size * 100 / file_size);
    }
}

进度条对性能有损耗，若非必要可以选择不实现。

总结

不管是哪种发送文件的方式，如果要传输大文件，那就得分段传输，如果直接调用一次接口是不可能发送大文件的，顶多就是 2G。这是历史遗留问题，那个时候只有 32位，没有像现在这样是 64位。
对比三种发送文件的方式，sendfile是最简单，效率也是最高（不是指网络传输）。mmap 麻烦在于要记住它需要注意的地方，很可能会因为记忆遗忘掉，导致看接口也不能写出正确的代码，实在是“不伦不类”。send 是最朴素的方式，先 read 读取文件到缓冲区，再通过 send 把缓冲区的内容发出去，步骤有多余的行为，但是不存在 mmap那样看接口会写错。对此，我心中的排行是 sendfile > send > mmap。

第三版

有序退出

代码地址：有序退出

在谈这件事情之前，还是先把此前的两个函数谈一谈，即传输文件描述符本质的函数。但它只提供两个参数，那将不适用于此情此景，因为我们需要区分到底是退出的含义，还是传递文件描述符的含义。

int local_send(int local_socket, int net_fd, int flag) {
    struct msghdr msg;
    memset(&msg, 0, sizeof(msg));

    // 正文信息
    struct iovec iov[1];
    iov[0].iov_base = &flag;
    iov[0].iov_len = sizeof(flag);
    msg.msg_iov = iov;
    msg.msg_iovlen = 1;

    // 控制信息
    char cmsgbuf[CMSG_SPACE(sizeof(net_fd))];  // 使用栈内存而不是动态分配
    memset(cmsgbuf, 0, sizeof(cmsgbuf));
    
    struct cmsghdr *cms = (struct cmsghdr *)cmsgbuf;
    cms->cmsg_len = CMSG_LEN(sizeof(net_fd));
    cms->cmsg_level = SOL_SOCKET;
    cms->cmsg_type = SCM_RIGHTS;
    
    *((int *) CMSG_DATA(cms)) = net_fd;  // 直接将net_fd写入控制数据

    msg.msg_control = cms;
    msg.msg_controllen = CMSG_LEN(sizeof(net_fd));

    if (sendmsg(local_socket, &msg, 0) == -1) {
        perror("sendmsg failed");
        return -1;
    }

    return 0;
}

int local_recv(int local_socket, int *net_fd, int *status) {
    struct msghdr msg;
    memset(&msg, 0, sizeof(msg));

    // 正文信息
    int flag;
    struct iovec iov[1];
    iov[0].iov_base = &flag;
    iov[0].iov_len = sizeof(flag);
    msg.msg_iov = iov;
    msg.msg_iovlen = 1;

    // 控制信息
    char cmsgbuf[CMSG_SPACE(sizeof(int))];  // 使用栈内存而不是动态分配
    memset(cmsgbuf, 0, sizeof(cmsgbuf));

    msg.msg_control = cmsgbuf;
    msg.msg_controllen = sizeof(cmsgbuf);

    // 接收数据: 从本地socket
    if (recvmsg(local_socket, &msg, 0) == -1) {
        perror("recvmsg failed");
        return -1;
    }

    *status = flag;

    struct cmsghdr *cms = CMSG_FIRSTHDR(&msg);
    if (cms && cms->cmsg_len == CMSG_LEN(sizeof(int)) && cms->cmsg_level == SOL_SOCKET && cms->cmsg_type == SCM_RIGHTS) {
        *net_fd = *((int *) CMSG_DATA(cms));
    } else {
        *net_fd = -1;
    }

    return 0;
}

这样，既可以选择传递文件描述符，也可以选择传递应该标准位 flag。

传递和接收文件描述符。即如果 local_recv 调用之后，flag 为 0 就表明是传递文件描述符。

1
2
3

local_send(subProcess[i].socket_local_fd,net_fd,0);

local_recv(socket_local_fd,&net_fd,&flag);

设置标志位，表明退出。即如果 local_recv 调用之后，flag 为 -1 就表明是退出子进程。

local_send(subProcess[j].socket_local_fd,0,-1);

int flag;
local_recv(socket_local_fd,&net_fd,&flag);

至此，我们可以讲如何让父子进程有序退出。

主进程注册 SIGINT 信号，对应的回调函数如下：

void noticeSonProcess(){
  char* buf = "q";
  write(pipe_fd[1],buf,1);  // 通知 关闭子进程
}

而读管道已经监听到 epoll 树上，随时待命。执行指令如下：

if (tmp_fd == pipe_fd[0]) {
    // 有序关闭子进程
    for (int j = 0; j < PROCESS_SIZE; ++j) {
        local_send(subProcess[j].socket_local_fd, 0, -1);
    }
    for (int j = 0; j < PROCESS_SIZE; ++j) {
        wait(NULL);
    }
    exit(0); // 主进程也可以退出了
}

local_send 发出，即子进程退出的含义，那我们的子进程执行的 startWorker 本质上就是一个循环执行任务的函数，其内部核心实现如下：

int startWorker(int socket_local_fd){
  while(true) {
    int net_fd; // 存储 分配的 socket
    int flag;
    local_recv(socket_local_fd,&net_fd,&flag);   // 如果收到关闭子进程的通知，必然是 runTask 没有启动 或 启动完成

    if (flag == -1){
      printf("已收到退出通知\n");
      break;
    }

    runTask(net_fd);
  }
  return 0;
}

所以判断出 flag 为 -1，退出 while 循环，子进程也不会执行任何东西，只是还存在，当我们已经在最初的时候调用 wait 等待子进程退出，彻底回收子进程。

等到子进程回收完成，主进程也正常退出。

if (tmp_fd == pipe_fd[0]) {
    // 有序关闭子进程
    for (int j = 0; j < PROCESS_SIZE; ++j) {
        local_send(subProcess[j].socket_local_fd, 0, -1);
    }
    for (int j = 0; j < PROCESS_SIZE; ++j) {
        wait(NULL);
    }
    exit(0); // 主进程也可以退出了
}