本人前一遍blog中提到,当进程数过多时,多进程插入mysql数据库表,超过了mysql最大连接数,就会报错,插入就会有失败的情况。想通过进程间通信来控制一下连接数,参考了一些网上的blog实现了一下,利用共享内存来存放mysql的连接数,当某个进程在获取信号量后,尝试去连接数据库之前,先判断一下,当前的连接数是否超过了预定的阈值,如果没有,就连接数据库,连接成功后,连接数加一,立马释放信号,等操作数据库完毕后,进程再次阻塞,来获取信号,然后把连接数减一,释放信号量后,进程退出。
这样就可以控制有mysql的连接数不会达到上限,程序不会出现连接数据库失败的情况。当然我可以直接少fork一些进程,本人就是觉得要折腾一下。不然进程通信就懵逼了。而且也不会有以下的问题出现。
但是本人实验,fork一万个子进程,虚拟机很容易就挂了。后来该为fork 5000个子进程,插入一百万条数据,模拟的是最原始的插入。虚拟机虽然没有崩, 但是很卡,期间会出现很多僵尸进程,这里有点疑问。
多进程耗内存比较严重,下一步打算用多线程来试试。
ps:要支持Semaphore函数,php在编译安装是要加上如下参数:

--enable-sysvsem
--enable-sysvshm
--enable-sysvmsg

为此,我还重新编译了php。。。。蛋疼啊。代码如下:

<?php
/**
 * 模拟并发请求,100万次写入数据库
 * 拆分为10000个进程,
 * 使用数据库连接池,size 为500
 *
 */
$total = 1000;
$num   = 500;
$per   = $total/$num;
$poolSize  = 500; // 数据库连接池容量
$sql  = '';
$child = [];
// 共享内存通信
$shm_key = ftok(__FILE__,'t');
$shm_id  = shm_attach($shm_key,1024,0655);
const SHARE_KEY = 1;
$pool = [];
// 加入信号量
$sem_id = ftok(__FILE__,'s');
$signal = sem_get($sem_id);
// 初始化连接数量,开始的连接数为0
shm_put_var($shm_id, SHARE_KEY,0);
$begin  = microtime(true);
echo 'start '.$begin.PHP_EOL;
for($i = 1; $i<= $num; $i++) 
{
    $pid = pcntl_fork();
    if($pid == -1) {
        die('fork error');
    }
    if($pid > 0) {
        //$id = pcntl_wait($status,WNOHANG);
        $child[] = $pid;
    } else if ($pid == 0) {
        while(true) {
            // 获得信号量
            sem_acquire($signal);
            $count = shm_get_var($shm_id, SHARE_KEY);
            if ($count >= $poolSize) {
                sem_release($signal);
                continue;
            } else {
                $link  = mysqli_connect('localhost','root','root','yii2advanced');
                if ($link) {
                    $count++;
                    shm_put_var($shm_id,SHARE_KEY,$count);
                    sem_release($signal);
                    $start = ($i-1)*$per + 1;
                    $end   = $start + $per;
                    for($j = $start; $j< $end; $j++){
                        $time = microtime(true);
                        $sql = 'insert pcntl_test (rank,time) values ('.$j.','.$time.')';
                        mysqli_query($link,$sql);
                    }
                    mysqli_close($link);
                    break;
                }
                
            }
            sleep(1);
        }
        sem_acquire($signal);
        $count = shm_get_var($shm_id,SHARE_KEY);
        $count--;
        shm_put_var($shm_id, SHARE_KEY, $count);
        sem_release($signal);
        $id = getmypid();
        $count++;
        echo 'count : '.$count.' child '.$id.' finished '.microtime(true).PHP_EOL;
        exit(0);
    
    }
}
while(count($child)){
    foreach($child as $k => $pid) {
        $res = pcntl_waitpid($pid, $status, WNOHANG);
        if ( -1 == $res || $res > 0) {
            unset($child[$k]);
        }
    }
}
$end = microtime(true);
echo 'end '.$end.PHP_EOL;
echo 'fork '.$num.'process insert '.$total.' recodes takes '.($end-$begin).PHP_EOL;

最后,我统计分析了一下5千个进程,一百万条记录,插入时,mysql的连接数情况(平均连接数为464),用python作图如下:

程序重启后程序连接mysql的长连接却没销毁 mysql长连接 进程不释放连接_连接数