Ruby多进程并行抓取网页
转载想研究一下各大网站首页有多少个链接,于是用Ruby写了一个脚本,用Beanstalk消息队列,把任务放入Beanstalk中,同时开启多个子进程,如20个,并行运行,同时抓取网页,先抓取完成的进程再次读取Beanstalk任务,继续执行,直到没有任务后,进程退出,主进程等待所有子进程退出后,打印抓取的消息。
上一篇:常见三级菜单
下一篇:JS 遍历map List
提问和评论都可以,用心的回复会被更多人看到
评论
发布评论
相关文章