const puppeteer = require("puppeteer");
const path = require('path');
const pathToExtension = path.join(__dirname, './chrome-mac/Chromium.app/Contents/MacOS/Chromium');
const conf = {
headless: false,
executablePath: pathToExtension,
defaultViewport: {
width: 1300,
height: 900
},
};
(async () => {
const browser = await puppeteer.launch(conf)
const page = await browser.newPage()
await page.goto('https://www.baidu.com/', {waitUntil: 'networkidle2'});
//addScriptTag需要加在goto的后面,然后就可以在evaluate里使用jQuery的语法了。
await page.addScriptTag({
url: 'https://code.jquery.com/jquery-3.2.1.min.js',
});
await page.waitFor('#u1')
// 可以接收evaluate内部打印的console内容
page.on('console',msg=>{
for(let i =0;i<msg.args().length;i++){
console.log(`${i}: ${msg.args([i])}`)
}
})
const result = await page.evaluate(() => {
let data = []; // 初始化空数组来存储数据
let elements = $("#u1"); // 获取所有元素
for (let element of elements){
let title = element.innerText; // 获取标题
let url = element.href;//获取网址
data.push({title,url}); // 存入数组
}
return data;
});
console.log(result);
await page.waitFor(3000);
await browser.close();
})();
一个简单的puppeteer爬虫
转载本文章为转载内容,我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题,欢迎原作者联系我们进行内容更正或删除文章。
上一篇:linux安装puppeteer
下一篇:mac使用技巧汇总
提问和评论都可以,用心的回复会被更多人看到
评论
发布评论
相关文章
-
实现一个简单的爬虫
阅读之前,如果你对爬虫感到陌生,你也可以点击 这里 在我的另一篇文章中快速、了解掌握爬虫。
图片下载 当前页 html -
一个简单的java爬虫
直接上代码: 运行结果如下:
java .net get请求 -
分享一个简单爬虫
同find方法,找的div的class标签,对于这个问题,我们可以换个思路,这个定位找不到,就往上找,我的代码
图片下载 当前页 Chrome -
【Python爬虫案例】一个简单网站的图片爬虫!
关注过我的老粉,想必都知道,本渣渣是写过一些Pyhton爬虫的,虽然本渣渣代码水平跟垃圾佬捡的垃圾一样垃圾,一样菜,但是
python 爬虫 开发语言 html Windows -
java 一个简单的爬虫项目详解
我们在不久的将来就会相遇的,在那之前,我要成为一名优秀的程序员爬虫对我们来说是一个既爱又恨的家伙。我记得我大学时期,
爬虫 html chrome javascript