以下是使用Python爬取商品页面的示例代码:
import requests
from bs4 import BeautifulSoup
# 定义要爬取的商品链接
url = 'https://www.alibaba.com/product-detail/High-Quality-Custom-Logo-Printing-Black_60802527914.html'
# 发送请求
response = requests.get(url)
# 解析页面内容
soup = BeautifulSoup(response.text, 'html.parser')
# 获取商品标题
title = soup.find('h1', class_='ma-title').text.strip()
# 获取商品价格
price = soup.find('span', class_='ma-ref-price').text.strip()
# 获取商品描述
description = soup.find('div', class_='description-content').text.strip()
# 输出结果
print('商品标题:', title)
print('商品价格:', price)
print('商品描述:', description)
在这个示例中,我们首先定义了要爬取的商品链接,然后使用requests
库发送请求,并将响应传递给BeautifulSoup
库进行解析。之后,我们使用find()
方法获取页面中的商品标题、价格和描述,并将它们打印出来。
请注意,为了使代码更加容错,我们使用了strip()
方法来删除每个结果字符串的前导和后缀空格。