python 爬取股票信息

原创

mob64ca12e1497a 2023-11-16 09:05:39 ©著作权

文章标签 Python python HTTP 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者mob64ca12e1497a的原创作品，请联系作者获取转载授权，否则将追究法律责任

Python爬取股票信息

Python是一种简单易学的编程语言，广泛应用于数据分析、机器学习和网络爬虫等领域。在金融领域，股票信息是重要的数据资源，利用Python进行股票信息的爬取和分析是非常常见的应用场景。本文将介绍如何使用Python爬取股票信息，并提供相应的代码示例。

1. 爬取股票信息的基本原理

爬取股票信息的基本原理是通过HTTP请求获取网页源代码，然后使用解析库对源代码进行解析，提取出所需的股票信息。具体的步骤如下：

发送HTTP请求：使用Python的requests库向目标网站发送HTTP请求，获取网页的源代码，可根据需要进行设置请求头、Cookie等信息。

import requests

url = '
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
response = requests.get(url, headers=headers)
html = response.text

解析网页源代码：使用解析库对网页源代码进行解析，提取出所需的股票信息。常用的解析库有BeautifulSoup和lxml等。
```
from bs4 import BeautifulSoup

soup = BeautifulSoup(html, 'lxml')
stock_info = soup.find('div', class_='stock-info')
```
提取股票信息：根据网页源代码的结构，使用相应的方法提取出所需的股票信息。
```
stock_name = stock_info.find('h1').text
stock_price = stock_info.find('div', class_='price').text
```

存储股票信息：将提取出的股票信息存储到文件或数据库中，以便后续分析和使用。

import csv

with open('stock.csv', 'w', newline='') as csvfile:
    writer = csv.writer(csvfile)
    writer.writerow(['股票名称', '股票价格'])
    writer.writerow([stock_name, stock_price])

2. 代码示例

下面是一个完整的示例代码，演示了如何使用Python爬取股票信息并存储到CSV文件中。

import requests
from bs4 import BeautifulSoup
import csv

def crawl_stock_info():
    url = '
    headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
    response = requests.get(url, headers=headers)
    html = response.text
    
    soup = BeautifulSoup(html, 'lxml')
    stock_info = soup.find('div', class_='stock-info')
    
    stock_name = stock_info.find('h1').text
    stock_price = stock_info.find('div', class_='price').text
    
    with open('stock.csv', 'w', newline='') as csvfile:
        writer = csv.writer(csvfile)
        writer.writerow(['股票名称', '股票价格'])
        writer.writerow([stock_name, stock_price])

if __name__ == '__main__':
    crawl_stock_info()