3.1 技术面数据

技术面数据是通过股票的历史价格和交易量等市场数据进行计算和分析得出的指标。它的核心观点是市场行为会在价格上留下痕迹,通过这些痕迹可以预测未来的价格走势。技术面数据主要关注股票价格的变动和市场趋势,常用的技术指标包括移动平均线、相对强弱指标、MACD指标等。技术面分析认为市场上已有的信息都会反映在股票价格中,因此通过分析股票价格图表和技术指标,可以尽可能准确地判断价格的走势和市场趋势。

3.2 基本面数据

基本面数据是通过分析公司的财务状况、业绩表现、竞争力等基本信息得出的评估。基本面分析认为股票的价格是与公司的基本面因素相关的,包括公司的营业收入、盈利能力、资产负债情况、市场份额、竞争优势等。基本面分析的目标是评估公司的内在价值,并基于这些评估来判断股票的投资潜力。常用的基本面指标包括市盈率、市净率、股息率等。基本面数据通常需要通过公司公开的财务报告和公告来获取。

3.3 技术面数据常见指标

移动平均线(Moving Average, MA)

移动平均线是通过计算一段时间内的股票平均价格来平滑价格波动。常见的移动平均线有简单移动平均线(SMA)和指数移动平均线(EMA)。

相对强弱指数(Relative Strength Index, RSI)

RSI 是一种用于衡量股票价格变动强度和速度的技术指标。它可帮助投资者判断股票市场的超买和超卖情况,以及价格的反转和确认信号。

随机指标(Stochastic Oscillator)

随机指标用于判断股票价格的超买和超卖情况,以及价格反转的可能性。它可以帮助投资者确定适合买入或卖出股票的时机。 随机指标的计算基于一段时间内的收盘价与最高价和最低价的关系。

成交量指标(Volume)

成交量指标衡量了股票交易的活跃程度。当股票价格上涨时,成交量增加可以视为价格上涨的确认,而当股票价格下跌时,成交量增加可能表示价格下跌的确认。 成交量指标的计算非常简单,即某一时间周期内的总成交量。

MACD 指标(Moving Average Convergence Divergence)

MACD 指标是股票技术分析中常用的趋势追踪和买卖信号指标。它通过比较两条移动平均线的差异,来判断股票价格的趋势以及价格的买卖信号。

3.4 基本面数据常见指标

每股收益(Earnings Per Share, EPS)

每股收益的计算公式为:EPS = 净利润 / 流通股本

市净率(Price-to-Book Ratio, P/B Ratio)

市净率的计算公式为:市净率 = 公司总市值 / 公司净资产

股息收益率(Dividend Yield)

股息收益率的计算公式为:股息收益率 = 每股股息 / 股票价格

净利润(Net Profit)

净利润的计算公式为:净利润 = 总收入 - 总成本 - 税收 - 其他费用

负债与资产比率(Debt-to-Asset Ratio)

负债与资产比率的计算公式为:负债与资产比率 = 总负债 / 总资产

3.5 Baostock的基础数据获取

BaoStock 技术面数据简介

证券宝是一个免费、开源的证券数据平台,无需注册即可获取大量准确、完整的证券历史行情数据和上市公司财务数据。

通过Python API获取数据信息,满足量化交易投资者、数量金融爱好者、计量经济从业者的数据需求。该工具包返回的数据格式为pandas DataFrame类型,方便使用pandas/NumPy/Matplotlib进行数据分析和可视化。此外,还支持将数据保存到本地进行分析,提供了更多的灵活性和便利性。

BaoStock 基本面数据简介

BaoStock 除了可以获取技术面数据,还可以获取基本面数据。BaoStock 可以获取的基本面数据主要有季频盈利能力、季频营运能力、季频成长能力、季频偿债能力等。

和技术面类似,BaoStock 通过 API 获取基本面数据。指定入参后,不同的 BaoStock API 会根据入参返回相应的数据。返回的数据类型是 pandasDataFrame

3.6 pandas常见指标的数据清洗

Pandas是一款主要用于组织、操作和分析数据的Python库。虽然它功能丰富。这里介绍Pandas,并讲解它在财务分析中的作用。学习如何使用Pandas存储和访问数据,并介绍基本的Pandas对象作为构建块。Pandas以表格形式组织数据,类似于电子表格的方式,但由于Pandas非常强大,可以比在电子表格中更轻松地执行复杂的分析。

Pandas 的 Series, Indexes和DataFrames

Pandas中的主要对象:DataFrames、Series和Indexes。理解这些对象之间的关系以及它们的用途是很重要的,因为了解Pandas中信息的逻辑和层次结构是从中获得最大收益的关键。

  • 构建 Series 对象

为了更好地理解 Pandas 中的 Series 对象,让我们回到之前的示例,即使用列表计算 Qantas 每周平均股票价格。 我们使用两个单独的列表来维护日期和价格数据,并通过索引日期列表来访问对应的价格数据。使用 Series,我们可以将这两个列表组合成一个对象,从而消除了需要不断检查两个列表是否同步的麻烦。

具体而言,我们使用 Pandas 中的 Series 构造函数来创建一个 Series 对象。这个构造函数是 Pandas 模块的一部分,我们通常将其导入为 pd。构造函数的参数有很多,但在本文中,我们只需要关注数据和索引这两个参数即可。如果需要,可以在 Pandas 的官方文档中查看构造函数的完整参数列表。

  • 构建 DataFrames

让我们从创建 Pandas DataFrame 的基本方法开始。我们可以通过创建单独的 Pandas Series,然后将它们组合成一个数据框来创建 DataFrame。

DataFrame 就像一个电子表格,可以通过列和行的标签来访问其中的数据元素。与 Excel 中的电子表格不同,DataFrame 中的列标签可以是任意的字符串,而行标签则使用相同的索引来标识每个系列中的位置。