数据产品经理要做数据分析,首先要学如何获取数据。有些人说,我请开发小伙伴导数据不行吗?一方面工作中,获取数据是一个比较频繁的事情,你经常麻烦同事帮忙取数据不现实;另一方面生产环境的数据也是非常敏感的,不可能随便导出使用。

基础概念

我们一般使用什么工具查询数据呢?就是用SQL语言从数据库查询数据。

什么是SQL?

操作数据库里数据的一种结构化开发语言。

什么是数据库,什么是表?

你可以把数据库想象成一个储存文件的“书柜”;书柜里面的一本本书就是数据库里的“表”;书里面印刷的字就是“表”里面的“数据”。

数据库有很多种类型,一般来说用的比较多的是关系数据库。顾名思义:关系数据库=多张表+各表之间的关系。

表的一般结构是什么样的?

数据库里面的“表”和Excel里面的表是一样的。一般包括三个部分:表的名称,表的列,和记录数据的行。如下图:


dbeaver里面写Python脚本 dbeaver在哪写sql_dbeaver安装


蓝色背景的是表的名称(这个不在表的内容里面,为了展示方便,我写在了表里面)。

绿色部分是表列名。

白色部分是记录数据的行。

表与表之间如何建立起关系?

通常一个关系数据库里面会有很多张表,不同的表之间通过什么建立关系呢?下面列了一个数据库的两张表:左边是出版商表,右边是财经书籍表:


dbeaver里面写Python脚本 dbeaver在哪写sql_dbeaver里面写Python脚本_02


出版商表的灰色部分是中信出版商的基本信息,财经书籍表的灰色部分是中信出版商出版的书籍信息,我们就可以认为这两张表的灰色部分都会通过“出版商编号”关联起来了。(为什么不是出版商名称?因为名字可能会重复,但是编号一般是去重的)。出版商编号也叫做出版商表里的"主键"。


因此,表和表之间一般都是通过主键关联起来。
表和表之间有关系也就是表之间的数据能够通过主键匹配起来。


如何安装数据库?

数据库软件是用来存放数据的工具,市面上有很多种,如MySQL、Oracle、Microsoft SQL Service。我们这里主要介绍MySQL。

使用MySQL数据库,一般要安装两个软件:

  1. MySQL:这是一个关系型数据库管理软件。下载地址:https://dev.mysql.com/downloads/(先安装这个)
  2. 访问数据库的图形化工具:这个有很多软件,Introduction、Dbeaver、Navicat等等。我一般用Navicat(要付费购买,可免费试用。)下载地址:https://www.navicat.com.cn/products

安装步骤:

我的电脑是mac,我介绍下mac的安装方法,windows大同小异:

1


dbeaver里面写Python脚本 dbeaver在哪写sql_dbeaver无法修改表数据_03


2


dbeaver里面写Python脚本 dbeaver在哪写sql_dbeaver安装_04


3

4


dbeaver里面写Python脚本 dbeaver在哪写sql_dbeaver导入sql文件_05


连接名:自己随便起一个名字。

添加到、主机、端口、用户名:都不用修改,默认的值就可以。

密码:输入刚才第一步设置的密码。

以上内容都输入完后,点左下角的【连接测试】。连接成功,则表明连接成功。

5


dbeaver里面写Python脚本 dbeaver在哪写sql_dbeaver无法修改表数据_06


数据获取的基本工具已经准备妥当,接下来会讲一下SQL基本语法,简单查询,复杂查询,多表查询,汇总分析等。