Python的pandasql和R语言的sqldf包对比

原创

wx60c07dee141df 2021-06-09 17:18:05 ©著作权

文章标签 Python开发 Python教程 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者wx60c07dee141df的原创作品，请联系作者获取转载授权，否则将追究法律责任

pandasql包功能描述

pandasql包功能主要是实现SQL语句的增改查删除。pandasql和常见数据库的SQL的区别：

1.常见SQL使用是将数据库中已存储好的数据，利用SQL语句的写法对数据进行一定的增改查删，最终将数据结果查询出来，存储在数据库占用的表空间下，进行查询，将数据给展示出来。这个过程必须依赖数据库，才能使用SQL语句。

2.python中的数据，被读取和加载后，数据将存放在python的对象中，也就是会存在python占用计算机的内存空间内，此时pandasql将存在python对象的数据集对象当做数据表，利用pandasql函数的功能，使用SQL语句的写法将数据从python对象中对数据进行增改查删，这个过程是不需要借助数据库，可独立使用SQL

Python的pandasql和R语言的sqldf包

1.R语言的sqldf包的使用，参考链接为：https://blog.csdn.net/tandelin/article/details/89635072
2.Python的pandasql包使用和下载

> (venv) D:\Python\Python_venu>pip install pandasql -i
> https://pypi.tuna.tsinghua.edu.cn/simple/

操作案例如下所示：

from pandasql import sqldf
from sklearn.datasets import load_iris #导入数据集
import pandas as pd
iris = load_iris()
iris=pd.DataFrame(iris.data)  #一定要先转成数据框
a=sqldf("select * from iris limit 10;", locals())#选出前10行的某两列
print(a)

Python的pandasql和R语言的sqldf包对比_Python开发

案例如下

import pandas as pd
df = pd.DataFrame({
    "x": range(100),
    "y": range(100)
})
from pandasql import sqldf
a1=sqldf("select * from df;", globals())
a2=sqldf("select * from df;", locals())
a3=sqldf("select avg(x) from df;", locals())
print(a1);print(a2);print(a3)