pandasql包功能描述
pandasql包功能主要是实现SQL语句的增改查删除。pandasql和常见数据库的SQL的区别:
1.常见SQL使用是将数据库中已存储好的数据,利用SQL语句的写法对数据进行一定的增改查删,最终将数据结果查询出来,存储在数据库占用的表空间下,进行查询,将数据给展示出来。这个过程必须依赖数据库,才能使用SQL语句。
2.python中的数据,被读取和加载后,数据将存放在python的对象中,也就是会存在python占用计算机的内存空间内,此时pandasql将存在python对象的数据集对象当做数据表,利用pandasql函数的功能,使用SQL语句的写法将数据从python对象中对数据进行增改查删,这个过程是不需要借助数据库,可独立使用SQL
Python的pandasql和R语言的sqldf包
1.R语言的sqldf包的使用,参考链接为:https://blog.csdn.net/tandelin/article/details/89635072
2.Python的pandasql包使用和下载
> (venv) D:\Python\Python_venu>pip install pandasql -i
> https://pypi.tuna.tsinghua.edu.cn/simple/
操作案例如下所示:
from pandasql import sqldf
from sklearn.datasets import load_iris #导入数据集
import pandas as pd
iris = load_iris()
iris=pd.DataFrame(iris.data) #一定要先转成数据框
a=sqldf("select * from iris limit 10;", locals())#选出前10行的某两列
print(a)
案例如下
import pandas as pd
df = pd.DataFrame({
"x": range(100),
"y": range(100)
})
from pandasql import sqldf
a1=sqldf("select * from df;", globals())
a2=sqldf("select * from df;", locals())
a3=sqldf("select avg(x) from df;", locals())
print(a1);print(a2);print(a3)