import numpy as np import pandas as pd s = pd.Series([1, 3, 5, np.nan, 6, 8]) # print(s) dates = pd.date_range('20130101', periods=6) # print(dates) d ...
转载
2021-10-14 10:46:00
149阅读
2评论
1、Shuffle流程spark的shuffle过程如下图所示,和mapreduce中的类似,但在spark2.0及之后的版本中只存在SortShuffleManager而将原来的HashShuffleManager废弃掉(但是shuffleWriter的子类BypassMergeSortShuffleWriter和已经被废弃掉的HashShuffleWriter类似)。这样,每个mapTask在
转载
2024-10-20 12:59:52
39阅读
实例 import pandas as pd data=pd.DataFrame({'产品':['A','A','A','A'],'数量':[50,50,30,30]}) 去重 data.drop_duplicates() # 去除重复数据 data.drop_duplicates().reset_
原创
2021-07-14 11:51:30
643阅读
"二维数组"Dataframe:是一个表格型的数据结构,包含一组有序的列,其列的值类型可以是数值、字符串、布尔值等。Dataframe中的数据以一个或多个二维块存放,不是列表、字典或一维数组结构。# 导入pandas
import pandas as pd
pd.DataFrame(data=None, index=None, columns=None, dtype=None, copy=Non
转载
2023-07-11 01:01:25
198阅读
print(df.loc[['b', 'c'], ['y', 8]]) # 结果如下 y 8 b NaN NaN c NaN NaN
原创
2023-05-18 17:21:43
89阅读
welcome to my blogdf.loc是通过名字访问行或者列df.iloc是通过索引访问行或者列, 所以df.iloc只能跟整数举个例子import numpy as npimport pandas as pds = pd.Series(data=np.nan, index=[49, 48, 47, 46, 45, 1, 2, 3, 4, 5])s'''49 NaN...
原创
2023-01-18 01:24:38
8533阅读
不能使用is None,bool这些来判断, df = pd.DataFrame([]) data.empty True
转载
2021-01-05 18:57:00
524阅读
pandas 遍历有以下三种访法。 0.for i in df:并不是遍历行的方式 正式因为for in df不是直接遍历行的方式所以我们研究了如下方法。 1.iterrows():在单独的变量中返回索引和行项目,但显着较慢 2.itertuples():快于.iterrows(),但将索引与行项目
转载
2019-11-01 11:03:00
801阅读
2评论
df[‘X’]更像是pd.series类型的,而df[[“X”]]是pd.Dateframe类型,事实也的确如此。除此之外
原创
2022-11-05 09:26:16
245阅读
import pandas as pd
import numpy as np
def main():
df = pd.DataFrame(np.arange(10).reshape(-1, 2))
# # 可以, 根据index筛选行, 输出ser
# df_query = df.query(fr"{0}")
# # 可以, 根据index筛选行, 输出df
原创
2024-02-26 10:32:09
98阅读
np.array(df).tolist()https://blog.csdn.net/u012746060/article/details/102599702注意:np用tolist()pandas用to_list()
原创
2023-05-31 16:30:21
500阅读
Pandas知识点-添加操作append
原创
2022-09-15 10:08:52
175阅读
Python:Pandas中df.iloc和df.loc区别
原创
精选
2023-11-17 18:43:23
1497阅读
上一篇:pandas入门(十三)正则表达式正则表达式提供了一种灵活的在文本中搜索或匹配(通常比前者复杂)字符串模式的方式。正则表达式,常称作regex,是根据正则表达式语言编写的字符串。Python内置的re模块负责对字符串应用正则表达式。re模块的函数可以分为三个大类:模式匹配、替换以及拆分。当然,它们之间是相 辅相成的。一个regex描述了需要在文本中定位的一个模式,它可以用于许多目 的。拆分
转载
2023-12-14 09:25:26
90阅读
上一篇:pandas入门(十三)正则表达式正则表达式提供了一种灵活的在文本中搜索或匹配(通常比前者复杂)字符串模式的方式。正则表达式,常称作regex,是根据正则表达式语言编写的字符串。Python内置的re模块负责对字符串应用正则表达式。re模块的函数可以分为三个大类:模式匹配、替换以及拆分。当然,它们之间是相 辅相成的。一个regex描述了需要在文本中定位的一个模式,它可以用于许多目 的。拆分
转载
2023-12-14 09:17:13
76阅读
文章目录1.concat方法1.1 测试参数axis、join和ignore_index1.2 测试axes参数:自定义轴2.merge方法2.1 merge方法的两种写法例子1:merge方法的两种写法例子2:测试merge的不同连接方向:outer、left(df1和df2的值与例1相同)例子3:当两表中选中的列名不同时,使用left_on和right_on代替参数on2.2 测试valida...
原创
2021-06-18 14:30:04
894阅读
文章目录1.concat方法参数解释:部分参数详解1.1测试参数axis、join和ignore_index1.2 测试axes参数:自定义轴2. merge方法参数解释:部分参数详解:2.1 merge方法的两种写法例子1:merge方法的两种写法例子2:测试merge的不同连接方向:outer、left(df1
原创
2022-02-23 17:09:37
748阅读
文章目录1.concat方法参数解释:部分参数详解1.1测试参数axis、join和ignore_index1.2 测试axes参数:自定义轴2. merge方法参数解释:部分参数详解:2.1 merge方法的两种写法例子1:merge方法的两种写法例子2:测试merge的不同连接方向:outer、left(df1和df2的值与例1相同)例子3:当两表中选中的列名不同时,使用left_on和rig...
原创
2021-06-18 14:30:05
1072阅读
文章目录1.concat方法1.1 测试参数axis、join和ignore_index1.2 测试axes参数:自定义轴2.merge方法2.1 merge方法的两种写法例子1:merge方法的两种写法例子2:测试merge的不同连接方向:outer、left(df1和df2的值与例1相同)例子3:当两表中选中的列名不同时,使用left
原创
2022-02-23 17:27:54
1534阅读
点赞
公众号:尤而小屋作者:Peter编辑:Peter图解pandas数据合并:concat+join+append 在上一篇文章中介绍过pandas中最为常用的一个合并函数merge的使用,本...
转载
2022-06-06 00:05:21
942阅读