在我的实际开发中遇到的坑点,查阅了相关文档 总结一下
警告:在重复键上加入/合并可能导致返回的帧是行维度的乘法,这可能导致内存溢出。在加入大型DataFrame之前,重复值。
检查重复键
如果知道右侧的重复项DataFrame
但希望确保左侧DataFrame中没有重复项,则可以使用该 validate='one_to_many'
参数,这不会引发异常。
参数:
validate : str, optional
If specified, checks if merge is of specified type.“one_to_one” or “1:1”: check if merge keys are unique in both left and right datasets.
“one_to_many” or “1:m”: check if merge keys are unique in left dataset.
“many_to_one” or “m:1”: check if merge keys are unique in right dataset.
“many_to_many” or “m:m”: allowed, but does not result in checks.
官方文档连接: