pg导入数据至sqlserver方法整理及对比

原创

Hehuyi_In_666 2020-08-28 00:20:02 博主文章分类：SQLServer ©著作权

©著作权归作者所有：来自51CTO博客作者Hehuyi_In_666的原创作品，请联系作者获取转载授权，否则将追究法律责任

业务方要求将pg中的一个表导入sqlserver，表约1000万行。测试了几种常用的导入导出方法，有成功也有失败的。

一、 pg导出为sql文件，sqlserver中执行

如果没有用到特殊数据类型或者字符，数据量也比较小，这种方法一般是可以的。

里面会有建表、建索引、授权等语句，需要处理一下，或者可以用 --data-only选项。

pg_dump -d dbname -U username -t tablename --inserts > tablename.sql

根据文件大小分为三种情况：

#cd到文件所在目录
sqlcmd -i xxx.sql -d dbname

在测试环境执行的时候2G的sql文件执行占用内存超过15G（并且还在往上涨）

pg导入数据至sqlserver方法整理及对比_sql

测试bulk insert效率很高，960万行数据执行约53秒，对内存影响也不大。

psql -d dbname
\copy (select * from xxx) to '/tmp/xxx.csv' DELIMITER ',' CSV;

大多数pg装在Linux，sqlserver装在windows，所以要特别注意换行符的问题，否则执行bulk insert的时候会报错第一行最后一列过长，因为它识别不到换行符，把后面的所有数据都当做第一行最后一列。

#Linux格式转windows
sed -e 's/$/\r/' 1pnet.txt >dos.txt

BULK INSERT 库名..表名 
FROM 'c:\test.csv' 
WITH ( 
FIELDTERMINATOR = ',', ---分隔符
ROWTERMINATOR = '\n'    ---换行符
)

第一步同上，第二步使用sqlserver导入导出向导，导入类型选择“平面文件”，定义列名及类型。

但说实话导入导出向导经常会遇到奇奇怪怪的报错，而且搜不到啥好的解决方法，本次遇到报错如下

pg导入数据至sqlserver方法整理及对比_导入导出_02

根据搜到的文章说是字符集问题，但检查导入表里并没有特别字符，改换导入时选择的字符集后也无效，暂未找到解决方法

第一步同上，第二步使用BCP导入

参考

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯