在SCANTEXT = yes 前提下,PROC IMPORT是默认扫描前16行数据,所以后面过长的数据会出现截断。

guessingrows = MAX,最大为2147483647. 用2147483647行作为数据格式。

解决方法:

1. 修改注册表,因为SAS没办法该注册表,所以需要自己改

HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Jet\4.0\Engines\Excel

Double click TypeGuessRows. In the DWORD editor dialog box, click
Decimal under Base. Type a value of 0, click OK and exit Regedit.

但现在也用不了了,压根找不到这个注册表了。

2. 使用infile
把数据copy到CSV格式excel中,直接读取就好。

proc import OUT = raw
datafile = './_raw.csv'
DBMS = CSV replace;
delimiter = ',';
getnames = yes;
/*datarow = 2;*/
guessingrows = MAX;
run;

 

data raw;
infile './_raw.csv' firstobs = 2 delimiter = ',' truncover lrecl=1000;
informat name $400.;
input name $;
run;

通过informat定义格式,避免出错。