在SCANTEXT = yes 前提下,PROC IMPORT是默认扫描前16行数据,所以后面过长的数据会出现截断。
guessingrows = MAX,最大为2147483647. 用2147483647行作为数据格式。
解决方法:
1. 修改注册表,因为SAS没办法该注册表,所以需要自己改
HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Jet\4.0\Engines\Excel Double click TypeGuessRows. In the DWORD editor dialog box, click Decimal under Base. Type a value of 0, click OK and exit Regedit.
但现在也用不了了,压根找不到这个注册表了。
2. 使用infile
把数据copy到CSV格式excel中,直接读取就好。
proc import OUT = raw
datafile = './_raw.csv'
DBMS = CSV replace;
delimiter = ',';
getnames = yes;
/*datarow = 2;*/
guessingrows = MAX;
run;
data raw;
infile './_raw.csv' firstobs = 2 delimiter = ',' truncover lrecl=1000;
informat name $400.;
input name $;
run;
通过informat定义格式,避免出错。