SQL2005 算术、字符运算 VS SAS9 的算术、字符运算

由于SIN函数计算比较耗CPU,也比较经典,故分别实现1千万次SIN运算做比较
  sql2005代码:
  declare @i int;
  declare @x float;
  set @i=1;
  while @i<=10000000
  begin
    set @x=sin(@i);
    set @i=@i+1;
  end;
  go
 
  耗时:26秒
 
  sas DATA步代码 :
  data _null_;
  length i x 8.;
  i=1;
  do i=1 to 10000000;
    x=sin(i);
  end;
  run;
  运行结果:
  NOTE: “DATA 语句”所用时间(总处理时间):
        实际时间        1.72 秒
        CPU 时间        1.70 秒
  耗时不到2秒


再对字符进行比较,我选择替换字符串做比较,也是分别实现1千万次进行字符串替换运算做比较
SQL代码
  declare @i int;
  declare @str varchar(50);
  declare @tarStr varchar(50);
  set @i=1;
  set @str='This is my Test!';
  while @i<=10000000
  begin
    set @tarStr=replace(@str,'my','My');
    set @i=@i+1;
  end;
  print @tarStr;
  go 
 
  运行结果:耗时2分24秒
 
SAS DATA步代码
 
  data _null_;
  length i 8.;
  length str tarstr $50.;
  str="This is my Test!";
  i=1;
  do i=1 to 10000000;
  tarstr=tranwrd(str,"my","My");
  end;
  put tarstr;
  run;

运行结果:耗时不到9秒 
NOTE: DATA statement used (Total process time):
      real time          8.09 seconds
      cpu time            8.09 seconds
 

初步总结:
进行一千万次SIN运算时,SQL2005耗时26秒,SAS不到2秒,差不多相差13倍
进行一千万次字符替换运算时,SQL2005耗时144秒,SAS不到9秒,差不多相差16倍
可以看出,SAS的数据处理能力可以说是超强,在这方面可以说任何当前数据库都不能相比
如果不是由于SAS本身产品的限制,说不定早就在中国市场上流行了
:) 如果有人想把SAS做的ETL转为用SQL2005做ETL时,可要考虑客户的感受了,想想如果一下子由原来的十几天的数据加载变成几个月的数据加载,你就头疼把;当然如果只是小数据量加载之间的转换,还是没问题的
比较有意思的是,SAS的MERGE操作一直以来都是要求输入的数据要先按指定字段进行排序才能MERGE,现在SQL2005提供的MERGE组件也有了这样的要求,有点像终于找到党组织的感觉了
'



原文出处:http://blog.csdn.net/anyjack/
金鳞岂是池中物,一遇风云便化龙