SAS常用函数

SAS常用函数,第1张

   obs(x): 返回 绝对值。 exp(x) : 返回x的指数值。   sqrt(x) :返回x的平方。

   log(x):  返回x的自然对数。 log10(x): 返回x以10为底的对数。 int(x) :返回x的整数部分。

    mod(x, y) : 返回x除以y的余数。 round(x,舍入值):根据舍入值对x进行四舍五入,round(4.8,2)=4, 将4.8舍入到最接近的能被2 整除的数值(0,2,4,6....,而4是最接近的)。

   ceil(x) :返回>=x的最小整数。   floor(x) :返回<=x的最大整数。

   max(X1,.....,Xn) : 取X1,.....,Xn中的最大值。      min(X1,.....,Xn) :取X1,.....,Xn中的最大值。

  sign(x):  x<0时返回-1,x>0时返回1,x=0时返回0。

  (1)  计算变量长度:

 length(变量) :计算变量长度,对缺失值返回1;

lengthn(变量 ):计算变量长度,对缺失值返回0;

  (2) 提取变量中的字符

substrn(变量,起始位置,<提取长度>) :提取长度不写,则默认提取到最后一个字符。

 (3)查找变量中内容

find(变量,查找内容,<"i">,<起始位置>) :必须是所有字符都完全匹配才算找到。

findc(变量,查找内容,<"i">,<起始位置>) :对于多个字符的查找,只要找到字符中任意一个就算找到。

"i"表示忽略大小,没有指定起始位置就会默认从第1个字符开始;如果查找到了相应的内容,就返回找到的位置,如果没找到就返回0.

anyalpha(变量,<起始位置>) :查找变量中任意字母,并返回第一字母的位置。

anydigit(变量,<起始位置>) :查找变量中任意数字,并返回第一数字的位置。

anyalnum(变量,<起始位置>) :查找变量中任意字母或数字,并返回第一字母或数字的位置。

 (4) 替换变量中的字符

transwrd(变量,查找值,替换值) :从变量中找到“查找值”,并用“替换值”替换掉。

  (5)去除变量中的字符

compress(变量,<欲去除的字符>, <“修饰符”>) :从变量中去掉“欲去除的字符”。

  “修饰符”常用的有:a, 去掉变量中所有字母;d, 去掉变量中所有数字;s, 去掉变量中所有空格;i,忽略大小; k, 保留“欲去除的字符”,去掉其他字符;kd, 保留所有数字,,去掉其他字符。

“变量”后第一逗号后面是“欲去除的字符”,即便不指定“欲去除的字符”,也需要用逗号留出它的位置,此时默认去除的是空格。

 compress(type, ,"d") 指去除type变量中的空格和所有数字,compress(type, "d")指去除type变量中的字符“d”。

 (6)清点变量中某个字符的个数

count(变量,欲清点的字符,<"i">) :从变量中找到“欲清点的字符”,返回字符个数,如果没有找到,就返回0。

3.日期变量相关函数

(1)日期的合并与差值:

mdy( 月,日,年) :将年、月、日合并为一个日期格式的变量或值。

yrdif(开始日期,结束日期,“计算依据”) :计算两个日期之间以年为单位的差值。

datdif(开始日期,结束日期,“计算依据”) :计算两个日期之间以天为单位的差值。

“计算依据”:指定计算差值的依据,通常指定“actual”,也就是按当年的实际天数计算。 yrdif(date1,date2, "actual")

(2)日期的提取:

year(日期变量):返回日期变量或日期值的年。month(日期变量):返回日期变量或日期值的月。day(日期变量):返回日期变量或日期值的日。

qtr(日期变量):返回日期变量或日期值的季度。week(日期变量):返回日期变量或日期值的周数(第几周)。 weekday(日期变量):返回日期变量或日期值的周(周几)。

datepart(日期时间变量):返回日期时间变量的日期部分。   timepart(日期时间变量):返回日期时间变量的时间部分。

hour(日期时间变量或时间变量):返回日期时间变量或时间变量的小时部分。

 today() 返回当天的日期,括号内什么都不加。如果想知道年龄,可以计算today()函数返回值与你出生日期的差值。

(3)带时间的日期变量的输入格式:

  datetimew.     主要用于ddmmmyy  hh:mm:ss格式数据     如:26Jun09: 13:00:00

  ymddttmw.     主要用于<yy>yy-mm-dd/hh:mm:ss格式的数据(日期与时间之间的分隔符除了“/”外,还可以是“-”“.”":")

4.其他常用函数

 (1)变量的合并

cat(变量1,变量2,.........):  连接两个或多个变量,保留首尾空格。

cats(变量1,变量2,.........) : 将几个变量合并为一个变量,删掉首尾空格。

catx("分隔符”,变量1 ,变量2,......) : 将几个变量合并为一个变量,中间用分隔符隔开,分隔符可以是-, ~, / 等。

|| : 连接几个变量,中间有空格。 

(2)查找变量中的缺失值

missing(变量) :判断变量是否为缺失值,是则返回1,不是则返回0;对数值型和字符型通用。

(3)变量类型转换函数

input函数主要用于把字符型转换为数值型,put函数主要用于把数值型转换为字符型。

input(变量,输入格式) :字符型转换为数值型,或将字符型转换为其他格式的字符型。

put(变量,输入格式) :数值型转换为字符型。

当使用自定义格式时,如果用input函数,proc format就要用invalue语句;如果用put函数,proc format就要用value语句。put函数输出的值一定是字符型,不管它看起来是数字还是其他样子。

用input和put 函数转换已有变量的格式,一定要赋值给另外一个变量,而不能是原有变量。

(4)随机函数

uniform(seed)或ranuni(seed):服从均匀分布uni(0, 1)的随机数。

normal(seed)或rannor(seed): 服从标准正态分布 N(0,1)的随机数。

M+S*rannor(seed):服从标准正态分布 N(M,S²)的随机数。

ranbin(seed,n,p): 服从均值为np, 方差为np(1-p)的二项分布的随机数。

ranpoi(seed,λ): 服从均数为λ的泊松分布的随机数。

⒈算术函数(Arithmetic Functions)

ABS(x) :求x的绝对值。 例如ABS(-56.3)=56.3 。

MAX(x1,x2,…,xn) :求所有自变量中的最大一个。 例如MAX(52,15,67,89)=89 。

MIN(x1,x2,…,xn) :求所有自变量中的最小一个。例如MIN(52,15,67,89)=15 。

MOD(x,y) :求x除以y的余数。 例如MOD(24,3)=0 。

SIGN(x) :计算x的符号,结果为1、-1、0。例如SIGN(-5)=-1,SIGN(20)=1,SIGN(0)=0。

SQRT(x) :求x的平方根。 例如SQRT(225)=15 。

⒉数学函数(Mathematical Functions)

ERF(X):误差函数 。

EXP(X):指数函数 。

GAMMA(X):计算 的值。

LOG(X):计算x的自然对数。

LOG10(X):计算x的以10为底的对数。

LGAMMA(X):计算函数的自然对数。

⒊截断函数(Truncation Functions)

CEIL(X):计算x的最小整数,当x为整数时就是x本身,否则为x右侧最近的整数。

例如CEIL(-134.45)=-134,CEIL(34.45)=35,CEIL(78)=78。

FLOOR(X):计算小于或等于x的最大整数,例如FLOOR(-134.45)=-135,FLOOR(34.45)=34。

INT(X):求x舍掉小数部分后的整数部分。例如INT(-134.45)=-134,INT(34.45)=34。

ROUND(x,unit):计算x按照unit指定的精度四舍五入后的结果,例如ROUND(134.4567,0.01)结果为134.46,ROUND(3678.2398,10)结果为3680。

⒋三角和曲线函数(Trigonometric and Hyperbolic Functions)

ARCOS(y):计算反余弦函数。

ARSIN(y):计算反正弦函数。

ATAN(y):计算反正切函数。

COS(X):计算x的余弦函数。

SIN(X):计算x的正弦函数

⒌字符函数(Character Functions)

COMPBL(S):将字符串S中的多余空格去掉。

COMPRESS(S,S1):将字符串S中包含的所有字符串S1去掉。

INDEX(S,S1):查找字符串S1在S中的位置。如果S中不包含S1则返回0。

LOWCASE(S):把字符串S中所有大写字母转换为小写字母。

UPCASE(S):把字符串S中所有小写字母转换为大写字母。

RANK(S):求字符串S的ASCII码值。

REPEAT(S,N):将字符串S重复N次。

SUBSTR(S,N,LONG):字符串S中的第N个字符开始抽取long个字符长的子串。

TRANWRD(S,S1,S2):将字符串S中的所有字符串S1替换成字符串S2。

⒍日期和时间函数(Date and Time Functions)

常用日期和时间函数有:

DATEIF(sdate,edate,basis):计算两个日期之间相距的天数,basis指定日期格式。

DATE:计算当前SAS系统的日期。

DAY(date):有SAS日期值date得到是几日。

DHMS(date,hour,minute,second):有日期、小时、分钟、秒得到SAS日期和时间值。

MDY(month,day,year):生成月日年的SAS日期值。

MONTH(date):有SAS日期值date得到月。

QTR(date):有SAS日期值date得到季度值。

WEEKDAY(day):有SAS日期值date得到星期几。

YEAR(DATE):有SAS日期值date得到年。

其它日期和时间函数参见SAS系统的帮助信息。

⒎概率与密度函数(Probability and Density Functions)

作为一个统计计算语言,SAS提供了多种概率分布函数。分布密度、概率、累积分布函数等可以通过集中统一的格式调用,格式为:

CDF(‘dist’,quantile,parm-1,…,parm-k):计算累计分布函数。Dist为分布名称,quntile为分为数,随后是相关参数。

PDF|PMF(‘dist’,quantile,parm-1,…,parm-k):计算概率密度函数。Dist为分布名称,quntile为分为数,随后是相关参数。

LOGPDF|LOGPMF(‘dist’,quantile,parm-1,…,parm-k):计算概率密度函数的对数值。Dist为分布名称,quntile为分为数,随后是相关参数。

LOGSDF(‘dist’,quantile,parm-1,…,parm-k):计算生存函数的对数值。Dist为分布名称,quntile为分为数,随后是相关参数。

PROBCHI(x,df<,nc>):计算卡方分布的概率值。可选参数nc为非中心参数。

PROBF(x,ndf,ddf<,nc>):计算F分布的概率值。可选参数nc为非中心参数。

PROBGAM(x,a):计算伽马分布的概率值。

PROBNORM(x):计算标准正态分布的概率值。

⒏分位数函数(Quantile Functions)

分位数函数是概率分布函数的反函数。其自变量在0-1之间取值。分位数函数计算的是分布的左侧分位数。

BETAINV(p,a,b):计算参数为(a, b)的 分布的p分位数。

CINV(p, df<,nc>):计算自由度为df的卡方分布p分位数。可选参数nc为非中心参数。

FINV(p, ndf, ddf<,nc>):计算F (ndf , ddf)分布的p分位数。可选参数nc为非中心参数。

GAMINV(p, a):计算参数为a的伽马分布的p分位数。

PROBIT(p):计算标准正态分布的p分位数。

TINV(p, df>,nc<):计算自由度为df的t分布的p分位数。可选参数nc为非中心参数。

⒐随机数函数(Random Number Functions)

SAS提供了常见分布的伪随机数生成函数。

NORMAL(seed):产生服从正态分布的随机数。seed为0,或5位、6位、7位的奇数。

RANNOR (seed):产生服从正态分布的随机数。seed为任意数值常数。

RANBIN(seed,n, p):产生参数为(n, p)的二项分布随机数,seed为任意数值。

均匀分布随机数。系统提供两个均匀分布随机数函数:

UNIFORM(seed):产生服从均匀分布的随机数。参数seed必须是常数,为0,或5位、6位、7位的奇数。

RANUNI (seed):产生服从均匀分布的随机数。参数seed为小于2**31-1的任意常数。在同一个数据步中对同一个随机数函数的多次调用将得到不同的结果,但不同数据步中从同一种子出发将得到相同的随机数序列。随机数种子如果取0或者负数,则种子采用系统日期时间。

RANEXP(seed):产生服从指数分布的随机数。seed为任意数值,产生参数为1的指数分布的随机数。

RANPOI(seed,lambda):产生参数为lambda>0的泊松分布随机数,seed为任意数值。

RANTBL(seed,P1,…,Pn)生成取1,2,…,n的概率分别为P1,…,Pn的离散分布随机数。

⒑样本统计函数(Sample Statistics Funtions)

样本统计函数把输人的自变量作为一组样本,计算样本统计量。其调用格式为“函数名(自变量1,自变量2,…,自变量n)”或者“函数名(OF变量名列表)”。比如SUM是求和函数,如果要求x1、x2, x3的和,则可以用SUM(xl,x2,x3),也可以用SUM(of x1-x3)。

各样本统计函数为:

CSS:离差平方和

CV:变异系数

KURTOSIS:峰度

MEAN:均值

MAX:最大值

MIN:最小值

N:非缺失数据的个数

NMISS:缺失数值的个数

RANGE:极差=MAX - MIN

SKEWNESS:偏度

STD DEV:标准差

STDERR:均值估计的标准误,用STD/SQRT(N)计算

SUM:求和

USS:平方和

VAR:方差


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/7967251.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-12
下一篇 2023-04-12

发表评论

登录后才能评论

评论列表(0条)

保存