
这个逻辑应该是有点问题,
mdy(substr(dcrt_date,5,2),substr(dcrt_date,7,2),substr(dcrt_date,1,4))
计算出来的是到1960-1-1的天数;
而hms(substr(dcrt_date,9,2),substr(dcrt_date,11,2),substr(dcrt_date,13,2));
计算出来的是到0点0分0秒的秒数;
这两个不是一个量纲,加起来能对吗?是否需要重新计算?
用YRDIF函数。
在SAS中,可以使用YRDIF函数来计算两个字符型日期之间的天数。YRDIF函数的用法是:YRDIF(date1,date2),其中date1和date2分别表示要计算的两个字符型日期。
SAS的统计分析软件可以用于从大量的原始数据中学习,并使用这些学习来发现模式和关系,从而提供更有用的信息。
obs(x): 返回 绝对值。 exp(x) : 返回x的指数值。 sqrt(x) :返回x的平方。
log(x): 返回x的自然对数。 log10(x): 返回x以10为底的对数。 int(x) :返回x的整数部分。
mod(x, y) : 返回x除以y的余数。 round(x,舍入值):根据舍入值对x进行四舍五入,round(48,2)=4, 将48舍入到最接近的能被2 整除的数值(0,2,4,6,而4是最接近的)。
ceil(x) :返回>=x的最小整数。 floor(x) :返回<=x的最大整数。
max(X1,,Xn) : 取X1,,Xn中的最大值。 min(X1,,Xn) :取X1,,Xn中的最大值。
sign(x): x<0时返回-1,x>0时返回1,x=0时返回0。
(1) 计算变量长度:
length(变量) :计算变量长度,对缺失值返回1;
lengthn(变量 ):计算变量长度,对缺失值返回0;
(2) 提取变量中的字符
substrn(变量,起始位置,<提取长度>) :提取长度不写,则默认提取到最后一个字符。
(3)查找变量中内容
find(变量,查找内容,<"i">,<起始位置>) :必须是所有字符都完全匹配才算找到。
findc(变量,查找内容,<"i">,<起始位置>) :对于多个字符的查找,只要找到字符中任意一个就算找到。
"i"表示忽略大小,没有指定起始位置就会默认从第1个字符开始;如果查找到了相应的内容,就返回找到的位置,如果没找到就返回0
anyalpha(变量,<起始位置>) :查找变量中任意字母,并返回第一字母的位置。
anydigit(变量,<起始位置>) :查找变量中任意数字,并返回第一数字的位置。
anyalnum(变量,<起始位置>) :查找变量中任意字母或数字,并返回第一字母或数字的位置。
(4) 替换变量中的字符
transwrd(变量,查找值,替换值) :从变量中找到“查找值”,并用“替换值”替换掉。
(5)去除变量中的字符
compress(变量,<欲去除的字符>, <“修饰符”>) :从变量中去掉“欲去除的字符”。
“修饰符”常用的有:a, 去掉变量中所有字母;d, 去掉变量中所有数字;s, 去掉变量中所有空格;i,忽略大小; k, 保留“欲去除的字符”,去掉其他字符;kd, 保留所有数字,,去掉其他字符。
“变量”后第一逗号后面是“欲去除的字符”,即便不指定“欲去除的字符”,也需要用逗号留出它的位置,此时默认去除的是空格。
compress(type, ,"d") 指去除type变量中的空格和所有数字,compress(type, "d")指去除type变量中的字符“d”。
(6)清点变量中某个字符的个数
count(变量,欲清点的字符,<"i">) :从变量中找到“欲清点的字符”,返回字符个数,如果没有找到,就返回0。
3日期变量相关函数
(1)日期的合并与差值:
mdy( 月,日,年) :将年、月、日合并为一个日期格式的变量或值。
yrdif(开始日期,结束日期,“计算依据”) :计算两个日期之间以年为单位的差值。
datdif(开始日期,结束日期,“计算依据”) :计算两个日期之间以天为单位的差值。
“计算依据”:指定计算差值的依据,通常指定“actual”,也就是按当年的实际天数计算。 yrdif(date1,date2, "actual")
(2)日期的提取:
year(日期变量):返回日期变量或日期值的年。month(日期变量):返回日期变量或日期值的月。day(日期变量):返回日期变量或日期值的日。
qtr(日期变量):返回日期变量或日期值的季度。week(日期变量):返回日期变量或日期值的周数(第几周)。 weekday(日期变量):返回日期变量或日期值的周(周几)。
datepart(日期时间变量):返回日期时间变量的日期部分。 timepart(日期时间变量):返回日期时间变量的时间部分。
hour(日期时间变量或时间变量):返回日期时间变量或时间变量的小时部分。
today() 返回当天的日期,括号内什么都不加。如果想知道年龄,可以计算today()函数返回值与你出生日期的差值。
(3)带时间的日期变量的输入格式:
datetimew 主要用于ddmmmyy hh:mm:ss格式数据 如:26Jun09: 13:00:00
ymddttmw 主要用于<yy>yy-mm-dd/hh:mm:ss格式的数据(日期与时间之间的分隔符除了“/”外,还可以是“-”“”":")
4其他常用函数
(1)变量的合并
cat(变量1,变量2,): 连接两个或多个变量,保留首尾空格。
cats(变量1,变量2,) : 将几个变量合并为一个变量,删掉首尾空格。
catx("分隔符”,变量1 ,变量2,) : 将几个变量合并为一个变量,中间用分隔符隔开,分隔符可以是-, ~, / 等。
|| : 连接几个变量,中间有空格。
(2)查找变量中的缺失值
missing(变量) :判断变量是否为缺失值,是则返回1,不是则返回0;对数值型和字符型通用。
(3)变量类型转换函数
input函数主要用于把字符型转换为数值型,put函数主要用于把数值型转换为字符型。
input(变量,输入格式) :字符型转换为数值型,或将字符型转换为其他格式的字符型。
put(变量,输入格式) :数值型转换为字符型。
当使用自定义格式时,如果用input函数,proc format就要用invalue语句;如果用put函数,proc format就要用value语句。put函数输出的值一定是字符型,不管它看起来是数字还是其他样子。
用input和put 函数转换已有变量的格式,一定要赋值给另外一个变量,而不能是原有变量。
(4)随机函数
uniform(seed)或ranuni(seed):服从均匀分布uni(0, 1)的随机数。
normal(seed)或rannor(seed): 服从标准正态分布 N(0,1)的随机数。
M+Srannor(seed):服从标准正态分布 N(M,S²)的随机数。
ranbin(seed,n,p): 服从均值为np, 方差为np(1-p)的二项分布的随机数。
ranpoi(seed,λ): 服从均数为λ的泊松分布的随机数。
字符型的可以转换成datetime
来用阿
select
datediff(year,convert(datetime,'20070802'),convert(datetime,'2009/06/05'))
希望能帮上你
'ta290001008','ta500251056'怎么理解这2个日期?
最好把数据的格式写出来,就是写出一个时间的例子来
看看下面的行不?
select
datediff(year,convert(datetime,ta290001008),convert(datetime,ta500251056))
from
表
利用format过程中的picture语句生成自己想要的format,然后利用put函数。代码如下:
proc
format;
picture
mydate
="
"
other='%0y-%0m-%0d
%0H:%0M:%0S'(datatype=datetime)
;
run;
data
dummy;
input
string:$20;
date=input(substr(string,1,8),b8601da)246060;
hour=input(substr(string,9,2),best);
minute=input(substr(string,11,2),best);
second=input(substr(string,13,2),best);
time=hms(hour,minute,second);
mydate=put(date+time,mydate);
put
_all_;
datalines;
20140728215450
;
run;
把其他类型的数据文件读成SAS数据集 直接读取其他软件的数据文件。
在使用 SAS 进行数据分析时候经常需要对 日期 进行处理和调用,因为数据库的文件大部分都有yyyymmdd格式的 日期 后缀借助日历表我们就可以更加灵活的对数据集进行调用数据。
以上就是关于SAS中如何将一个14位字符串转化为日期格式。全部的内容,包括:SAS中如何将一个14位字符串转化为日期格式。、sas计算两个字符型日期之间的天数怎么算、SAS常用函数等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)