用stata算集中指数采用Stata系统自带数据库autodta。
一、集中趋势的统计描述
以变量price为例进行说明。
均数:采用mean price计算得6165257。
算术均数、几何均数和调和均数可以采用means、ameans、gmeans、hmeans计算。
众数:没有对应的命令可以直接计算众数,但是可以通过几种策略进行变通计算。如通过egen x=mode(price); disp x; drop x,不过本例中price中没有相同的数值,所以无法计算众数;另外也可通过preserve; contract price, freq(x); sum x; list price if x==r(max); restore 来显示。
中位数:centile price或tabstat price, s(med),当然tabstat还可以计算均数、样本量、标准差,标准误、方差、极差、四分位间距、变异系数、峰度系数、偏度系数等等很多指标。
不过采用Stata(summarize ,tabstat等命令)计算的峰度系数与Excel、SPSS和SAS计算的结果有所不同,原因是采用的公式不同,大家根据实际情况来选择。
二、离散趋势指标
极差(全距):tabstat price, s(r)
标准差:tabstat price, s(sd)
方差:tabstat price, s(v)
四分位间距:tabstat price, s(iqr)
变异系数:tabstat price, s(cv)
采用summarize , detail命令可以计算均数、标准差、峰度系数、偏度系数、多个百分位数。不加detial可以得到最大值、最小值。
create proc p_createjob
@jobname varchar(100), --作业名称
@sql varchar(8000), --要执行的命令
@serverName sysname='', --job server名
@dbname sysname='', --默认为当前的数据库名
@freqtype varchar(6)='day', --时间周期,month 月,week 周,day 日
@fsinterval int=1, --相对于每日的重复次数
@time int=170000 --开始执行时间,对于重复执行的作业,将从0点到23:59分!
企业管理器
--管理
--SQL Server代理
--右键作业
--新建作业
--"常规"项中输入作业名称
--"步骤"项
--新建
--"步骤名"中输入步骤名
--"类型"中选择"Transact-SQL 脚本(TSQL)"
--"数据库"选择执行命令的数据库
--"命令"中输入要执行的语句: exec P_test
--确定
--"调度"项
--新建调度
--"名称"中输入调度名称
--"调度类型"中选择你的作业执行安排
--如果选择"反复出现"
--点"更改"来设置你的时间安排
然后将SQL Agent服务启动,并设置为自动启动,否则你的作业不会被执行
--示例:
--创建作业
exec msdbsp_add_job @job_name='数据处理'
--创建作业步骤
declare @sql varchar(800),@dbname varchar(250)
select @sql='exec p_createxml' --数据处理的命令
,@dbname=db_name()--执行数据处理的数据库名
exec msdbsp_add_jobstep @job_name='数据处理',
@step_name = '数据同步',
@subsystem = 'TSQL',
@database_name=@dbname,
@command = @sql,
@retry_attempts = 5, --重试次数
@retry_interval = 5 --重试间隔
--创建调度
EXEC msdbsp_add_jobschedule @job_name = '数据处理',
@name = '时间安排',
@freq_type=4, --4 每天,8 每周,16 每月
@freq_interval=1,--作业执行的天数
@freq_subday_type=0,--是否重复执行,0x1 在指定的时间, 0x4 分钟, 0x8 小时
@freq_subday_interval=1, --重复周期
@freq_recurrence_factor=0,--重复执行,则设置为1,否则设置为0
@active_start_time = 00000--0点开始执行
-- 添加目标服务器
EXEC msdbdbosp_add_jobserver
@job_name = '数据处理' ,
@server_name = N'(local)'
注:时间周期最小是1分钟
本文来自CSDN博客,转载请标明出处:>
以上就是关于怎样用stata进行数据标准化全部的内容,包括:怎样用stata进行数据标准化、如何写SQLServer的JOB让它每天定时的执行某个存储过程、sql server 2000可以实现这样的功能吗等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)