怎样用stata进行数据标准化

怎样用stata进行数据标准化,第1张

用stata算集中指数采用Stata系统自带数据库autodta。

一、集中趋势的统计描述

以变量price为例进行说明。

均数:采用mean price计算得6165257。

算术均数、几何均数和调和均数可以采用means、ameans、gmeans、hmeans计算。

众数:没有对应的命令可以直接计算众数,但是可以通过几种策略进行变通计算。如通过egen x=mode(price); disp x; drop x,不过本例中price中没有相同的数值,所以无法计算众数;另外也可通过preserve; contract price, freq(x); sum x; list price if x==r(max); restore 来显示。

中位数:centile price或tabstat price, s(med),当然tabstat还可以计算均数、样本量、标准差,标准误、方差、极差、四分位间距、变异系数、峰度系数、偏度系数等等很多指标。

不过采用Stata(summarize ,tabstat等命令)计算的峰度系数与Excel、SPSS和SAS计算的结果有所不同,原因是采用的公式不同,大家根据实际情况来选择。

二、离散趋势指标

极差(全距):tabstat price, s(r)

标准差:tabstat price, s(sd)

方差:tabstat price, s(v)

四分位间距:tabstat price, s(iqr)

变异系数:tabstat price, s(cv)

采用summarize , detail命令可以计算均数、标准差、峰度系数、偏度系数、多个百分位数。不加detial可以得到最大值、最小值。

create proc p_createjob

@jobname varchar(100), --作业名称

@sql varchar(8000), --要执行的命令

@serverName sysname='', --job server名

@dbname sysname='', --默认为当前的数据库名

@freqtype varchar(6)='day', --时间周期,month 月,week 周,day 日

@fsinterval int=1, --相对于每日的重复次数

@time int=170000 --开始执行时间,对于重复执行的作业,将从0点到23:59分!

企业管理器

--管理

--SQL Server代理

--右键作业

--新建作业

--"常规"项中输入作业名称

--"步骤"项

--新建

--"步骤名"中输入步骤名

--"类型"中选择"Transact-SQL 脚本(TSQL)"

--"数据库"选择执行命令的数据库

--"命令"中输入要执行的语句: exec P_test

--确定

--"调度"项

--新建调度

--"名称"中输入调度名称

--"调度类型"中选择你的作业执行安排

--如果选择"反复出现"

--点"更改"来设置你的时间安排

然后将SQL Agent服务启动,并设置为自动启动,否则你的作业不会被执行

--示例:

--创建作业

exec msdbsp_add_job @job_name='数据处理'

--创建作业步骤

declare @sql varchar(800),@dbname varchar(250)

select @sql='exec p_createxml' --数据处理的命令

,@dbname=db_name()--执行数据处理的数据库名

exec msdbsp_add_jobstep @job_name='数据处理',

@step_name = '数据同步',

@subsystem = 'TSQL',

@database_name=@dbname,

@command = @sql,

@retry_attempts = 5, --重试次数

@retry_interval = 5 --重试间隔

--创建调度

EXEC msdbsp_add_jobschedule @job_name = '数据处理',

@name = '时间安排',

@freq_type=4, --4 每天,8 每周,16 每月

@freq_interval=1,--作业执行的天数

@freq_subday_type=0,--是否重复执行,0x1 在指定的时间, 0x4 分钟, 0x8 小时

@freq_subday_interval=1, --重复周期

@freq_recurrence_factor=0,--重复执行,则设置为1,否则设置为0

@active_start_time = 00000--0点开始执行

-- 添加目标服务器

EXEC msdbdbosp_add_jobserver

@job_name = '数据处理' ,

@server_name = N'(local)'

注:时间周期最小是1分钟

本文来自CSDN博客,转载请标明出处:>

以上就是关于怎样用stata进行数据标准化全部的内容,包括:怎样用stata进行数据标准化、如何写SQLServer的JOB让它每天定时的执行某个存储过程、sql server 2000可以实现这样的功能吗等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9511329.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-29
下一篇 2023-04-29

发表评论

登录后才能评论

评论列表(0条)

保存