注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

数据挖掘与数据分析

个人微信:datamen 欢迎交流

 
 
 

日志

 
 

spss命令基础  

2008-07-29 15:39:19|  分类: SPSS |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
命令是为了启动运行而给SPSS的指令。它分为三种类型:

      操作命令(如HELP,SET),主要用于管理SPSS的系统操作;

      数据定义,数据处理命令(如DATA LIST,SAVE),主要用于描述数据和管理数据;

      过程命令(如FREQUENCIES,ANOVA),主要用于各种统计分析方法及结果。

      一.语法规则

      (一)标准命令格式

以后所给出的命令都是用标准命令格式给出的,它包括所有的子命令,关键词和该命令的说明。

  例:

Independent samples:

T-TEST GROUPS=varname ({1,2** }) /VARIABLES=varlist

{value }

{value,value}

[/MISSING={ANALYSIS**} [INCLUDE]]

{LISTWISE }

[/FORMAT={LABELS**}]

{NOLABELS}

Paired samples:

T-TEST PAIRS=varlist [WITH varlist [(PAIRED)]] [/varlist ...]

[/MISSING={ANALYSIS**} [INCLUDE]]

{LISTWISE }

[/FORMAT={LABELS**}]

{NOLABELS}

      (1)标准命令格式中用大写字母表示的是关键词;而用小写字母表示的的是用户提供的说明;

      (2)方括号“[ ]”里的元素是选择性的。

      (3)缺省值用黑体或**表示,而可以供替换的选项用大括号“{ }”表示;

      (二)命令的规则

      例:

T-TEST GROUPS=WORLD(1,3) /VARIABLES=NTCPRI NTCSAL NTCPUR.

T-TEST PAIRS=TEACHER CONSTRUC MANAGER.

This paired-samples t test compares the means of TEACHER with CONSTRUC, TEACHER with MANAGER, and CONSTRUC with MANAGER.

      下面的规则适用于所有的SPSS命令。

      1.命令以一个关键词开始,此关键词是该命令的名字。通常命令中还有附加的说明、如子命令和用户说明。

      2.每一个命令都以命令终止符“.”结束。

FACTOR VAR=V1 TO V12

/ANALYSIS=V1 TO V8

/CRITERIA=FACTORS(3)

/EXTRACTION=PAF

/ROTATION=QUARTIMAX.

The default CORRELATION method is used. FACTOR performs a factor analysis of the correlation matrix based on the first eight variables in the working data file ( V1 to V8).

??The procedure extracts three factors using the principal axis method and quartimax rotation.

??LISTWISE (the default for MISSING) is in effect. Cases with missing values for any one of the variables from V1 to V12 are omitted from the analysis. As a result, if you ask for the factor analysis using VAR=V1 TO V8 and ANALYSIS=ALL, the results may be different even though the variables used in the analysis are the same.

      3.命令可以从命令行的任一列位置开始,可以延续数行。但 END DATA命令例外,它必须从数据结束后的第二行的第一列开始。命令行最长80个字符(包括提示符和终止符)。)在允许留空白的地方,可以留数个空格或几个断行。几个例外是;END DATA命令的END与DATA之间只能有一个空格;标题和小标题的说明不能跨行断开。用大写体或小写体输入命令均可。命令、子命令、关键词和变量名在执行时被转换成大写体。所有用户说明,包括标签、数据值都保持原来的大小写。

      4.命令的第一个单词在不与其它关键词不重复的情况下可以被缩写成为最少三个字母。如AGGREGATE 可以被缩写为AGG,但是,COMPUTE就仅能被缩写成COMP,以避免与COMMENT相混淆。一般4个字母的关键词不能被缩写,如LIST,DATA LIST,END DATA,INFO等。

      5.大多数两个字的命令。如 BEGIN DATA,SORT CASES等,都可以缩写为其第一个字,只有 END DATA例外,不能缩写。

      (三)子命令

      命令中的附加说明叫做子命令,其功能在于查找或处理数据、格式化输出显示。

      1.子命令以一个关键词开始,此关键词就是该子命令的名字。

      2.子命令的关键词与它的说明之间的等号“=”是可选的,可用空格代替,但为避免模糊,应尽量加以使用。

      3.大多数子命令可以接任意顺序定义。

      4.子命令之间要用斜杠“/”隔开。

      (四)关键词

      关键词是为了识别命令、子命令、函数、运算符等,由SPSS专门定义的词。

      1.      关键词可以缩写为每个词的前三个字符。唯一的例外是WITH,它必须全部拼写。

      以下的关键词被保留且不能作变量名:逻辑运算符(AND,OR和NOT),关系运算符(EQ,GE,GT,LE,LT和NE),ALL,BY,TO和WITH。

      2.      关键词ALL指定现用文件中用户定义的全部变量。例如:

FREQUENCIES /VARIABLES = ALL.

        3.      关键调THRU指定两个数值之间的一段范围(包含这两个值)。例:

RECODE V1 TO V3 (0=1) (1=0) (2,3=-1) (9=9) (ELSE=SYSMIS)

/QVAR(1 THRU 5=1)(6 THRU 10=2)(11 THRU HI=3)(ELSE=0).

      4.关键词TO用在变量之间,指定一组变量。

      在TO的前后分别指定一个字符前缀和一个数字后缀,前缀用任意有效名,后缀用任意整数。前面的数要小于后面的数。每一变量名(包括数字在内)不得超过8个字符。例如A1 TO A5定义了五个名为A1,A2,A3,A4,A5的变量。

      用TO建立的变量名中,后缀中的先行零包括在变量名内。例如V001 TOv100定义了100个名为v001,V002,….v100的变量;VI To V100定义了100个名为V1,V2,…,V100的变量。

      TO也可用于其它命令。 AB TO BA代表 AB与 BA之间的全部变量(包括AB和BA)。用DISPLAY命令查看现用文件中的变量顺序。

(一)变量的命名规则

      1.变量名最多不能超过8个字符。

      2.首字符必须是26个字母之一,即A-Z或者是@、#、$三个字符之一。变量名首字符为“#”的变量是临时变量,它不进入活动文件,只是暂时供数据变换时使用的。首字符为“$”的变量是系统变量,它是建立活动文件时自动生成的,如$DATE、$CASENUM、$WEIGHT,分别表示日期,个案号,及个案权重。

* Create a new variable as a combination of two old variables;

the new variable is a scratch variable used later in the

session; it will not be saved with the data file.

COMPUTE #XYVAR=0.

IF (XVAR EQ 1 AND YVAR EQ 1) #XYVAR=1.

         3.首字符是字母,其后的可为字母或数字或除“?”、“!”、“*”以外的字符。但应注意不能以下划线“_”和句号“.”作为变量名的最后一个字符。

      4.变量名不能使用SPSS保留的关键字。有:ALL,AND,BY,EQ,GE,GT,LE,LT,NE,NOT,OR,TO,WITH。

      下述变量名是SPSS的变量名,谁是谁非?为什么?

(1) OCCUPATION

(2)1AGE

(3)Sa lary

(4)first#

(5)_ata

(6)@1wta

(7)ge

(8)w?a

(9)w_wa

      (二)变量的格式     

      变量的值按特定格式存贮、显示或打印。格式说明不影响内存中数据值的精度。可以用DISPLAY命令指定VARIABLES=ALL,来看每个变量的格式。

      变量格式由两部分组成:变量类型和变量宽度。变量类型分三种:数字型和字符串型和日期型。数字型变量的值可包含数字、小数点、选择性的正、负号。字符串型变量的值可包含数字、字母和标点符号。

      1.      数值型变量的格式

      系统默认格式为总长度为8,小数位数为2。可以用主菜单中Edit中的“options”中的data标签重新设定。

      (1)标准型数值变量(Numeric),表示为Fw.d,系统默认为F8.2。

      (2) 带逗号的数值型变量(Comma)COMMAw.d,系统默认为COMMA8.2。显示为整数部分自右向左每三位用一个逗号作分隔符,用圆点作小数与整数间的分界符。

      (3)带圆点的数值型变量(Dot)DOTw.d,系统默认为DOT8.2。显示为整数部分自右向左每三位用一个圆点作分隔符,用逗号作小数与整数间的分界符。

      (4)科学记数法(Scientific Notation),Ew.d,系统默认为E8.2。一般用于很大和很小的变量。

      (5)带美元符号的数值变量(Dollar sign and comma in number),DOLLARw.d,系统默认为DOLLAR8.2。

      (6)自定义型货币(custom Currency)变量,可自己定义相应的货币显示形式。

      2.字符串型变量的格式

      (1)字符串

      字符串是指字符型数据或某些说明,例如标题和标签。

VARIABLE LABELS YRHIRED ’YEAR OF FIRST HIRING’.

TITLE "Running Shoe Study from Runner’s World Data".

TITLE inserts a left-justified title on the top line of each page of output. The default title indicates the version of the system being used.

        如果字符串中有撇号“’”,或者用引号将字符串括起来,或者用两个撇号。如以下两种表达方式都 是可以的:

例:’Client’’s Satisfaction’

"Client’s Satisfaction"

    字符串可以跨行写,方法是每个字符串片断都要加用引号或撇号括起,并且用“+”号连接两个片断。加号在第一行或第二行都可以。如:

’One, Two’

可以表达为:

’One,’

+ ’ Two’

    字符串型变量简称串变量,可以包含字母和数字。其值小于等于8个字符的称为短串变量,否则称为长串变量,串变量最多含有255个字符。表示:Aw

例:STRING V1 TO V6 (A8) / V7 V10 (A16).

??STRING declares variables V1, V2, V3, V4, V5, and V6, each with an A8 format, and variables V7 and V10, each with an A16 format.

  评论这张
 
阅读(2091)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017