注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

数据挖掘与数据分析

个人微信:datamen 欢迎交流

 
 
 

日志

 
 

one to one的spss解答  

2009-01-20 10:54:54|  分类: SPSS |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

Q:如何对数据标准化

A:SPSS中标准化数据,可以"Analysis"-"Descriptive Analysis"中的"Descriptive..."分析,"save standarded values as variables"即可。标准化变量自动添加到变量里

Q:如何在SPSS中进行正交设计及正交分析?

A:我以前以为SPSS不能作正交设计,做法如下:

设要做二因素的正交设计,A因素有三个水平,B因素有两个水平。则选择Data-->Orthogonal Design-->generate,弹出的就是正交设计窗口:

Factor name框:输入A:单击ADD钮:单击Define value钮:分别在Value列的头三行输入1、2和3,单击continue钮,这样就定义好了变量A。

按类似的方法定义好变量B的2个水平。单击OK,系统就输出一个新定义的数据集,前两个变量就是要分析的A和B,各个水平已经按正交设计的要求排列好了。后面的status_和card_变量是系统产生的LOG变量,可以不管它。现在你再建立一个结果变量,输入实验结果,就可以进行正交设计的分析了。

正交设计的分析用GLM模块进行。具体操作如下: Analyze->General Linear Model->Univariate... dependent中选入应变量,fixed factor中选入自变量。然后进入model钮进行模型设置,这一步非常重要!设置模型为custom,然后选择需要分析的主效应和交互作用。然后确认,就可以得到所需要的结果。

请注意,如果model钮进行模型设置时选择错误,则得到的结果肯定是不正确的。

Q:如何在SPSS中作条件Logistic回归分析和哑变量分析?

A:SPSS对条件Logistic回归是无能为力的,但可以参照SAS答疑解惑中的变换方式对原数据进行变换再进行拟合。至于哑变量,如果将原变量设为分类变量(即选定为CAT),则拟合时许多模型会自动按哑变量拟合,但多数情况下得自行产生新变量。

Q:SPSS能否用另外一个具有同样数据结构的数据库更新数据?如同foxpro中的Replace命令?

A:SPSS中DATA菜单提供的MERGE FILES过程就是用于横向和纵向合并数据文件的,一般情况的数据合并问题该菜单都可以解决,具体用法请参见网站的SPSS教程第二章。

Q:在SPSS中有无编程语言可写?如IF....Else..等编程语句?

A:SPSS中有IF....Else..等编程语句,实际上也可以象其它编程语言一样的使用。即可以用SPSS的SYNTAX窗口编写SPSS程序来解决,在教程的第四章我有简单的介绍。 更复杂的情况可以用专门的SPSS PRODUCTION FACILITY来完成。不过,我们所能碰到的多数问题可以用菜单来完成,如COMPUTE中的IF子菜单,不需要去编SPSS程序。

Q:方差分析(ANOVA)多个样本均数间的两两比较,即Post Hoc对话框中提供了两种不同情况下的选项,请问Equal Variance Not Assumed是在方差不齐时选用的吗?其下所提供的四种陌生的检验方法可以介绍一下吗?

A:是的,的确如此,这些方法就是在方差不齐时选用的。不过>这四种检验方法我也不熟悉,实际上除了SNK、LSD等少数几种方法外,对于方差分析的两两比较理论上就没有统一起来,真正是各说各的理,结果谁也不服谁。不信你去看看SAS,这四种检验方法根本就找不到!从SPSS的帮助内容翻译出来的意思如下:

Tamhanes’s h2: 基于T检验的一种保守的两两比较方法。

Dunnetts’s t3: 基于标准化最大系数的两两比较方法。

Games-howell: 有时标准过松的两两比较方法。

Dunnett’s C: 基于标准化全距的两两比较方法。

以上四种方法在方差不齐时使用才合适。

Q:SPSS中Homogeneous Subsets下的S-N-K是国内教科书中所指的S-N-K法吗?他提供的LSD法可用于各组间的两两比较吗?或者说,可以替代国内教科书中此种情况下所介绍的S-N-K法吗(因为您知道LSD法在教科书中是用于各治疗组与对照组之间两两比较的)?

A:你说的对,此S-N-K即彼S-N-K。不过SPSS提供的LSD法不能就这样简单的代替SNK法,因为每种方法都有它的设计思想和适用范围,LSD在推导时就是在假设有一个标准对照的情况下进行的,如果用它来作任意两组的两两比较,则相当于随便改变了alpha水准,自然不对了。

Q:怎么在SPSS中做多组等级资料的等级相关分析,即等级的一致性检验?怎么做有序表的线性趋势检验?

这些统计方法基本上都在corsstable过程中,单击下方的statisitcs钮,会弹出Statistics对话框:

Norminal复选框组:就是反映分类资料相关性的一系列指标,其中:

  Contingency coefficient复选框:即列联系数;

  Uncertainty coefficient复选框:不确定系数。

Ordinal复选框组:反映有序分类资料相关性的指标,可能有用的有:

  Kendall's tau-b复选框;

  Kendall's tau-c复选框;

剩下的有:

  Kappa复选框:计算Kappa值,即内部一致性系数;

  Risk复选框:计算比数比OR值;

  McNemanr复选框:进行McNemanr检验(一种非参检验);

  Cochran's and Mantel-Haenszel statistics复选框:计算X2M-H统计量。

更详细的内容可以参见网站教程的第六课,或其他统计书籍。

Q:两因素以上的方差分析在SPSS中用什么来完成?

A:这些方差分析一律可归入一般线性模型,所以在SPSS中都被归入了General Lineal Model子菜单。详情可参见网站的SPSS教程。

Q:配对病例对照研究的原始数据如何直接用SPSS分析?

A:这个问题据我所知可能无法直接用SPSS菜单解决。需要先用程序将数据集换算成四格表那样的格式再进行分析。

编程思路:

结果中有case和control两个变量,依次读入原数据,由第一条记录得case=1,第二条记录得control=1,即以前的两条变为一条,取值由以前的暴露史决定。1为暴露,0则为未暴露。这样就可以得到最终分析用数据,这是我能想到的最简单的方法了。

Q:在SPSS中能否直接读入EXCEL 97数据文件?有无读入数据的简便方法?
A:在 SPSS 10.0版中,任何版本的EXCEL文件都可以在OPEN对话框中直接打开。但在9.0及以前版本中就比较复杂,实际上SPSS 7.0以上的版本都可以读入EXCEL 97和ACCESS 97的数据文件。但这些文件类型不能在打开文件对话框的文件类型中找到,SPSS是利用ODBC来实现对这些数据文件的读取的。例如在SPSS 9.0中,请选择File菜单->database capture->new query,会弹出数据库读取向导的对话框,按提示操作即可(你所能够读取的ODBC数据类型取决于你所用计算机上安装的ODBC驱动程序的多少)。
实际上对于老版本的SPSS来说,读入 EXCEL 97数据文件最简单的方法是先在EXCEL 97中选择并复制所需数据(不要选择变量名),然后在SPSS数据界面中选择一行一列的单元格,将数据粘贴过来,最后将变量名改为原变量名。当变量少而记录数多时,这种方法是最快的。
Q:如何将SPSS的结果文件(*.spo文件)转换为其它格式?
A:SPSS的结果文件从7.0版本起就是专用的*.spo文件,据我所知,还没有那种文字处理软件可以将他读出来,但SPSS提供了将该文件转存为其它格式的功能。在SPSS的OUTPUT窗口中选择File菜单->export,可以将结果文件另存为HTML文件和TXT文件。当然,要比spo文件难看的多。图表则自动转化为JPG图片,不能再编辑。因此,最好在所有修改都完成后再EXPORT。另外,该命令也可以针对单个图片或表格进行,选中所需图片或表格,单击右键,选择快捷菜单中的EXPORT即可。
Q:想将SPSS的结果表格直接粘贴到WORD中使用,但一粘过去表格的格式就乱了,如何保持原有的格式?
A:选中所需表格,单击右键,选择快捷菜单中的copy object即可,此时粘贴过去的表格就会保持原有的格式(实际上粘贴过去的是一幅图片)。

:在打开已有的Excel表格时可以成功地读入数据,但同时出现Output1-SPSS Viewer窗 :
>Warning. Command name: GET DATA
>(2109) Encountered a value incompatible with Spss Percent type. Possible
>loss of data. Ensure that all data within the column contains Percent type
>values.
>Note: Future warnings of this type will not be reported because they may be
>too numerous.
>* (Row# 12, Column# 5)
这是什么原因?
A:该提示的意思是EXCEL表格的的12行第五列的数据和SPSS的格式不兼容,从而该数值可能无法正确导入,可能的原因是小数点后的位数太多。这需要谈到一点编程的问题,EXCEL和ACCESS等的默认数据长度都是24位的,无论你的实际数值为多大。精度高是好事,但这个精度也太高了,会导致小数点后面跟了一大堆的0,从而超出SPSS所能够承受的精度范围,导致出现警告。这时你需要检查一下你的数据,比如说太长、或者数字中间打入了一个逗号等,许多时候将该列的默认数据格式改一下就可以了。  

  评论这张
 
阅读(1454)| 评论(3)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017