SPSS+AMOS数据分析案例教程-关于中介模
SPSS视频教程内容目录和跳转链接
Mplus中介和调节教程
大学生问卷互填群
Meta分析辅导+代找数据
SPSS+AMOS数据分析案例教程-关于中介模
SPSS视频教程内容目录和跳转链接
R语言快速入门视频教程
LCA潜在类别分析和Mplus应用
Amos结构方程模型数据分析入门教程
倒U关系回归分析中介效应和调节效应分析SPSS视频教程
统计咨询(图文问答)

pandas教程:[11]aggregate分组计算

一旦对数据分组,接下来一定是对各组数据进行计算,这是通过groupby.aggregate()实现的,我们来看一下今天的例子:

  • 先引入必要的模块,然后创建一个DataFrame对象,如果你看了前几篇文章,应该已经知道这个DataFrame了。
    这是内部数据:
  • 根据两个索引color、food进行分组
  • 计算各组总和:
    计算结果为:
  • 计算结果默认使用了两个分组索引color和food作为新的DataFrame的索引(注意计算结果为一个DataFrame对象),可以使用reset_index()来将两个索引转化为列变量
    结果为:
  • 在分组是也可以使用as_index参数达到reset_index()的效果:
    计算结果为:
  • 另外我们经常用到的一个方法为size()返回各组数据量
    结果为:
  • 最后,还有一个经常用到的方法为describe(),对各组数据进行描述性统计:
    计算结果为:

转载请注明来自DataScience.

邮箱: 675495787@qq.com

SPSS实例:[38]spss22.0安装教程

我以前用的是spss20.0,现在为什么要升级到spss22,因为新版本对中文支持更好,界面更加友好,帮助系统也是中文的,更重要的是spss22默认安装的时候可以安装python插件,让你可以在python中调用spss程序,大大减小数据分析工作中的重复劳动,废话不多说,我把自己安装的过程截图到下面。并进行简要说明。

  • 从网上下载一个安装文件,我用的是64位系统;打开安装文件
  • 解压,这个不用说
  • 在这个界面选择单个用户许可证,除非你明确知道自己是网络许可的。
  • 当然,用人家的产品得同意人家的协议,点击下一步
  • 随便输入一个名字啦,点击下一步
  • 我们当然是用简体中文啦,点击下一步
  • 这个就不建议大家装了,我反正没用过这个功能,点击下一步
  • 这个是关键,我们需要安装,因为很多时候我们会用到python代码来处理数据,到时候你没安装的话,就是个麻烦事了。装上它,哪怕不用呢。
  • 接受吧,点击下一步
  • 选择安装的位置,我一般安装到非系统盘,毕竟spss很大,装在c盘太占空间,到时候c盘没空间就不好闹了。
  • 这个就点击确定。
  • 弹出一个授权许可的界面,点击立即授权,点击下一步
  • 我们输入序列码,点击下一步
  • 提示你授权许可完成
  • 重启系统,看看是否安装成功

转载请注明来自DataScience.

邮箱: 675495787@qq.com

SPSS实例:[33]混合设计的方差分析

假如我的实验设计师混合设计的两因素设计,即一个变量是组间变量,一个变量是组内变量,我们怎么样统计这种实验的结果呢?今天就来看看我怎么做混合设计的方差分析,下面是具体的方法:

  • 首先我们打开重复测量方差分析的对话框
  • 我们添加一个组内因素,假如组内因素有三个水平,点击add按钮
  • 我们选中factor1(3),然后点击【define】
  • 将ghj这三个组内变量放入到组内变量框汇总
  • 将组间变量放入到组间变量框中
  • 点击【option】按钮,设置输出的统计量
  • 选择这三个选项,他们是描述性统计、效应量、方差齐性检验
  • 点击ok按钮,开始统计分析。下一篇我们将会讲混合设计方差分析的结果解读。

转载请注明来自DataScience.

邮箱: 675495787@qq.com

Python操作Word:[1]常用对象介绍

前面已经介绍过了试用win32com类库来进行Word开发,系列文章《Python操作Word》是继承了前面的文章,所以,你应该先查看前面的文章,其实只有两篇,文章地址列在最下面的参考资料了。

  • 段落:这是我蕞常用的类,可以给不同的段落设置格式,也可以插入内容,比如读取段落的数目,使用Paragraph.Count。选择特定的锻炼可使用Paragraph[]
  • 图片、图表:Shapes对象,获取图片的数目使用Count,获取第N个图片使用Shapes[N]
  • 表格:Tables对象,获取Tables的数目使用Count,获取第N个表格使用Tables[N]
  • 范围:Range对象是最重要的对象,我们经常使用range()来取得文档的所有范围;使用rang(i,j)可以获得第i行第j个字的位置;
  • 还可以使用Start 和End来标注开始和结尾。
  • 文字:Words对象,想要知道有多少个字?看下面。

转载请注明来自DataScience.

邮箱: 675495787@qq.com

Python教程:[47]字典对象的方法大全

python字典对象有一些方法,今天就详细介绍一下,也作为自己编程时的备忘录,废话不多少,还是用例子来说明问题:

  • 创建一个字典先
  • 以列表的方式获取所有的键
  • 以列表的方式获取所有的值
  • 以列表的方式获取所有的单元
  • 返回一个iterator对象(关于iterator对象,我们下一篇文章再讲)
  • 键值转换成iterator对象
  • 更新字典:b字典中的键值更新到a字典,a字典的键值等于b字典中相应的键值
  • 输出一个item同时从字典中删除这个item

转载请注明来自DataScience.

邮箱: 675495787@qq.com

SPSS实例:[7]多选题如何做交叉分析

多项选择题做统计分析的时候经常用到两种数据录入方式,一种是二分法;另一种是分类法。其实两种方法都能完成所有的分析,所以我们没有必要跟大家介绍两种方法,今天我们就是用分类法来进行分析,下面是具体的步骤:
工具/原料

  • spss20.0
    方法/步骤

  • 我们先来看数据录入的方式,下面第一幅图是问卷,该题有8个选项,是多选题,被试最多可以选择8个选项。下面第二幅图是数据录入的格式,我们看到有8列变量每列变量中的值可以是1-8的任意一个

  • 将保存在Excel中的数据直接拖动到spss界面,这样就在spss中打开了Excel文件。
  • 第一步是要设置变量集,因为8个变量都是一个题,所以8个变量要组合成一个变量集,在菜单中找到:analyse–multiple response–define variable sets
  • 将这8个变量选中,然后放入到右侧的变量集框中
  • 选择数据录入的方法,我们使用的分类法,选择第二种方法,然后输入最大值和最小值分别是8和1
  • 输入变量集的名称和标签,这个你自己定名字,然后添加到右侧的列表中
  • 当你看到这个列表中成功添加了一个变量集以后,你就可以关闭这个窗口了。
  • 接着我们来做频率统计,在菜单栏中找到:analyse–multiple response–frequency,将刚才生成的变量集放入右侧的列表中,点击ok,输出结果
  • 多选题百分比要看最后一列
  • 交叉分析可以使用analyse–multiple response–crosstabs

  • 假如我们要看不同性别和不同年级的人的频率,我们将性别这个变量放入行变量,将年级放入列变量,然后需要设置每个变量的取值范围

  • 点击ok我们就可以看到分析的结果了。

转载请注明来自DataScience.

邮箱: 675495787@qq.com

pandas教程:[17]字符串提取数据

很多时候数据都是以字符串的形式保存的,比如多选题的答案,很多人都是用‘ABCD’这种形式保存数据,那么我们怎样将这样的数据提取出来,转换成可以统计的数据呢?pandas的extract可以做到这些。

  • 先来创建一个数据序列
    查看一下数据内容
  • 使用extract方法提取数字:它的第一个参数是正则表达式,括号表示要提取的部分
    输出内容为:(注意无法匹配的内容用NaN表示)
  • 假如我们要提取多个数据,可以使用多个括号
    输出内容为:
  • 你要灵活使用问号,它表示可有可无,下面的方式可以匹配字符“c”
    输出内容为:
  • 如果我们想要让输出的结果包含变量名(列名),我们可以使用下面的写法:
    输出结果为:

转载请注明来自DataScience.

邮箱: 675495787@qq.com

pandas教程:[27]散点图和抖动图

拿到一个数据我们首先想到的是绘制散点图查看数据的基本分布情况,那么在Python.pandas中,如何绘制散点图呢?散点图的缺陷是什么,为什么要绘制抖动图呢?

  • 先引入相应的模块
  • 读取数据到数据框df
    打印出前5行数据,可以看到有两列数据,分别是 孩子的身高和父母的身高
  • 先绘制一个散点图,x轴为孩子的身高,y轴为父母的身高,将绘制得到的图片保存在D盘下的plot.png文件
  • 我们可以看到得到的图片是酱紫的,由于数据点重合在了一起,所以我们看到的散点图很规整,但却隐藏了规律,于是我们想到用到抖动的方法,绘制抖动图
  • 我们看可以实现抖动的函数:所谓的抖动就是让数据点发生微小的位移,也就是略微改变数据的值,使得数据点不能完全重合,抖动距离的大小用下面函数中的factor参数来决定。
  • 利用上面的函数对df进行处理
  • 我们看得到的数据df2是酱紫的:
  • 现在接着绘制一个散点图,生成的就是抖动图了。alpha参数指的是数据点的透明度
  • 从这个图中我们可以清楚的看到,颜色比较深、数据比较多的点和颜色比较浅、数据比较少的点的位置。

转载请注明来自DataScience.

邮箱: 675495787@qq.com

SPSS实例:[6]vba控制spss处理数据

使用vba来控制spss处理数据,使得我们可以批量进行spss操作,大大加快我们的工作速度。比如,前两天有网友问我如何进行一万次回归分析,我直接写了一段vba代码,很快就能处理完,并整理成分析报告。这就是vba与spss合作所带来的效果,因为篇幅有限,下面只给大家概述一下如何在vba中调用spss对象,并进行数据处理,想要了解更详细的教程,希望您持续关注我写的教程。转载请注明出处(作者百度ID为:qq675495787)

  • 概述spss对象:spss对象是控制spss程序的对象集合。spss对象的指令变换点是ISpssApp对象,它是所有对象的容器,内含所有对象。下面的树形图介绍了spss对象所包含的属性和方法,这些属性和方法会在以后的教程中跟大家介绍。
  • 引用spss类库:如果你想要写spss脚本,你必然要用到spss对象。在spss脚本中,你可以使用objSPSSApp为全局变量来调用spss对象,在此之前要确保这个对象已经被创建好了(实际上,创建了spss对象就使spss程序开始运行了,只不过你看不到程序界面,说实话,你什么都看不到)。

  • 换一种说法,如果你想要在其他编程语言中使用spss,你需要首先创建ISpssApp对象。例如,在微软的VB编辑器中(使用vba),首先你必须在VBA工程中引用spss对象类库(也就是:spsstype library,spss pivot table
    type library和spss RTF type library)。操作方法是,在vbe中,点击工具–引用;找到这几个类库,然后勾选他们,点击确定按钮。

  • 声明spss对象变量:引用了spss类库以后,我们可以在vba中声明spss对象变量了。代码如下:

  • Dimspss as object

  • Set
    spss=createobject(“spss.application16”)

  • 实际上我们更建议使用对象类来声明变量,所以上面的语句应当写成:

  • Dimspss as ispssapp

  • Set spss=new
    spsswinlib.application16

  • 这样的写法可以加快你的代码编写速度。

  • 设置spss程序可见性:以上两个小代码可以启动spss程序,当你不需要看到这个程序的时候,你应该让其保持隐身,在后台运行,你看不到spss程序。如果你想要看到spss程序,你应该设置spss对象的可见性属性为true。如下图所示,我们打开一个数据文件“卡方检验”,然后设置数据文件的可见性为1,这样就可以看到spss程序了,否则是看不到的,但是即便看不到他们也是运行中的。

  • 小试牛刀:我们试试如何读取spss的版本号,输入代码

  •     a = spss.GetSPSSVersion
    
  •      MsgBox a
    
  • 这段代码就是用变量a存放spss的版本号,然后用消息框显示a的数值。

转载请注明来自DataScience.

邮箱: 675495787@qq.com

Statsmodels:[1]模块简介

Statsmodels是Python的统计建模和计量经济学工具包,包括一些描述统计、统计模型估计和推断。这篇文章是Statsmodels系列文章的第一篇,主要介绍一下Statsmodels能干什么,以方便一些初学者选择是否需要学习该模块。之后我会发布一些列入门教程,一是作为笔记自己查看,而是作为教程可供学者快速入门,下面我们来看看Statsmodels有啥特性吧。

  • Liner regression models:线性回归模型
  • Gneralized linear models:一般线型模型,主要用于各种设计的方差分析
  • robust linear models:
  • Discrete choice models:离散选择模型,logit模型属于离散选择模型,主要用于微观计量经济学范畴
  • ANOVA:方差分析模型
  • Time series analysis:时间序列分析
  • Nonparametric estimators:非参检验
  • a wide range of statistical tests:各种统计检验
  • 以各种方式输出表格:text,latex,html;读取各种格式的数据
  • 绘图功能
  • extensive unit tests to ensure correctness of results:大量的整体检验以保证结果的正确性

  • 活跃的开发团体正在开发大量可用的工具

转载请注明来自DataScience.

邮箱: 675495787@qq.com