近期学习小结之:统计软件小览

其实在真正运用统计软件进行分析前,还有问卷设计和抽样等前期准备工作。在这里首先引入统计软件其实不仅在抽样过程要先“小试牛刀”,更重要的是,结合统计学知识了解统计软件可以实现怎样的分析,做问卷和抽样时更有针对性和目的性。

目前专业的统计软件有SAS、MATLAB、SPSS的EViews ,此外在制表(数据录入)中还可能用到Excel的一些简单的转换功能。

SAS 软件简介

SAS系统全称为Statistics Analysis System,现在的版本为9.0版,大小约为1G。SAS系统被誉为国际上的标准软件系统。

SAS系统是一个组合软件系统,它由多个功能模块组合而成,其基本部分是BASE SAS模块。BASE SAS模块是SAS系统的核心,承担着主要的数据管理任务,并管理用户使用环境,进行用户语言的处理,调用其他SAS模块和产品。也就是说,SAS系统的运行,首先必须启动BASE SAS模块,它除了本身所具有数据管理、程序设计及描述统计计算功能以外,还是SAS系统的中央调度室。它除可单独存在外,也可与其他产品或模块共同构成一个完整的系统。各模块的安装及更新都可通过其安装程序非常方便地进行。SAS系统具有灵活的功能扩展接口和强大的功能模块,在BASE SAS的基础上,还可以增加如下不同的模块而增加不同的功能:SAS/STAT(统计分析模块)、SAS/GRAPH(绘图模块)、SAS/QC(质量控制模块)、SAS/ETS(经济计量学和时间序列分析模块)、SAS/OR(运筹学模块)、SAS/IML(交互式矩阵程序设计语言模块)、SAS/FSP(快速数据处理的交互式菜单系统模块)、SAS/AF(交互式全屏幕软件应用系统模块)等等。SAS有一个智能型绘图系统,不仅能绘各种统计图,还能绘出地图。SAS提供多个统计过程,每个过程均含有极丰富的任选项。用户还可以通过对数据集的一连串加工,实现更为复杂的统计分析。此外,SAS还提供了各类概率分析函数、分位数函数、样本统计函数和随机数生成函数,使用户能方便地实现特殊统计要求。

Matlab 软件简介

美国Mathwork公司于1967年推出了矩阵实验室“Matrix Laboratory”(缩写为Matlab)这就是matlab最早的雏形,目前已发展到了6.5版本。

Matlab是一种解释性执行语言,具有强大的计算、仿真、绘图等功能。由于它使用简单,扩充方便,尤其是世界上有成千上万的不同领域的科研工作者不停的在自己的科研过程中扩充matlab的功能,使其成为了巨大的知识宝库。可以毫不夸张的说,哪怕是你知真正理解了一个工具箱,那么就是理解了一门非常重要的科学知识。科研工作者通常可以通过matlab来学习某个领域的科学知识,这就是matlab真正在全世界推广开来的原因。目前的matlab版本已经可以方便的设计漂亮的界面,它可以象vb等语言一样设计漂亮的用户接口,同时因为有最丰富的函数库(工具箱)所以计算的功能实现也很简单,进一步受到了科研工作者的欢迎。另外,,matlab和其他高级语言也具有良好的接口,可以方便的实现与其他语言的混合编程,进一步拓宽了matlab的应用潜力。可以说,matlab已经也很有必要成为大学生的必修课之一,掌握这门工具对学习各门学科有非常重要的推进作用。 matlab还有非常完善的使用手册,不仅包括使用方法,还有涉及的科学知识,非常简单易读。

SPSS 软件简介

SPSS是软件英文名称的首字母缩写,原意为Statistical Package for the Social Sciences,即“社会科学统计软件包”。但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称更改为Statistical Product and Service Solutions,意为“统计产品与服务解决方案”,标志着SPSS的战略方向正在做出重大调整。

和SAS相同,SPSS也由多个模块构成,在SPSS11中,SPSS一共由十个模块组成,其中SPSS Base为基本模块,其余九个模块为Advanced Models、Regression Models、Tables、Trends、Categories、Conjoint、Exact Tests、Missing Value Analysis和Maps,分别用于完成某一方面的统计分析功能,他们均需要挂接在Base上运行。

SPSS最突出的特点就是操作界面极为友好,输出结果美观漂亮(从国外的角度看),他使用Windows的窗口方式展示各种管理和分析数据方法的功能,使用对话框展示出各种功能选择项,只要掌握一定的Windows操作技能,粗通统计分析原理,就可以使用该软件为特定的科研工作服务。是非专业统计人员的首选统计软件。在众多用户对国际常用统计软件SAS、BMDP、GLIM、GENSTAT、EPILOG、MiniTab的总体印象分的统计中,其诸项功能均获得最高分。SPSS采用类似EXCEL表格的方式输入与管理数据,数据接口较为通用,能方便的从其他数据库中读入数据。其统计过程包括了常用的、较为成熟的统计过程,完全可以满足非统计专业人士的工作需要。对于熟悉老版本编程运行方式的用户,SPSS还特别设计了语法生成窗口,用户只需在菜单中选好各个选项,然后按“粘贴”按钮就可以自动生成标准的SPSS程序。极大的方便了中、高级用户。

EViews 软件简介

EViews软件是在科学数据分析与评价、金融分析、宏观经济预测、销售预测和成本分析等领域应用非常广泛的预测分析计量软件,其前身是时间序列回归软件TSP。TSP软件基于DOS操作系统,EViews软件则在Windows环境下运行,更多地使用菜单和窗口方式,界面友好,使得本来复杂的数据分析过程变得易学易用。

EViews能够处理以时间序列为主的多种类型的数据,进行包括描述统计、回归分析、传统时间序列分析等基本的数据分析以及建立条件异方差、向量自回归等复杂的计量经济模型。

这几种软件相比而言,Matlab需要编程,编程是我的“禁区”,因此舍去。SAS在专业领域应用很多,不过据说是“大块头”,不仅价格还是容量,模块操作也很复杂,毕竟太专业了,对我们初级入门选手太高深。SPSS和Eview还可以选择。挑中SPSS不仅因为研一有门课程涉及过,而且据说用它做的统计分析可以不用解释算法,这对于统计基础薄弱的应用人士而言,无疑是最大福音了。

在这部分工作的准备中,我找到Excel在统计分析中的应用,Excel在统计学中的应用,统计学-从数据到结论(在介绍统计学原理时,每章最后都有一小部分结合软件介绍的使用技巧,很实用),管理统计,此外,关于SPSS的书在网上也有很多(SPSS10PDF教程),我觉得这两本-SPSS11统计模型构建,和SPSS11数据分析(记不请了)都比较具体。其实软件的统计功能都很多,具体应用中不一定全部需要,就现在紧张的状况看,能把需要的模块仔细研究一下方便应用就不错了。