‘壹’ 请问,sas9.1.3的安装数据文件是什么
昨天装了半天没有装上,后来找到一个英文的安装文档,才豁然开朗,顺利安装成功。
1)安装文件准备,SAS9.0安装ISO文件可以从以下ftp服务器获取:
ftp://202.113.29.4/ 匿名访问(南开大学数学系服务器)
目录位置:ISO/SAS/9.0/
把所有文件抓下来,机器估计需要24小时不停工作,理由很简单,SAS安装程序这家伙太大了,而且缺一不少(文件大小不能出错,昨天安装不成功主要的原因还是第一张光盘映像文件大小下载有错)。
这个ftp服务器还缺一个安装文件Secure Windows,这个目录可以从下面这个服务器下载。
ftp://dakou.vicp.net/ 帐号和密码:STATISTICA
\统计软件\通用统计软件\SAS\SAS 9\Secure Windows
这个文件不大,约3M多一点。
2)下载安装授权文件,[这里下载](Licence for SAS V9.rar)。
3)准备一个虚拟光驱软件,因为从ftp服务器下载到的文件都是img文件,需要虚拟光驱软件进行映射,选用最有名的Daemon 3.26。一切准备就绪可以开始安装。
4)关闭所有其他的应用程序,SAS8.2版本以前的先卸载(因为我机器上是SAS8.2,所以没有卸载),这个从国外的安装文档看到要求卸载的,如果不卸载的后果我不清楚。然后将setup目录的img文件映射成光驱,点击setup.exe就可以开始安装了。
第一个选项语言选“简体中文”,然后弹出安装界面,首先选择“检测系统需求”,按照安装提示可能会多次重新启动,但是实际上我的安装过程并没有重启,我使用的操作系统版本是Windows XP SP1,当然我补丁还是比较勤打,而且java虚拟机也装过,所以这一步很快进行,而且并没有重新启动。
系统检测完毕后可以点击“安装SAS软件”,即正式开始安装SAS9.0。
安装过程有几个要点:
a、提示选择一个txt的文件文件时(授权文件),选择2)提供下载的文件。
b、第一次安装(为什么要说第一次安装呢?很简单,因为SAS9.0需要两次安装才能成功),选择安装的模块时,三个模块不要选择:AF、IML、Lab。
c、根据提示更换安装盘,事实上就是更换虚拟光驱的映射文件。
d、第一次安装到提示100%停住了,此时不要以为安装失败,点击“取消”,然后重新开始进行第二次安装(注意,进行第二次安装不要卸载第一次安装的文件),重复前面的步骤,还是从setup目录的img文件开始。
e、第二次安装,选择安装的模块时,把第一次安装没有选择的AF、IML、Lab都选上。
f、当第二次安装到79%的时候就会和第一次安装有所变化,先后多了提示安装Secure Windows和Shared Components,和前面一样照样进行切换映射文件。
g、安装到95%左右时会提示一个关于LOG文件的关联问题,务必选择“确定”,否则后面会有一些提示错误。
h、安装上述安装过程就可以顺利安装SAS9.0
启动界面
‘贰’ SAS是什么
一、SAS系统简介
SAS是一个庞大的系统,它目前的版本可以在多种操作系统中运行。当前在国内被广泛使用的最新版本是8.2版,功能很强大,我深有体会。
据说9.0版已在国外面世,已经有一些有关它的抢先报道在网络上广为流传,说它如何如何美妙,令人不禁充满期待。
SAS8.2的完整版本包含以下数十个模块。
BASE,GRAPH,ETS,FSP,AF,OR,IML,SHARE,QC,STAT,INSIGHT,ANALYST,ASSIST, CONNECT,CPE,LAB,EIS,WAREHOUSE,PC File Formats,GIS,SPECTRAVIEW, SHARE*NET, R/3,OnlineTutor: SAS Programming,MDDB Server,IT Service Vision Client, IntrNet Compute Services,Enterprise Reporter,MDDB Server common procts,Enterprise Miner,AppDev Studio,Integration Technologies等。
所谓模块,我的理解是将功能相近的程序、代码等集中起来组成相对独立的部分,就称之为模块,类似于办公软件系统office中包含的word、excel、access等。各模块具有相对独立的功能范围,我们常用的模块有base,graph,stat,insight,assist,analyst模块等,分别执行基本数据处理、绘图、统计分析、数据探索、可视化数据处理等功能。其余模块我用得很少,知道得也很少,所以也就不多说了。
SAS系统的长处,体现于它的编程操作功能的无比强大。SAS一直以来也是注重于其编程语言的发展,对于可视化方式的菜单操作投入较少,其较早的版本仅有很少的菜单操作功能,使用起来也是非常的别扭。这很可能就是在windows人机交互式操作系统占统治地位的今天,SAS较少被人问津的原因之一。
到了最新的几个版本,SAS也对可视化操作方法投入了一定的关注。从8.0版以后,出现了几个功能强大的可视化操作的模块,如insight模块和analyst模块等,其菜单操作的方便程度以及人机界面的亲和性绝不亚于SPSS等着名的可视化统计分析软件。
然而要想完全发挥SAS系统强大的功能,充分利用其提供的丰富资源,掌握SAS的编程操作是必要的,也只有这样才能体现出SAS在各个方面的杰出才能。
二、SAS系统基本操作及基本概念
哪位要是连软件的安装和打开都要我啰嗦的话,我劝您还是买一套洪恩的《开天辟地》好好热热身先。
SAS 8.2的界面中间是三个并排(或层叠)的窗口,那个叫做Program Editor的窗口(窗口标签为Editor)就是用来输入SAS语句的,编程操作的所有内容都是在该窗口内完成的,各位还是要跟它先多熟悉一下。
(一)数据集(dataset)和库
统计学的操作都是针对数据的,SAS中容纳数据的文件称为数据集,数据集又包含在不同的库(暂且理解为数据库吧)中。SAS中的库分为永久性和临时性两种。顾名思义,存在于永久库中的数据集是永久存在的(只要你不去删除它),临时库中的数据集则在你退出SAS后自动被删除。至于SAS中库的概念,最简单的理解就是一个目录,一个存放数据集的目录。
数据集的结构完全等同于我们一般所理解的数据表,由字段和记录所构成,在统计学中我们习惯将字段称为变量,在后面的内容中字段和变量我们就理解为同一种东西吧!建立数据集的方法很多,编程操作中有专门的数据读入方法来建立数据集,但需要将数据现场录入,费时费力。如果数据量大,我劝各位还是先以其它方法将数据集建好,否则程序语句的绝大部分会浪费在数据的输入上。
What are 其它方法?各位是不是去参考一下别的书籍或资料。要不您是不是可以等一等,我准备若干年后出一本SAS操作大全。
(二)SAS程序概述
和其它计算机语言一样,SAS语言(称为SCL语言,SAS Component Language)也有其专有的词汇(即关键字)和语法。关键字、名字、特殊字符和运算符等按照语法规则排列组成SAS语句,而执行完整功能的若干个SAS语句就构成了SAS程序。
SAS程序包括多个步骤和一些控制语句,一般情况下均包括数据步和过程步,一个或多个、数据步或过程步,它们之间任何形式的组合均可成为一段SAS程序,只要能完成一个完整的功能。通常情况下SAS程序还包括一些全程语句,用以控制贯穿整个SAS程序的某些选项、变量或程序运行的环境。
SAS程序的语句一般以关键字开始,以一个分号结束,一条语句可占多行(SAS每看到一个分号,就将其以前、上一个分号以后的所有东东当作一条语句来处理,而不管他们处在多少个不同的行中)。SAS语句对字母的大小写不敏感,你可以根据个人习惯决定字母的大写或小写。
1. 库名(库标记)的定义
为了保存宝贵的数据和方便操作起见,我习惯于指定自己的库名及其路径(目录),因为SAS系统中已有的永久库(SASUSER)无论库名还是其对应的路径都太过繁琐,使用太不方便。程序中用到的数据,都可以永久的保存于该路径下,保证以后可以重复使用。指定库名的语句为全程语句,其格式如下:
Libname 库名 ‘路径’;
例如我们指定的库名为“a”,路径为:“e:\data\”,SAS语句如下:
libname a ‘e:\data\’;
2. 数据步
SAS的数据步以data语句开始,用于创建和处理数据集。Data语句以关键字“data”开始,格式如下:
data 数据集名;
例如:data a.case; 将创建在库a中名为case的SAS数据集,语句执行后你可在与库a对应的目录下看到刚刚建立的数据集文件case。
Data语句所指定的数据集,一般都是以“库名.数据集名”的格式出现的,也可以单独的“数据集名”出现,此时的数据集系统默认为是临时库中的数据集,退出系统后将会被删除。
data语句有两个重要的功能,标志数据步的开始和命名将要创建的SAS数据集。
除data语句外,数据步一般情况下还包括infile语句、input语句以及datalines语句等。在不同的数据输入方式下对于它们的使用方式也不一样。
SAS程序有两种常见的数据输入方式,即从外部文件读入和直接输入两种方式。
(1)外部文件读入方式
数据若已经包含在某个外部文件(文本文件或数据文件)中,可用此方法输入数据到数据集文件中。
在以上介绍的data语句后,写入以下语句:
infile ‘外部文件的所在位置及名称’ 选项;
input 变量名1变量名2 …变量名n;
infile语句用于从外部文件读入数据,必须出现在input语句之前。它的功能是指定一个包含原始数据的外部文件。
input语句用于向系统表明如何读入每一条数据记录。它的主要功能有:读入由语句指定的数据列,为相应的数据域定义变量名,确定变量的读入模式。
例如:
libname a ‘e:\data\’;
data a.student;
infile ‘e:\data\student.txt’;
input name height weight;
以上程序将目录“e:\data\”下的文本文件“student.txt”中的数据输入数据集student中,该数据集存放于目录“e:\data\”下。
(2)直接输入方式
数据量较少或操作者意志力坚强的情况下采用此种输入方式,在data语句之后写入如下语句:
input变量名1变量名2 …变量名n;
datalines;(在以前的版本下为cards,新版本下两者可通用)
… … … …(数据行)
… … … …(数据行)
… … … …(数据行)
;
datalines语句用于直接输入数据,标志着数据块的开始。
注意:这里的数据行中数据之间以空格分隔,当然也可以其它东东如逗号等来分隔,这里大家先以空格来分隔好了。因为不同的分隔方式下input语句要采取相应的控制选项,这些我们以后再讨论,这里我们还是省省力气吧。另外数据行输完后不能像其它语句那样直接在后面加上分号,而要另起一行输入分号,这样SAS才认为这是在输入原始数据而不是在搞别的什么。
例如:
libname a ‘e:\data\’;
data a.student;
input name $ height weight;(name后面的$符号表示变量name为字符型变量)
datalines;
Linda 171 51
Mary 168 50
Selinna 169 49
;
以上程序将直接建立数据集文件student,该数据集文件存放于目录“e:\data\”下。
3. 过程步
SAS程序的过程步表示一个处理过程,如排序、T检验、方差分析等等。过程步以关键字proc开始,后面紧跟着过程名,用以区分不同的程序步,并以关键字run结束。
一般的格式如下:
proc 过程名 选项列表;
……(其它语句);
……(其它语句);
run;
SAS程序中涉及的过程多达数百种,实现统计功能时常用的过程也有数十种之多,现将最为常用的过程名称及其所能实现的功能列入下表(表1.1),以便各位提前热热身。
表1.1 常用的过程名称及其功能
过程名
功 能
Sort
将指定的数据集按指定变量排序
Print
将数据集中的数据列表输出
tabulate
将数据按照指定的分类变量以表格的形式分类汇总
Means
对指定的数值变量进行简单的统计描述
Freq
对指定的分类变量进行简单的统计描述
Ttest
对指定的变量做t检验
Anova
对指定的变量做方差分析
npar1way
对指定的变量做非参数检验
Reg
对指定的变量做回归分析
Corr
对指定的变量做相关分析
Discrim
对指定的变量做判别分析
Cluster
对指定的变量做聚类分析
Chart
绘出低分辨率的统计图
4. 几个常用的重要过程
在进入一般统计学功能实现的内容之前,有关数据预处理和执行重要公共功能的过程大家有必要预先掌握,这里选出几个常用的和重要的过程进行讨论。
(1)对SAS文件进行操作的datasets过程
datasets过程是对数据文件进行管理操作的工具,利用它我们可以实现以下功能:
将SAS文件从一个库中拷入另一个库中;
对SAS文件进行重命名;
修复损坏的SAS文件;
删除SAS文件;
列出某一SAS库中所有的SAS文件;
列出一个SAS数据集的属性,如最后修改时间、数据是否压缩、数据是否索引等;
对SAS文件进行设置密码的操作;
向SAS数据集添加记录;
对SAS数据集的属性以及数据集内变量的属性进行修改;
创建或删除SAS数据集的索引;
创建并管理SAS数据集的核查文件;
创建或删除SAS数据集的完整性规则。
datasets过程的一般格式如下:
proc datasets <选项列表>;
age 当前文件名 相关文件名列表</选项列表>;
append base=数据集名 <data=数据集名 其它选项>;
audit 文件名<(操作密码)>; initiate;<其它代码;>
change 旧文件名1=新文件名1 <…旧文件名n=新文件名n> <选项列表>;
contents <data=数据集名> <其它选项>;
out=库标记 <其它选项>;
exclude 文件名 <其它选项>;(该语句只能在语句后出现,不能和select语句同时出现)
select 文件名 <其它选项>;(该语句只能在语句后出现,不能和exclude语句同时出现)
delete 文件名 <其它选项>;
exchange文件名1=交换文件名1 <…文件名n=交换文件名n> <选项列表>;
modify 文件名 <选项列表>;
<modify语句之从属语句>;
repair文件名 <选项列表>;
save文件名 <选项列表>;
run;
是不是太繁琐了,我都有些不耐烦了。不过我还是得写,已经写了嘛!不忍心浪费掉,最起码可以用来充充数,扩大一下篇幅。至于各位,嫌烦的可以略过此部分,想用的时候再来温习也不迟。下面我就不厌其烦地向各位介绍一下各选项及各条语句的含义和用法。
proc datasets语句后各选项的含义及用法见下表(表1.2)。
表1.2 proc datasets语句后各选项的含义及用法
选项
含义及用法
alter=转换保护密码
SAS文件设置有转换操作密码时用以验证操作的合法性,密码正确时代码才会被执行
details/nodetails
控制有关SAS文件的详细信息显示与否,前者为显示,后者不显示,默认值为后者
force
此选项具有两个功能:(1)在过程步的语句存在错误时仍然强制程序的执行;(2)在append语句中,两个数据集的变量不完全相同时仍然强制append语句的执行。
gennum=
控制对衍生数据集的处理方式,等号后可为all, hist, revert或某一整数
kill
此选项表示删除待处理的库中的所有文件,应慎用
library=库标记
用以指定所要处理的库
memtype=成员类型
指定处理所针对的库成员类型(文件类型),默认值为all(所有类型)
nolist
在日志文件中禁止对所处理文件目录的显示
nowarn
在语句中指定的文件不存在等情况下,禁止显示出错信息,强制程序继续执行
pw=操作密码
SAS文件设置操作密码时验证操作的合法性(包括读、写保护以及转换保护的文件)
read=读保护密码
SAS文件设置读保护密码时验证操作的合法性
age语句用于批量地重命名文件,按照当前文件和相关文件的排列顺序,依次将后一个文件名重命名给前一个文件,结果是最后一个文件被删除,当前文件名被废弃。
对此语句我所了解的就这么多,而且还是通过试验得出的结论,但总感觉还是理解的不对,哪位若有高见还请不吝赐教。
append语句执行向数据集添加记录的功能,选项“base=数据集名”用以指定要添加记录的数据集,“data=数据集名”则指定所要添加的记录所在的数据集,此选项若省略则默认为当前数据集(最近一次操作的数据集)。
audit语句用于对文件的核查,生成核查文件并对其进行管理;change语句以新文件名替换旧文件名;contents语句用于显示指定数据集或当前数据集的各种属性;语句用于将当前库中相应的文件拷贝到指定的库中,选项“out=库标记”用来指定文件要拷贝到的目标库;delete语句用于删除指定的文件;exchange语句的功能是将等号前后两个文件的文件名进行互换;modify语句用于修改文件各方面的属性;repair语句用于对指定的文件(受到过某种损坏)进行修复,使其恢复到可以使用的状态;save语句的功能是将其指定的文件保留,当前库中的其他所有文件则被删除。
(2)对数据文件中记录进行排序的sort过程
sort过程的功能是对指定数据集中的记录按照指定的变量进行排序。由于诸多过程有对数据集记录进行排序的需要,比如过程步中存在by语句(用以将数据文件分割为若干部分)的情况下,就需要按照by语句后的变量对数据先行排序,所以sort过程非常有用,而且非常常用。
sort过程的一般格式如下:
proc sort 选项列表;
by <descending> 变量名1 <变量名2 … 变量名n>;
run;
proc sort语句后各选项含义及其用法见下表(表1.3)。
表1.3 proc sort语句后各选项含义及其用法
选项
含义及用法
data=数据集名
用以指定sort过程所要处理的数据集,若省略则默认为最近建立或处理的数据集
date
此选项指定在不改变文件创建日期和修改日期的条件下对文件进行排序操作
out=数据集名
将排序后文件以指定的文件名存储,原文件不进行任何修改,若无此选项则将原文件覆盖
sortseq=排序依据
指定对字符型变量排序时依据的标准
reverse/equals/noequals
指定输出数据中的排序方式,三者分别表示将字符变量的次序翻转显示,在排序变量的各水平内部次序保持不变,在排序变量的各水平内部允许次序的改变
nopkey/noprecs
指定重复变量的消除方式,前者表示除去排序变量值重复的记录,后者表示除去所有变量值重复的记录
sortsize=
用以指定可用最大内存的大小,等号后为表示内存大小的数值及单位,比如10m
force
用以强制执行重复排序(对已建立索引的文件排序)过程
tagsort
指定在临时文件中仅存储排序变量和记录编号,以减少对磁盘空间的使用
by语句即用以指定排序所要依据的变量,变量可为数值型也可为字符型,其后可指定多个变量,sort过程在按照靠前的变量进行排序的情况下再按照靠后的变量进行排序。by语句中每个变量前可用descending/ascending选项来指定按照其排序的方式(降序或升序),默认状态为升序。
(3)将数据文件输出显示的print过程
print过程的功能是将SAS数据集的记录以一定的方式显示到输出设备(显示屏),可以显示其全部的变量或部分变量。利用此过程,你可以创建从简单列表到可进行数据汇总的各种报告的各种不同的表单。
print过程的一般格式如下:
proc print 选项列表;
by <descending> 变量名1 <变量名2 … 变量名n 其他选项>;
pageby 变量名;
sumby 变量名;
id 变量名;
sum变量名;
var变量名;
run;
proc print语句后可跟的选项含义及其用法见下表(表1.4)
表1.4 proc print语句后选项含义及其用法
选项
含义及用法
contents=文本
用以指定html内容文件中指向输出的链接的标识文本,等号后可为任何文本
data=数据集名
指定所要处理的数据集,等号后为数据集文件名
double
指定在相邻的记录间插入一空行
n=字符串
在报告的末尾或by变量各水平分组的末尾显示显示记录的数目,并以等号后的字符串对其进行标识
noobs
禁止记录编号在报告中的显示
obs=列标题
用以指定记录编号所在列的列标题
round
对未进行格式化的数值变量进行四舍五入,统一格式化为带两位小数的十进制数值
rows=page
规定页面格式,目前’page’是此选项唯一可用的值,表示在每一页中只显示一条记录的一行变量值,即一行中显示尽可能多的记录数
width=列宽度
指定列的宽度,可取的值有’full’,’minimum’,’uniform’,’uniformby’等,
heading=方向
取值可为v(vertical)或h(horizontal),表示列标题显示的方向(横向或纵向)
label
指定以变量标识作为相应的列标题,否则以变量名作为列标题
split=字符
首先此选项指定以变量标识作为列标题,以指定的字符作为列标题换行的标志
style=类型元素
指定报告中特定位置所要应用的类型元素(涉及很多内容,详细内容略)
by语句在所有过程中的用法都相同,即将数据集分割为若干小数据集分别进行处理。pageby语句用来控制换页时变量的显示方式,对于其后所指定的变量,相同的值不会显示在不同的页中,该变量某一值的记录在一页的剩余部分显示不下时,则从该值的第一条记录开始换行显示。sumby语句的作用和pageby语句相似,只不过是将换页的动作换为求和,对指定变量的每一值计算var变量的总计值。id语句的作用是用指定的变量值代替记录编号对每一条记录进行标识。sum语句用于指定报告中要进行求和操作的变量,var语句用于指定要在报告中显示的变量。
以上过程作用较为普遍,使用频率较高,有必要预先了解,以便于后面所讨论内容的顺利进行。
为节省篇幅,这里不进行实例演示。内容过于枯燥,可能的错误也难免,还请各位多多包涵。
SAS程序操作的大概情况就草草的这样介绍一下吧,说得太多的话我怕各位没有耐心看下去。更多的内容我想还是留在实际的例子中来介绍,这样大家可以好好的切身体会一下,然后就会印象深刻,实际运用起来也就得心应手了。
‘叁’ sas怎么读取access数据
以SAS 9.4 64位为例。主要有两种导入方式:
1、手动点选导入。
(1)点击“文件”---“导入数据”---“standard data source”---"Microsoft access Database"
这个界面是询问是否需要将导入数据的编码保存,如果想要保存则点击“Broswe”键选择路径后点击“fInish”,如果不要保存则直接点击“fInish”。
这样就完成了导入,只要等待SAS将数据库读入就行(数据库越大耗费时间越长,半小时都有可能)。
12、代码运行导入。
这里的代码其实就是第一种方法中最后一步中可以选择保存的导入数据编码。
代码如下:
PROC IMPORT OUT= WORK.a
DATATABLE= "2010Table"
DBMS=ACCESS REPLACE;
DATABASE="E:Study数据 .mdb";
SCANMEMO=YES;
USEDATE=NO;
SCANTIME=YES;
RUN;
主要修改的地方就是“WORK.a”(SAS拟存储数据的数据集名)、"2010Table" (数据库中的表名)、"E:Study数据 .mdb"(数据库路径)三个。其他一般不需要修改,除非数据库有访问密码等。
需要注意的是不同版本的SAS对数据库文件支持度不同,9.2貌似只支持97-03格式的access(.mdb),后续版本则支持10的版本(.accdb)。
‘肆’ spss使用方法
要是连软件的安装和打开都要我啰嗦的话,我劝您还是买一套洪恩的《开天辟地》好好热热身先。
SAS 8.2的界面中间是三个并排(或层叠)的窗口,那个叫做Program Editor的窗口(窗口标签为Editor)就是用来输入SAS语句的,编程操作的所有内容都是在该窗口内完成的,各位还是要跟它先多熟悉一下。
(一)数据集(dataset)和库
统计学的操作都是针对数据的,SAS中容纳数据的文件称为数据集,数据集又包含在不同的库(暂且理解为数据库吧)中。SAS中的库分为永久性和临时性两种。顾名思义,存在于永久库中的数据集是永久存在的(只要你不去删除它),临时库中的数据集则在你退出SAS后自动被删除。至于SAS中库的概念,最简单的理解就是一个目录,一个存放数据集的目录。
数据集的结构完全等同于我们一般所理解的数据表,由字段和记录所构成,在统计学中我们习惯将字段称为变量,在后面的内容中字段和变量我们就理解为同一种东西吧!建立数据集的方法很多,编程操作中有专门的数据读入方法来建立数据集,但需要将数据现场录入,费时费力。如果数据量大,我劝各位还是先以其它方法将数据集建好,否则程序语句的绝大部分会浪费在数据的输入上。
What are 其它方法?各位是不是去参考一下别的书籍或资料。要不您是不是可以等一等,我准备若干年后出一本SAS操作大全。
(二)SAS程序概述
和其它计算机语言一样,SAS语言(称为SCL语言,SAS Component Language)也有其专有的词汇(即关键字)和语法。关键字、名字、特殊字符和运算符等按照语法规则排列组成SAS语句,而执行完整功能的若干个SAS语句就构成了SAS程序。
SAS程序包括多个步骤和一些控制语句,一般情况下均包括数据步和过程步,一个或多个、数据步或过程步,它们之间任何形式的组合均可成为一段SAS程序,只要能完成一个完整的功能。通常情况下SAS程序还包括一些全程语句,用以控制贯穿整个SAS程序的某些选项、变量或程序运行的环境。
SAS程序的语句一般以关键字开始,以一个分号结束,一条语句可占多行(SAS每看到一个分号,就将其以前、上一个分号以后的所有东东当作一条语句来处理,而不管他们处在多少个不同的行中)。SAS语句对字母的大小写不敏感,你可以根据个人习惯决定字母的大写或小写。
1. 库名(库标记)的定义
为了保存宝贵的数据和方便操作起见,我习惯于指定自己的库名及其路径(目录),因为SAS系统中已有的永久库(SASUSER)无论库名还是其对应的路径都太过繁琐,使用太不方便。程序中用到的数据,都可以永久的保存于该路径下,保证以后可以重复使用。指定库名的语句为全程语句,其格式如下:
Libname 库名 ‘路径’;
例如我们指定的库名为“a”,路径为:“e:\data\”,SAS语句如下:
libname a ‘e:\data\’;
2. 数据步
SAS的数据步以data语句开始,用于创建和处理数据集。Data语句以关键字“data”开始,格式如下:
data 数据集名;
例如:data a.case; 将创建在库a中名为case的SAS数据集,语句执行后你可在与库a对应的目录下看到刚刚建立的数据集文件case。
Data语句所指定的数据集,一般都是以“库名.数据集名”的格式出现的,也可以单独的“数据集名”出现,此时的数据集系统默认为是临时库中的数据集,退出系统后将会被删除。
data语句有两个重要的功能,标志数据步的开始和命名将要创建的SAS数据集。
除data语句外,数据步一般情况下还包括infile语句、input语句以及datalines语句等。在不同的数据输入方式下对于它们的使用方式也不一样。
SAS程序有两种常见的数据输入方式,即从外部文件读入和直接输入两种方式。
(1)外部文件读入方式
数据若已经包含在某个外部文件(文本文件或数据文件)中,可用此方法输入数据到数据集文件中。
在以上介绍的data语句后,写入以下语句:
infile ‘外部文件的所在位置及名称’ 选项;
input 变量名1变量名2 …变量名n;
infile语句用于从外部文件读入数据,必须出现在input语句之前。它的功能是指定一个包含原始数据的外部文件。
input语句用于向系统表明如何读入每一条数据记录。它的主要功能有:读入由语句指定的数据列,为相应的数据域定义变量名,确定变量的读入模式。
例如:
libname a ‘e:\data\’;
data a.student;
infile ‘e:\data\student.txt’;
input name height weight;
以上程序将目录“e:\data\”下的文本文件“student.txt”中的数据输入数据集student中,该数据集存放于目录“e:\data\”下。
(2)直接输入方式
数据量较少或操作者意志力坚强的情况下采用此种输入方式,在data语句之后写入如下语句:
input变量名1变量名2 …变量名n;
datalines;(在以前的版本下为cards,新版本下两者可通用)
… … … …(数据行)
… … … …(数据行)
… … … …(数据行)
;
datalines语句用于直接输入数据,标志着数据块的开始。
注意:这里的数据行中数据之间以空格分隔,当然也可以其它东东如逗号等来分隔,这里大家先以空格来分隔好了。因为不同的分隔方式下input语句要采取相应的控制选项,这些我们以后再讨论,这里我们还是省省力气吧。另外数据行输完后不能像其它语句那样直接在后面加上分号,而要另起一行输入分号,这样SAS才认为这是在输入原始数据而不是在搞别的什么。
例如:
libname a ‘e:\data\’;
data a.student;
input name $ height weight;(name后面的$符号表示变量name为字符型变量)
datalines;
Linda 171 51
Mary 168 50
Selinna 169 49
;
以上程序将直接建立数据集文件student,该数据集文件存放于目录“e:\data\”下。
3. 过程步
SAS程序的过程步表示一个处理过程,如排序、T检验、方差分析等等。过程步以关键字proc开始,后面紧跟着过程名,用以区分不同的程序步,并以关键字run结束。
一般的格式如下:
proc 过程名 选项列表;
……(其它语句);
……(其它语句);
run;
SAS程序中涉及的过程多达数百种,实现统计功能时常用的过程也有数十种之多,现将最为常用的过程名称及其所能实现的功能列入下表(表1.1),以便各位提前热热身。
表1.1 常用的过程名称及其功能
过程名
功 能
Sort
将指定的数据集按指定变量排序
Print
将数据集中的数据列表输出
tabulate
将数据按照指定的分类变量以表格的形式分类汇总
Means
对指定的数值变量进行简单的统计描述
Freq
对指定的分类变量进行简单的统计描述
Ttest
对指定的变量做t检验
Anova
对指定的变量做方差分析
npar1way
对指定的变量做非参数检验
Reg
对指定的变量做回归分析
Corr
对指定的变量做相关分析
Discrim
对指定的变量做判别分析
Cluster
对指定的变量做聚类分析
Chart
绘出低分辨率的统计图
4. 几个常用的重要过程
在进入一般统计学功能实现的内容之前,有关数据预处理和执行重要公共功能的过程大家有必要预先掌握,这里选出几个常用的和重要的过程进行讨论。
(1)对SAS文件进行操作的datasets过程
datasets过程是对数据文件进行管理操作的工具,利用它我们可以实现以下功能:
将SAS文件从一个库中拷入另一个库中;
对SAS文件进行重命名;
修复损坏的SAS文件;
删除SAS文件;
列出某一SAS库中所有的SAS文件;
列出一个SAS数据集的属性,如最后修改时间、数据是否压缩、数据是否索引等;
对SAS文件进行设置密码的操作;
向SAS数据集添加记录;
对SAS数据集的属性以及数据集内变量的属性进行修改;
创建或删除SAS数据集的索引;
创建并管理SAS数据集的核查文件;
创建或删除SAS数据集的完整性规则。
datasets过程的一般格式如下:
proc datasets <选项列表>;
age 当前文件名 相关文件名列表</选项列表>;
append base=数据集名 <data=数据集名 其它选项>;
audit 文件名<(操作密码)>; initiate;<其它代码;>
change 旧文件名1=新文件名1 <…旧文件名n=新文件名n> <选项列表>;
contents <data=数据集名> <其它选项>;
out=库标记 <其它选项>;
exclude 文件名 <其它选项>;(该语句只能在语句后出现,不能和select语句同时出现)
select 文件名 <其它选项>;(该语句只能在语句后出现,不能和exclude语句同时出现)
delete 文件名 <其它选项>;
exchange文件名1=交换文件名1 <…文件名n=交换文件名n> <选项列表>;
modify 文件名 <选项列表>;
<modify语句之从属语句>;
repair文件名 <选项列表>;
save文件名 <选项列表>;
run;
是不是太繁琐了,我都有些不耐烦了。不过我还是得写,已经写了嘛!不忍心浪费掉,最起码可以用来充充数,扩大一下篇幅。至于各位,嫌烦的可以略过此部分,想用的时候再来温习也不迟。下面我就不厌其烦地向各位介绍一下各选项及各条语句的含义和用法。
proc datasets语句后各选项的含义及用法见下表(表1.2)。
表1.2 proc datasets语句后各选项的含义及用法
选项
含义及用法
alter=转换保护密码
SAS文件设置有转换操作密码时用以验证操作的合法性,密码正确时代码才会被执行
details/nodetails
控制有关SAS文件的详细信息显示与否,前者为显示,后者不显示,默认值为后者
force
此选项具有两个功能:(1)在过程步的语句存在错误时仍然强制程序的执行;(2)在append语句中,两个数据集的变量不完全相同时仍然强制append语句的执行。
gennum=
控制对衍生数据集的处理方式,等号后可为all, hist, revert或某一整数
kill
此选项表示删除待处理的库中的所有文件,应慎用
library=库标记
用以指定所要处理的库
memtype=成员类型
指定处理所针对的库成员类型(文件类型),默认值为all(所有类型)
nolist
在日志文件中禁止对所处理文件目录的显示
nowarn
在语句中指定的文件不存在等情况下,禁止显示出错信息,强制程序继续执行
pw=操作密码
SAS文件设置操作密码时验证操作的合法性(包括读、写保护以及转换保护的文件)
read=读保护密码
SAS文件设置读保护密码时验证操作的合法性
age语句用于批量地重命名文件,按照当前文件和相关文件的排列顺序,依次将后一个文件名重命名给前一个文件,结果是最后一个文件被删除,当前文件名被废弃。
对此语句我所了解的就这么多,而且还是通过试验得出的结论,但总感觉还是理解的不对,哪位若有高见还请不吝赐教。
append语句执行向数据集添加记录的功能,选项“base=数据集名”用以指定要添加记录的数据集,“data=数据集名”则指定所要添加的记录所在的数据集,此选项若省略则默认为当前数据集(最近一次操作的数据集)。
audit语句用于对文件的核查,生成核查文件并对其进行管理;change语句以新文件名替换旧文件名;contents语句用于显示指定数据集或当前数据集的各种属性;语句用于将当前库中相应的文件拷贝到指定的库中,选项“out=库标记”用来指定文件要拷贝到的目标库;delete语句用于删除指定的文件;exchange语句的功能是将等号前后两个文件的文件名进行互换;modify语句用于修改文件各方面的属性;repair语句用于对指定的文件(受到过某种损坏)进行修复,使其恢复到可以使用的状态;save语句的功能是将其指定的文件保留,当前库中的其他所有文件则被删除。
(2)对数据文件中记录进行排序的sort过程
sort过程的功能是对指定数据集中的记录按照指定的变量进行排序。由于诸多过程有对数据集记录进行排序的需要,比如过程步中存在by语句(用以将数据文件分割为若干部分)的情况下,就需要按照by语句后的变量对数据先行排序,所以sort过程非常有用,而且非常常用。
sort过程的一般格式如下:
proc sort 选项列表;
by <descending> 变量名1 <变量名2 … 变量名n>;
run;
proc sort语句后各选项含义及其用法见下表(表1.3)。
表1.3 proc sort语句后各选项含义及其用法
选项
含义及用法
data=数据集名
用以指定sort过程所要处理的数据集,若省略则默认为最近建立或处理的数据集
date
此选项指定在不改变文件创建日期和修改日期的条件下对文件进行排序操作
out=数据集名
将排序后文件以指定的文件名存储,原文件不进行任何修改,若无此选项则将原文件覆盖
sortseq=排序依据
指定对字符型变量排序时依据的标准
reverse/equals/noequals
指定输出数据中的排序方式,三者分别表示将字符变量的次序翻转显示,在排序变量的各水平内部次序保持不变,在排序变量的各水平内部允许次序的改变
nopkey/noprecs
指定重复变量的消除方式,前者表示除去排序变量值重复的记录,后者表示除去所有变量值重复的记录
sortsize=
用以指定可用最大内存的大小,等号后为表示内存大小的数值及单位,比如10m
force
用以强制执行重复排序(对已建立索引的文件排序)过程
tagsort
指定在临时文件中仅存储排序变量和记录编号,以减少对磁盘空间的使用
by语句即用以指定排序所要依据的变量,变量可为数值型也可为字符型,其后可指定多个变量,sort过程在按照靠前的变量进行排序的情况下再按照靠后的变量进行排序。by语句中每个变量前可用descending/ascending选项来指定按照其排序的方式(降序或升序),默认状态为升序。
(3)将数据文件输出显示的print过程
print过程的功能是将SAS数据集的记录以一定的方式显示到输出设备(显示屏),可以显示其全部的变量或部分变量。利用此过程,你可以创建从简单列表到可进行数据汇总的各种报告的各种不同的表单。
print过程的一般格式如下:
proc print 选项列表;
by <descending> 变量名1 <变量名2 … 变量名n 其他选项>;
pageby 变量名;
sumby 变量名;
id 变量名;
sum变量名;
var变量名;
run;
proc print语句后可跟的选项含义及其用法见下表(表1.4)
表1.4 proc print语句后选项含义及其用法
选项
含义及用法
contents=文本
用以指定html内容文件中指向输出的链接的标识文本,等号后可为任何文本
data=数据集名
指定所要处理的数据集,等号后为数据集文件名
double
指定在相邻的记录间插入一空行
n=字符串
在报告的末尾或by变量各水平分组的末尾显示显示记录的数目,并以等号后的字符串对其进行标识
noobs
禁止记录编号在报告中的显示
obs=列标题
用以指定记录编号所在列的列标题
round
对未进行格式化的数值变量进行四舍五入,统一格式化为带两位小数的十进制数值
rows=page
规定页面格式,目前’page’是此选项唯一可用的值,表示在每一页中只显示一条记录的一行变量值,即一行中显示尽可能多的记录数
width=列宽度
指定列的宽度,可取的值有’full’,’minimum’,’uniform’,’uniformby’等,
heading=方向
取值可为v(vertical)或h(horizontal),表示列标题显示的方向(横向或纵向)
label
指定以变量标识作为相应的列标题,否则以变量名作为列标题
split=字符
首先此选项指定以变量标识作为列标题,以指定的字符作为列标题换行的标志
style=类型元素
指定报告中特定位置所要应用的类型元素(涉及很多内容,详细内容略)
by语句在所有过程中的用法都相同,即将数据集分割为若干小数据集分别进行处理。pageby语句用来控制换页时变量的显示方式,对于其后所指定的变量,相同的值不会显示在不同的页中,该变量某一值的记录在一页的剩余部分显示不下时,则从该值的第一条记录开始换行显示。sumby语句的作用和pageby语句相似,只不过是将换页的动作换为求和,对指定变量的每一值计算var变量的总计值。id语句的作用是用指定的变量值代替记录编号对每一条记录进行标识。sum语句用于指定报告中要进行求和操作的变量,var语句用于指定要在报告中显示的变量。
以上过程作用较为普遍,使用频率较高,有必要预先了解,以便于后面所讨论内容的顺利进行。
为节省篇幅,这里不进行实例演示。内容过于枯燥,可能的错误也难免,还请各位多多包涵。
SAS程序操作的大概情况就草草的这样介绍一下吧,说得太多的话我怕各位没有耐心看下去。更多的内容我想还是留在实际的例子中来介绍,这样大家可以好好的切身体会一下,然后就会印象深刻,实际运用起来也就得心应手了。
‘伍’ 浅谈对SAS系统和数据处理的认识,并用SAS做一个回归分析实例
这里就如何提防股票在网上被盗的几点建议,希望对您有所帮助。
(1)精心保管好“三证”(身份证、股东卡、资金卡)和资金存取单据以防不慎被人利用;经常查询股票和资金余额,发现问题及时处理。
(2)注意交易密码和资金账户密码的保密,切忌在公共场合读念个人资料,或将密码写在纸上,也不要当着他人的面输入密码,委托他人交易之后,密码要及时修改,使用电话和自助委托系统时要注意在委托完成之后,将前面输入的密码和数据要消除。
(3)密码设置到最高位。一般营业部的交易密码是6位,建议投资者在设置密码时,不要为了使用方便仅设置4位或者5位密码,因为密码设置的位数越高被破译难度越大。另外尽量不要使用吉祥数字、自己的生日号、电话号码或顺号(如:123456)同一数字(如:666666、888888)等易记的数字作为密码,因为这很容易被人猜测到自己的交易密码,应在自己密码中输入2—3个英文字母。
(4)因为平时交易密码使用频率较高,建议在1—2个月,要更改一次密码。
(5)对于在网上交易的客户,最好不要到网吧等环境复杂的场所上网交易 。另外如果是公用电脑,切记在第一次输入密码后,在提示框中切记不要选择保存密码,因为,当你选择保存时,机器就会自动生成一个后缀为PWL的文件,只要别人一打开这个文件,你的密码也就暴露无遗了。
(6)及时退出交易系统;交易者在使用完交易系统后,一定要注意及时退出交易系统。有的投资者由于不是在同一时间买卖股票,为图方便,因此习惯于按最小化按钮,缩小交易系统在时间栏或任务栏上,此时交易中心和交易软件并没有断开连接,用户如果在离开电脑的时候,忘记退出软件,任何人都可能操作账户,尤其是在一些公共场所,会造成盗买和盗卖股票的现象,威协你股票和资金的安全,造成不必要的损失。
(7)设定的股票交易密码最好同邮箱、OICQ、拨号上网的密码不同。以防为黑客轻易破译密码
(8)为保证交易密码和股票个人资料不泄露,在系统上安装防黑防毒的杀毒软件,并定期升级,也是一个好的举措。
身份证、股东卡、交易磁卡等证件最好不要放在一起,如果你遗失了相关的证件,要及时到开户的证券营业部办理挂失手续,以防你的股票被盗买和盗卖。.........
mysql中没有sa用户,有root用户,sa用户是sqlserver中才有的。 root的密码默认为空,但可在安装后重新设置密码。设置方式如下:
1、如果在安装过程中没有设置用户名密码的话,可以用root用户名与密码登录数据库。
‘柒’ 数据库SA密码是什么
密码是人为设上的 默认是没有密码的 你可以以Windows的模式登陆 更换密码即可 sp_password
‘捌’ 国内使用SAS需要从哪些数据库里提取外部数据
如 libname sps spss 'f:\.....';
如 libname hsdb db2 user-xxxx password="xxxx" datasrc=xxxx;
如 libname liu teradata user=xxxx password=xxxx database=xxxx .....;
如 libname liu oracle user=system password=15545454;
‘玖’ 安装sas9.3时要求设置一个 外部密码,不管我输什么都提示外部密码无效
外部密码是你电脑的administrator的密码
‘拾’ 为什么要输入数据库密码SA是什么啊
开始菜单--查询分析器--选Windows验证登录--写入EXEC sp_password NULL, '新密码', 'Sa'
答案补充
重下个吧,下个人版的
答案补充
Microsoft SQL Server2000 简体中文版 4合1