
epidata使用方法解析.ppt
110页2019/7/5,epidata 软件使用,1,数据录入和数据管理软件,EpiData,2019/7/5,2,epidata 软件使用,1.软件使用简介,简介(Introduction) EpiData是一个免费的数据录入和数据管理软件由美国CDC(疾病控制中心)和WHO(世界卫生组织)联合发布的,是一款免费软件 主要用于数据录入、核对、管理和数据报告该软件的功能是建立数字化的调查表格,使收集的资料信息录入计算机更加方便该软件不但可以在数据录入过程中对数据中的错误进行核对,而且可以在数据录入完成后对数据进行核对,如双录入的数据核查2019/7/5,3,epidata 软件使用,,EpiData的安装、运行不会依赖系统文件夹中的任何文件,可以通过setup.exe在计算机中安装这个程序;也可以直接拷贝EpiData.exe文件到计算机中,同样可以运行 该程序的最大特点是对录入的记录数没有限制但在实际应用中,记录数一般不要超过200,000~300,000整个录入界面不能超过999行对数值或字符串编码进行解释的文字长度最多80个字符,编码长度最多为30个字符使用Pascal语言进行程序设计,EpiData与早期的与Epi Info兼容,,2019/7/5,4,epidata 软件使用,2 数据库创建过程,在使用EpiData软件之前,先对该软件中用到的三种基本的文件类型进行简单介绍: ①.QES文件:调查表文件即数据库结构文件,决定数据库结构。
②.REC文件:数据库文件,主要用于存放数据 ③.CHK文件:核对文件,存放控制数据录入的核对规则,起质量控制作用 EpiData由数据库结构文件(.qes),来决定数据库结构,然后根据该数据库结构文件生成数据文件(.rec)2019/7/5,5,epidata 软件使用,一个最简单的创建数据库的工作至少要包括以下两步: 1、建立调查表文件——根据调查表制作数据库结构文件即调查表文件(.qes) 2、生成数据库文件——根据调查表文件生成数据库文件(.rec) 理论上说,有了数据库文件就可以进行数据录入了,但是在实际工作中,往往需要对数据录入进行质量控制,比如对某些字段设置合法值、跳转等等这些质量控制工作需要专门的核对文件来完成(.chk) 因此,在数据库创建过程一般还包括: 3、编写核对程序——即生成数据核对文件(.chk). 在EpiData软件中,在其主界面的上形象的标示出了数据库创建过程:,2019/7/5,6,epidata 软件使用,2.1建立数据库结构文件(Create Questionnaire File),表 1 工资调查表 A1 编号 A2 姓名 A3 性别(1)男 (2)女 A4 出生日期年 月 日 B1 基本工资 B2 奖金,2019/7/5,7,epidata 软件使用,2.1.1定义变量名,建立调查表文件是建立数据库、实现数据录入和管理的第一步。
调查表结构文件在编辑器窗口建立,2019/7/5,8,epidata 软件使用,编辑器窗口的使用,1、打开EPDATA 软件,可以单击菜单中的“文件→生成调查表文件”, 在工作流程栏(Work Process Toolbar)上点击“建立新的QES文件”, 单击工具栏上的“新记录”按钮 这时窗口中会自动显示一个空白的文档,你可以在这里输入调查表,也可以把WORD中建立的调查表复制/粘贴过来再进行编辑调查表实际上就是数据录入表格的框架 编辑完成后,将此调查表文件保存,文件的扩展名统一为.QES2019/7/5,9,epidata 软件使用,,2、编辑器(Editor)主要功能是创建和编辑调查表(.QES文件)这个调查表定义了数据库结构编辑器的使用和其它字处理软件基本一致,由菜单栏,工作流程栏、工具栏和文本编辑区组成也可以使用编辑器处理程序输出的报表,以及编辑CHECK文件2019/7/5,10,epidata 软件使用,2.1.2 定义变量名(Field Names),输入的信息要保存在变量中因此需要定义变量名一个数据库中录入变量的名称可以根据QES文件的内容自动创建 EpiData中命名变量的方式有两种: 1)将第一个单词作为变量名(First word in question is field name) 2)根据规则自动定义变量名(Automatic field names) 执行“文件→选项”命令打开“生成REC文件”(File→Options→Create data file)选项卡。
(1)QES文件字体设置:变量名称的字体及其大小可以在QES文件显示(Show data form)中设置. 2019/7/5,11,epidata 软件使用,(2)REC文件字体设置:更改REC文件变量名称的字体及其大小 (3)首字符为汉字变量命名方法:系统不支持中文作为变量名,在如何生成字段名(How to generate field names)标签中选择定义变量名的方法在选择“将第一个单词作为变量名”时,如第一列为汉字(如去除调查表中的A1,A2,A3等变量名),则系统自动生成变量名如Field1,field2和field3,同时REC表中中文文字也不再显示因此,建议事先以字母形式定义变量名 变量名的英文字母是大写(Upper-case)还是小写(Lower-case)或维持输入时的大小写状态(Leave as is)也可以在此修改2019/7/5,12,epidata 软件使用,(4)首字符为字母的变量命名,系统默认为将自动将变量编码左侧解释性文字中的第一个单词认作是变量名(First Word in Question is Field Name)如果第一个单词的长度超过10个字符,程序只保留该单词的前10个字符作为变量名。
例如: 1)如果输入:A1 Enter number #### 程序会创建一个变量名为“A1”的4位整数变量 2)如果输入:Enter number #### 程序会创建一个变量名为“Enter”的4位整数变量此时也可选择自动定义变量名(Automatic field names)的方式 3)A1 编号 #### 则变量名为A1 ,注意A1与编号间要由一空格2019/7/5,13,epidata 软件使用,4)当一个变量名已经使用过,再次出现时,程序会自动添加一个数字,以保证变量名的唯一性如有三个A1变量,则自动以A1,A2,A3命名,并以此类推,建议变量起名时具有唯一性,以免混淆选择生成REC文件中的“更新问题为实际文件名”(Update question to actual field name),这样,即使创建调查表文件时有重复的变量名,在创建的数据库中,程序会自动将其更新为其实际的变量名2019/7/5,14,epidata 软件使用,,4)在英文版本中如果同时出现中文和英文,程序会自动选择第一个出现的英文单词作为变量名2019/7/5,15,epidata 软件使用,(5)选中“使用{}内的内容自动添加字段名(Automatic Field Names)根据变量编码前的解释性文字,自动生成变量名。
变量名第一个字符一定为字母(A-Z),之后可以包含字母(A-Z)和数字(0-9),最多10个字符程序会遵循以下几个原则: 如希望定义的变量名不是第一个,则可将需要定义的变量名用大于号{}括起,如 Enter {Number} 则变量名为Number ,系统优先使用大括号中的文字作为变量名如为 E{n}ter {age} ,则自动定义的变量名为nage因此为了定义确切的变量名,尽量使用大括号来定义有意义的变量名 .一些常用词会被忽略(即,类似“what”、“the”、“of”、“and”等的词)例如,“What are you doing?”,程序采用的变量名称将会是youdoing2019/7/5,16,epidata 软件使用,,(6)如果变量编码前没有任何解释性的文字,那么程序会延续上一个变量的名字,同时在末尾加上一个数字例如,前一个变量的名称为A1,如果没有任何解释性文字的下一个变量A2如果前面没有变量,则默认的变量名为FIELD12019/7/5,17,epidata 软件使用,,(7)如果问题(提示符)以数字开头,程序会自动在数字前插入字母N例如,“1、姓名”的变量名会是“N1,2019/7/5,18,epidata 软件使用,2.1.3定义变量标签,变量标签(Variable Labels)变量标签是对一个变量所含数据内容的描述。
在EpiData中,程序会根据QES文件中,变量编码左侧的解释性文字自动生成变量标签如果选择了“文件→选项”中的“将第一个词作为变量名”(First word in question is field name),则扣除作为变量名的第一个单词后,自左向右的文字会被作为变量标签例如:“A1 Age of patient###”,变量名为“A1”,变量标签为“Age of patient”中文问题(提示符)虽然不能不能作为变量名,但是可以自动的作为变量标签如果选择了“自动添加字段名”(Automatic field names),则变量名为“A1ageofp”,变量标签为“A1 Age of patient”2019/7/5,19,epidata 软件使用,2.1.4定义变量类型,执行“编辑→字段编辑器”命令(Edit→Field Pick List), 或者按Ctrl+Q键, 或者在编辑器工具栏(Editor Toolbar)单击字段编辑器按钮,可以打开变量类型选择对话框,从中选择适当的变量类型单击“插入”按钮即可2019/7/5,20,epidata 软件使用,1.自动编码字段,自动ID号变量(IDNUM)是一个数值型变量,其值由计算机自动生成。
其赋值原则是随着每一条记录的输入,变量值加1在数据录入过程中它的值不能修改,只能自动增加该变量的初始值默认为1,但是用户可以在“文件”菜单的“选项”中的“高级设置”中进行设置(File→Options→Advanced→ID number fields→First IDnumber in new data file:1)此变量长度为5-18个字符2019/7/5,21,epidata 软件使用,2 数值型字段(Numeric Fields),数值型变量######.##中只能用来接受从0到9的数字,数值可以是整数也可以是小数一个#号代表一位数,用户可以根据需要定义所需的数值位数,但包括小数点在内最大为14位在数据录入过程中和.QES文件中你可以用圆点(.)或逗号(,)来表示小数点一个变量中只允许输入一个小数点,这意味着,你不能用逗号作为千位的分隔符(例如:1,000,000)字符“#”的数目表示变量的长度,小数点占一位字符2019/7/5,22,epidata 软件使用,3文本(字符)型字段(Text Fields),下划线____________定义字符型变量的位数字符型变量内可以输入任何字符。
该类型变量的最大长度为80个字符下划线字符的数目表示变量的长度字符型变量允许输入所有字符变量最长允许80个字符如果输入中文,请注意,一个中文字需占用2个字符大写字母的字符型变量(Upper-case Text)大写字母的字符型变量中可以录入任意字符,但程序会自动将录入的字母转换为大写变量的长度即“”间的字符数,其中包括大写字母“A”所占的1个字符上面例子中,第一个变量的长度为1,第二个变量的长度为52019/7/5,23,epidata 软件使用,4大写型字符字段(Upper-case Text),大写字母的字符型变量中可以录入任意字符,但程序会自动将录入的字母转换为大写变量的长度即“”间的字符数,其中包括大写字母“A。












