SPSS自带病例数据文件的介绍和说明
SPSS初学者带来的案例数据文件介绍和讲解对案例数据文件的需求很大。事实上,在安装SPSS软件包的过程中,这些文件已经自动放置在你的电脑硬盘上了。那么怎么找呢?我前面提到过“SPSS的案例数据在哪里下载”。有需要的同学可以自行查找或者下载。今天我就分享一下SPSS的案例数据文件的描述。详情见下文:
事故. sav
假设的数据文件涉及一家保险公司,该公司正在研究给定地区汽车事故的年龄和性别风险因素。每个案例对应一个年龄类别和性别类别的交叉分类。
adl.sav
这个假设的数据文件涉及到为中风患者确定推荐的治疗类型的优势。医生将女性中风患者随机分为两组。第一组接受标准的物理治疗,而第二组接受额外的情绪治疗。在三个月的治疗期间,每个患者执行一般日常生活行为的能力将作为原始变量进行评分。
advert.sav
这个假设的数据文件涉及零售商在检查广告支出和销售业绩之间的关系时采取的行动。为此,他们收集了过去的销售数字和相关的广告费用。
黄曲霉毒素. sav
这个假设的数据文件涉及谷物中黄曲霉毒素的检测,黄曲霉毒素的浓度会因谷物产量不同(不同谷物之间,同种谷物之间)而有很大差异。谷物加工厂从八种谷物产量中的每一种获得了16个样品,并测量了黄曲霉毒素的水平,单位为十亿分之一(PPB)。
厌食的
在研究厌食/暴食行为的标准症状参考时,研究者1调查了55名已知有进食障碍的青少年。每位患者每年将接受四次检查,因此观察总数为220。在每个观察期内,这些患者会按照16症状逐项评分。而第765438号和第76号患者的症状评分在时间点2缺失,第47号患者的症状评分在时间点3缺失,因此有效观察数为217。
bankloan.sav
这个假设的数据文件涉及一家银行降低贷款违约率的措施。该文件包含850名过去和潜在客户的财务和人口统计信息。前700个案例是之前获得贷款的客户。剩下的150例是潜在客户,银行需要根据信用风险的高低进行分类。
bankloan_binning.sav
这个假设的数据文件包含5,000名过去客户的财务和人口统计信息。
behavior.sav
在一个经典的例子中,252名学生被要求在10分的范围内评估15种情况和15种行为的组合,范围从0 =“非常得体”到9 =“非常不合适”。平均值在个人价值之上,价值观视为不同。
behavior_ini.sav
此数据文件包含behavior.sav二维解决方案的初始配置
brakes.sav
这个假设的数据文件与生产高性能汽车盘式制动器的工厂的质量控制有关。该数据文件包含八个专用机床中每一个的16盘式制动器的直径测量值。盘式制动器的目标直径为322毫米。
早餐. sav
在一项经典研究中,321名沃顿商学院MBA学生及其配偶被要求按照偏好顺序对15种早餐食品进行评分,从1 =他们的偏好根据六种不同情况进行记录,从“都喜欢”到“只有饮料的快餐”。
早餐-总体而言。节省
数据文件只包含早餐食物偏好的第一种情况,即“全部喜欢”。
宽带_1.sav
这个假设的数据文件包含每个地区订购了国家宽带服务的客户数量。该数据文件包含4年期间85个地区每月的用户数量。
宽带_2.sav
这个数据文件与broadband_1.sav相同,但是包含另外三个月的数据。
汽车_保险_理赔. sav
已经在别处提出并分析的关于汽车损害赔偿的四个数据集。平均索赔额可以建模为具有伽玛分布,因变量的平均值通过使用逆相关函数与被保险人的年龄、车辆类型和车龄的线性组合相关。索赔的数量可以作为衡量的砝码。
car_sales.sav
该数据文件包含各种品牌和型号车辆的假设销售估计、定价和物理规格。价格和物理规格可以从edmunds.com和制造商处获得。
car _ sales _ up prepared . sav
这是car_sales.sav的修改版本,不包含该字段的任何转换版本。
地毯. sav
在一个常见的例子5中,一家公司非常重视一种新地毯清洁产品的营销,希望测试以下五个因素对消费者偏好的影响:包装设计、品牌名称、价格、优秀的家居用品标志和退货保证。包装设计有三个因素层次,每个因素层次因刷体位置不同而不同;有三个品牌名称(K2R、荣耀、比塞尔);有三种价格水平;最后两个因素各有两个层次(是或否)。十位消费者对这些因素定义的22个特征进行了排名。该变量优选地包含每个简档的平均水平的等级。低等级对应高偏好。此变量反映了对每个配置文件偏好的总体衡量。
carpet_prefs.sav
该数据文件基于carpet.sav中描述的相同示例,但它也包含从10个消费者中收集的实际排名顺序。消费者被要求从最喜欢到最不喜欢排列22个产品简介。Carpet_plan.sav定义变量PREF1到PREF22包含相关特征的标识符。
目录. sav
这个数据文件包含一家编目公司销售的三种产品的假设月销售数据。它还包括五个可能的预测变量的数据。
catalog_seasfac.sav
这个数据文件与catalog.sav相同,只是添加了一组在“季节分解”过程中计算的季节因子和附加的日期变量。
蜂窝电话. sav
这个假设的数据文件与一家移动电话公司减少客户流失的措施有关。客户流失分数应用于帐户,分数范围从0到100。得分为50或更高的帐户可能会更换提供商。
陶瓷. sav
这个假设的数据文件涉及制造商在确定新的高质量合金是否比标准合金具有更高的耐热性时所采取的行动。每种情况代表一种合金的单独测试;合金的耐热极限将记录在外壳中。
麦片. sav
假设的数据文件涉及一项对880人进行的关于早餐偏好的民意调查,该调查记录了参与者的年龄、性别、婚姻状况和积极的生活方式(根据他们是否每周至少锻炼两次)。每个案例代表一个单独的响应者。
clothing_defects.sav
这是一个关于服装厂质量控制过程的假设数据文件。检验员要对工厂每次大批量生产的服装进行抽样检测,并统计不合格服装的数量。
咖啡. sav
这是一个关于六种冰咖啡的认知品牌形象6的数据文件。对于冰咖啡的23个特征属性中的每一个,人们都会选择该属性所描述的所有品牌。为了保密,六个品牌分别用AA、BB、CC、DD、EE、FF来代表。
联系人. sav
假设的数据文件包括一组公司计算机销售代表的联系信息列表。根据这些销售代表所属的公司部门及其所在公司的级别对每种联系方式进行分类。同时还记录了最新的销量,距离上次销售的时间,以及联系的公司规模。
creditpromo.sav
这个假设的数据文件涉及一家百货商店为评估最新信用卡促销的效果而采取的措施。为此,随机抽取了500名持卡人。其中一半人收到了宣传未来三个月降低消费者利率的广告。另一半人收到标准的季节性广告。
客户数据库
这个假设的数据文件涉及一家公司使用数据仓库中的信息向最有可能响应的客户提供优惠产品的行为。随机选择客户群的一个子集,为他们提供特别优惠,同时记录他们的反应。
客户信息. sav
这个假设的数据文件包含客户邮件信息,如姓名和地址。
客户_子集. sav
customer_dbase.sav中80个案例的子集
辩论. sav
假设数据文件包括对政治辩论参与者在辩论前后进行的调查的配对答案。每个案例对应一个单独的响应者。
辩论_聚合. sav
这个假设的数据文件总结了辩论. sav中的答案。每个案例对应于辩论前后偏好的交叉分类。
演示. sav
这是一个关于购物客户数据库的假设数据文件,用于发送每月的商品。会记录顾客对商品的反应以及各种人口统计信息。
demo_cs_1.sav
这个假设的数据文件涉及公司在编制调查信息数据库时的第一步。每个案例对应一个不同的城市,并记录区域、省、区和城市标识。
演示_cs_2.sav
这个假设的数据文件涉及公司在编译调查信息数据库的第二步。每个案例对应于第一步中选择的城市的不同家庭单元,并记录区域、省、区、市、街道和单元标识。它还包括前两个设计阶段的抽样信息。
demo_cs.sav
假设数据文件包含用复杂抽样设计收集的调查信息。每个病例对应一个不同的家庭单元,记录各种人口统计和抽样信息。
dmdata.sav
假设的数据文件包含直销公司的人口统计和购买信息。Dmdata2.sav包含收到试用邮件的联系人子集的信息,dmdata3.sav包含未收到试用邮件的其余联系人的信息。
dietstudy.sav
这个假设的数据文件包含了“斯蒂尔曼饮食法”7的研究结果。每个病例对应一个单独的受试者,记录其实施饮食计划前后的体重(磅)和甘油三酯水平(mg /100 ml)。
dvdplayer.sav
这是一个关于开发新的DVD播放器的假设数据文件。营销团队使用原型收集焦点小组数据。每个案例对应一个被调查的用户,记录他们的人口统计信息和他们对原型问题的回答。
德语_credit.sav
数据文件取自加州大学欧文分校的机器学习数据库8的存储库中的“德国信用”数据集。
杂货店_1month.sav
假设的数据文件基于数据文件“杂货_优惠券. sav ”,并添加了每周购物“累积”,因此每个案例对应一个单独的客户。所以每周变化的一些变量消失了,现在记录的消费金额是四周学习期间消费金额的总和。
杂货店_优惠券. sav
假设的数据文件包含由重视顾客购物习惯的杂货连锁店收集的调查数据。调查身边的每一个顾客,每一个案例对应一个单独的顾客周,记录下购物的地点和方式等信息(包括顾客在那一周在杂货上花费的金额)。
guttman.sav
贝尔9创建了一个表格来说明可能的社会群体。Guttman 10引用了表格的一部分,其中包括五个变量。它用来描述以下七种理论上的社会群体:观众(如足球赛上的人)、观众(如剧院里或参加课堂讲座的人)、公众(如报纸或电视观众)、组织群体(类似于观众但关系密切)、初级群体(关系密切)、次级群体(自发组织)和现代社区。
health_funding.sav
该假设数据文件包含有关医疗保健基金(每100人的金额)、发病率(每10000人的比率)和医疗保健提供者就诊率(每10000人的比率)的数据。每个案例代表一个不同的城市。
hivassay.sav
这个假设的数据文件涉及一个药物实验室在开发一个检测HIV感染的快速分析中的主动性。检测结果是8个暗红色阴影,如果有更深的阴影,说明感染的可能性很大。2000份血样用于实验室检测,其中一半感染了艾滋病病毒,另一半没有感染。
hourlywagedata.sav
假设的数据文件涉及在政府机构和医院工作的具有不同经验水平的护士的小时工资。
insurance_claims.sav
假设的数据文件涉及一家保险公司,该公司希望建立一个模型来标记可疑和潜在的欺骗性索赔。每个案例代表一项单独的索赔。
insure.sav
假设数据文件涉及一家保险公司,该公司正在研究表明客户是否会根据10年的人寿保险合同索赔的风险因素。数据文件中的每个案例都代表一份根据年龄和性别匹配的合同,其中一份记录了索赔,另一份没有。
judges.sav
假设的数据文件涉及由训练有素的裁判(加上一名体操运动员)对300次体操表演给出的分数。每一行代表一个性能;评委们观看了同样的表演。
亲属关系_dat.sav
罗森博格和金11开始分析15亲属关系项(姑姑、兄弟、堂兄弟、女儿、父亲、孙女、祖父、祖母、孙子、母亲、侄子或外甥、侄女或外甥女、姐妹、儿子和叔叔)。他们要求四组大学生(两组女学生和两组男学生)根据相似性对项目进行排序。他们让两组学生(一组女学生和一组男学生)进行两次排序,第二次排序与第一次排序不同。这样,一个* * *就得到六组“源”。每个源对应一个15 x 15的近似矩阵,其单元格中的值等于源中的人数减去这个源中的对象被划分的次数。
亲属关系_ini.sav
该数据文件包含亲属关系_dat.sav的三维解的初始配置
亲属关系_var.sav
数据文件包含独立变量性别、世代和(分离的)程度,它们可用于解释亲属关系_dat.sav的解的维数。具体地,它们可用于将解空间限制为这些变量的线性组合。
市场价值. sav
该数据文件涵盖了伊利诺伊州阿尔冈昆新住宅开发项目的房屋销售情况。在1999–2000期间。这些销售只来自公共记录。
nhis2000_subset.sav
美国健康访谈调查(NHIS)是一项针对所有美国公民的大规模人口调查。调查对美国具有全国代表性的家庭样本进行了面对面访谈,获得了每个家庭成员健康行为和健康状况的人口学信息和观察数据。该数据文件包含2000年调查的信息子集。国家健康统计中心。2000年美国健康访问调查。公共数据文件和文档。FTP://FTP . CDC . gov/pub/Health _ Statistics/NCHS/Datasets/NHIS/2000/.出版于2003年。
臭氧. sav
这些数据包含六个气象变量的330个观测值,用于根据其余变量预测臭氧浓度。在之前的研究者中,12和13发现了这些变量之间的非线性,这阻碍了标准的回归方法。
疼痛_药物. sav
这个假设的数据文件包含用于治疗慢性关节炎疼痛的抗炎药物的临床试验结果。我们感兴趣的是药物起效的时间以及与现有药物的比较。
patient_los.sav
这个假设的数据文件包含医院诊断的疑似心肌梗塞(MI或“心脏病发作”)患者的治疗记录。每个病例对应一个病人,并记录一些与他的住院期间有关的变量。
patlos_sample.sav
这个假设的数据文件包含在心肌梗塞(即MI或“心脏病”)治疗期间接受溶栓剂的患者的样本治疗记录。每个病例对应一个病人,并记录一些与他的住院期间有关的变量。
poll_cs.sav
这个假设的数据文件涉及民意测验机构在正式立法前决定公众对法案支持程度的行动。这种情况对应于登记选民。每个案例记录了选民居住的县、镇和区。
poll_cs_sample.sav
这个假设的数据文件包含poll_cs.sav中列出的投票人样本。样本是根据poll.csplan中指定的设计选择的,数据文件记录包含概率和样本权重。请注意,由于抽样计划使用与规模成比例(PPS)的方法,因此还有一个包含联合选择概率的文件(poll_jointprob.sav)。样本选定后,将收集与选民的人口统计信息及其对提交法案的意见相对应的额外变量,并将其添加到数据文件中。
property _ assesse . sav
这个假设的数据文件涉及一个县的资产评估师采取的措施,以有限的资源不断更新资产价值评估。该案例对应的是该县在过去一年中出售的资产。数据文件中的每个案例都记录了资产所在的城镇、上次评估资产的评估人、自评估以来的时间、当前评估和资产的销售价格。
property _ assesse _ cs . sav
这个假设的数据文件涉及某个资产评估师在某个状态下,以有限的资源不断更新资产价值评估所采取的措施。这个案子对应的是国家的资产。数据文件中的每个案例都记录了资产所在的县、镇和区,自上次评估以来的时间以及当时的估价。
属性_评估_ cs _样本. sav
此假设数据文件包含property _ assessment _ cs.sav中列出的资产样本。样本是根据property _ assessment中指定的设计选择的。csplan,数据文件记录包含概率和样本重量。选择样本后,额外的变量电流值将被收集并添加到数据文件中。
累犯. sav
这个假设的数据文件涉及政府执法机构在了解其管辖范围内的累犯率方面的举措。每个案件对应一个前科犯,其人口统计信息和第一次犯罪的细节都有记录;如果你在第一次被捕后的两年内第二次被捕,两次被捕之间的时间也将被记录。
累犯_cs_sample.sav
这个假设的数据文件涉及政府执法机构在了解其管辖范围内的累犯率方面的举措。每个案件对应于2003年6月第一次被逮捕和释放的一名前罪犯,并记录了他的人口统计信息、第一次犯罪的细节和第二次被捕的数据(如果发生在2006年6月底之前)。根据累犯_cs.csplan中规定的抽样方案,从抽样部门中选择罪犯;该计划使用与大小成比例(PPS)的方法,因此也有一个文件(recidivism _ cs _ jointprobe.sav)包含联合选择概率。
rfm_transactions.sav
这个假设的数据文件包含购买交易数据,即每笔交易的购买日期、购买的商品和消费金额。
salesperformance.sav
这是一个关于评估两个新销售培训课程的假设数据文件。60名员工分为3组,均接受标准培训。此外,第二组接受技术培训;第三组接受了实践指导。在培训课程结束时,每个员工都要接受测试,并记录他们的分数。数据文件中的每个案例代表一个学员,并记录他被分配到的组和测试的分数。
satisf.sav
这个假设的数据文件涉及一家零售公司在四个商店进行的满意度调查。共有582名客户接受了调查,每个案例代表一个客户的回答。
螺丝. sav
此数据文件包含有关螺钉、螺栓、螺母和图钉14特征的信息。
洗发水_ph.sav
这是一个关于一家美发产品工厂质量控制的假设数据文件。在规定的时间间隔内测试六批独立产品,并记录其pH值。目标范围是4.5–5.5。
ships.sav
& lt