尽管对科学、技术、工程和数学(STEM)专业人才的需求不断增加,但在美国,只有一小部分年轻人在STEM领域攻读高等教育学位。为了确定STEM参与的主要预测因素,本研究使用机器学习方法,分类和回归树(CART),分析了从2009年秋季美国高中新生的全国调查数据中获得的广泛的个人,家庭和学校因素,这些新生最终在2016年之前注册了STEM大学专业。分析结果表明,微积分学分、科学认同、STEM总学分和数学成绩是高中阶段大学STEM专业选择的最具预测性的因素。基于cart的树还显示了这四个变量如何相互作用地预测学生进入STEM大学专业的可能性。
增加学习者选择STEM职业的机会是国家优先事项(美国国家科学基金会,2020年)。鉴于大多数STEM工作者(72.3%)拥有STEM大学学位(美国人口普查局,2019年),调查影响高中生选择STEM大学专业的因素可以帮助解决这一优先事项。之前的研究已经确定了可能与STEM大学专业选择相关的各种大学前因素。学生的人口和家庭背景是主要因素。具体而言,女学生、种族和少数民族以及经济困难的学生往往对从事STEM职业的兴趣较低(Riegle-Crumb & Morton, 2017;Saw et al., 2018)。父母的职业和参与也会影响学生的STEM学习和职业发展(Howard et al., 2019;Moakler & Kim, 2014)。其他因素包括学生在STEM中的表现和动机(Eccles, 1983, 2009;Lent et al., 1994;Saw & Chang, 2018;Wang, 2013),以及他们在高中的学习经历和环境因素,如学校位置(Saw & Agger, 2021)、教师质量(Althauser, 2015;Lee et al., 2015;Park等人,2019),课外机会(Kitchen等人,2018;Franco & Patel, 2017;Means等人,2016),以及STEM课程选修(Gottfried & Bozick, 2016)。
尽管之前的研究已经共同确定了可能影响STEM大学专业选择的广泛因素,但由于研究范围的限制,每项研究只涵盖了有限的方面。一些研究表明,未来的研究应该包括更多潜在的外生变量,如科学相关的动机因素,而不仅仅是数学相关的期望值结构,以调查这些因素与追求STEM职业道路之间的联系(Gottfried & Bozick, 2016;王,2013;Wille et al., 2020)。在实践中,所有这些确定的因素在整个STEM职业发展过程中同时起作用。因此,重要的是不仅要调查哪些因素可以预测STEM大学专业的选择,而且要确定一些因素在预测大学专业选择方面如何发挥相对更重要的作用。
为了填补这一文献空白,本研究纳入了HSLS: 09-16研究收集的更广泛的预测因子。对于学生的人口统计数据,我们纳入了社会经济地位(SES)、性别和种族/民族等预测因素,因为之前的研究表明,女学生、种族和少数民族以及低收入学生不太可能从事STEM职业(Riegle-Crumb & Morton, 2017;Saw et al., 2018)。对于学生的家庭背景和父母的参与,我们选择了预测因素,如父母的职业和他们对数学和科学作业的支持,以及在校和校外的STEM活动。这些父母因素可以为学生提供更多的接触和机会,从而使他们在STEM领域的学习和职业发展受益(Howard等人,2019;Moakler & Kim, 2014)。基于期望值理论、社会认知职业理论和前人研究(Eccles, 1983, 2009;Lent et al., 1994;Saw & Chang, 2018;王,2013)。
对于教师质量,我们纳入了对学生STEM学习成绩至关重要的未观察到的因素,如数学和科学教师对专业学习社区的看法、自我效能感、期望、集体责任和校长支持(Althauser, 2015;Lee et al., 2015;Park et al., 2019)。对于学校位置,考虑到中学后STEM参与的地理差异,我们选择城市化和地理区域作为预测因子(Saw & Agger, 2021)。对于课外机会,我们纳入了一些变量,如学校是否提供STEM相关课程(例如,支持STEM中代表性不足的学生,并告知家长有关STEM的大学专业和职业),这可能有利于追求STEM职业的学生(Kitchen等人,2018;Franco & Patel, 2017;Means et al., 2016)。由于高中STEM课程的完成程度与大学专业选择呈正相关(Gottfried & Bozick, 2016),我们将STEM课程列表作为预测因素。
之前没有研究包括如此大量的相关变量来探索可以预测高中生选择STEM大学专业的因素。CART算法是一个强大的工具,可以识别最具预测能力的因素,同时揭示所选因素如何交互预测STEM大学的专业选择。由于变量数量较少以及传统的分析方法(例如Lee(2015)研究中的逻辑回归,Bottia及其同事(2017)研究中的多水平逻辑回归,以及Wang(2013)使用结构方程建模的研究),因此从未在先前的研究中应用过这一方法。通过研究广泛的潜在预测因素并应用这一先进技术,本研究可以为教育工作者和政策制定者提供新的视角和见解,以了解哪些因素在预测高中学生选择STEM大学专业时相对更重要。
HSLS: 09-16的合格样本由11,560名美国高中生组成,他们参加了2009年基准年、2012年第一次随访调查、2013-2014年更新和高中成绩单收集,然后在2016年的随访调查中报告了他们的大学专业。其中约23%的学生主修STEM专业。在先前研究的指导下,我们选择了102个变量,包括个人、家庭和学校因素。这些变量同时用于预测学生的大学专业是STEM还是非STEM。本研究的变量列表见附录。
我们采用CART算法,使用R包rpart (Therneau & Atkinson, 1997)实现,通过识别一组因素并解释这些因素如何预测学生关于注册STEM专业的决策,来捕捉学生关于注册STEM专业的决策的复杂机制。选择该算法是因为其理想的特性:(a)它不需要强模型假设,而传统回归模型通常需要强模型假设;(b)自动识别重要预测因子及其与结果的线性/非线性关系(Lee et al., 2010);Steinberg & Colla, 2009年a, b;研究发现,2004);(c)无需额外的输入程序即可处理缺失数据(Deconinck et al., 2005);Feelders, 1999;Verbyla, 1987);(d)与其他“黑箱”数据挖掘技术相比,它是一种易于解释的算法。
首先,构建基于cart的树,即基尼指数(Breiman et al., 1984;采用Steinberg & Colla, 2009a, b)自动选择重要的自变量。树的最大深度被设置为30。在剪枝过程中选择成本复杂度(Breiman et al., 1984),复杂度参数为0.1。代理分割(Feelders, 1999)用于处理独立变量的缺失数据。通过这些设置,该算法生成了一棵修剪过的树,以预测给定学生根据所选择的预测因子宣布STEM大学专业的概率。
其次,为了避免模型过拟合问题并能够评估预测准确性,使用80/20规则将样本分为训练和测试数据集(Anis et al., 2015;郑,2004)。具体而言,我们采用不替换的随机抽样方法,选择80%的样本(=9248)作为开发基于cart的树的训练数据。剩余的20%的样本(=2312),没有暴露在树的发育过程中,作为测试数据来评估树的预测准确性。也就是说,我们利用训练数据集建立了用于预测结果的统计模型,并利用测试数据通过所建立的模型对预测结果进行验证。对预测精度的度量进行了检验。采用随机森林分析进行敏感性分析,评价CART结果的一致性。CART算法还采用了HSLS: 09-16提供的学生纵向分析权值。因此,结果被加权以代表2009年秋季的美国九年级学生。
摘要
文献综述
方法
结果
讨论
参考文献
作者信息
附录1
搜索
导航
#####
图1显示了最终基于cart的树的输出,该树预测了学生宣布STEM大学专业的概率。在所有自变量中,只有四个变量被认为相对更重要,并被自动选择来构建最终的树:高中期间的微积分学分、11年级的科学认同、高中期间的STEM总学分和11年级的数学成绩。因此,这四个变量在学生选择STEM大学专业的决定中起着相对重要的作用。
图1
最终的基于cart的树。概率表示实际主修STEM的几率。HSLS: 09-16提供了科学认同(X2SCIID)的Z分和数学成就(X2TXMTSCOR)的T分。为了使这两个标准化分数在解释结果时更容易理解,同时保持对这两个指标的解释一致,我们给出了从Z分数和T分数转换而来的这两个指标的百分位排名(PR)
有了最后四个预测因子,经过训练的样本被分成五组。如图1所示,第1组为未获得微积分学分的学生(占高中生的81%),且主修STEM的概率较低(probb .=0.16)。第2组学生(占高中学生的7%)在11年级获得微积分学分,科学认同百分位排名(PR) < 74,选择STEM大学专业的概率也很低(probb .=0.22)。第3组为获得微积分学分的学生(占高中学生的5%),11年级科学认同PR≥74,高中STEM学分少于9.8,11年级数学成绩PR < 97,有选择STEM大学专业的概率(probb=0.37)。
其余两组的平均概率大于0.5。第4组为微积分学分、11年级科学认同PR≥74、STEM总学分PR < 9.8、11年级数学成绩PR≥97的学生(占高中学生的2%),其进入大学后选择STEM专业的概率最高(probb=0.68)。第5组为获得微积分学分的学生(占高中生的5%),11年级科学认同PR≥74,STEM至少获得9.8学分(即X3TCREDSTEM≥9.8),并且选择STEM大学专业的概率最高(probb .=0.68)。
使用CART算法基于测试数据集(即完整数据的20%)进行预测,分类精度为0.80。随机森林分析的敏感性分析表明,CART中选取的4个变量也被平均降准法识别为重要变量,进一步增强了我们对CART结果的信心。基于cart的树也可以转换成图2,这是一个更容易理解的图像,展示了这四个变量如何交互预测STEM大学的专业选择。
图2
STEM管道-预测高中STEM专业选择(2009-2016)。水滴代表选择STEM专业的概率。PR代表百分位排名。CART的结果说明了这四个变量是如何影响2009年出生的学生在2016年的大学专业选择的。总而言之,如果高中生没有获得任何微积分学分,那么主修STEM学科的可能性将只有16%。此外,即使学生获得微积分学分,如果他们在11年级时没有表现出较高的科学身份(PR < 74),他们追求高等STEM学位的机会仍然很低(22%)。另一方面,如果学生在11年级获得微积分学分并具有高水平的科学认同(PR≥74),则注册STEM大学专业的可能性将大幅增加(从16%增加到37%)。有趣的是,如果学生在11年级获得微积分学分,具有高水平的科学认同,并且在11年级获得至少9.8个STEM相关课程学分或具有高数学成绩(PR≥97),那么主修STEM的学生的概率将提高到68%。
与之前的研究一致(Gottfried & Bozick, 2016;Riegle-Crumb et al., 2012),我们的研究结果表明,在高中期间至少完成一门微积分课程是进入STEM领域的高度预测。更重要的是,我们的CART分析首次证明,在102个研究变量(包括个人、家庭和学校因素)中,微积分课程完成程度是最具预测性的因素。具体来说,对于在高中没有获得任何微积分学分的学生来说,选择STEM大学专业的概率只有16%。这组研究结果强调了为高中生提供和支持完成高等数学课程的重要性,特别是微积分的学习。令人担忧的是,美国只有大约50%的高中提供微积分课程(美国教育部,2016年)。虽然我们的研究不包括学校层面的课程设置变量,但我们仍然可以推测,来自不使用微积分的学校的学生可能更有可能有较低的STEM参与率。
我们的研究还发现,科学身份是参加高等教育STEM学位课程的第二大预测变量。值得注意的是,与其他STEM激励因素(包括数学自我效能感、科学兴趣和STEM职业抱负)相比,科学认同相对更重要。科学认同反映了学生如何采取行动说服自己和他人他们是理科学生,这是坚持科学的强大来源(Robinson et al., 2019;Stets et al., 2017)。我们的CART研究表明,如果学生获得微积分学分并报告高水平的科学认同(PR≥74),那么选择STEM大学专业的可能性将大幅增加,达到37%甚至更高。学校管理者和政策制定者可以考虑开发或采用可以帮助学生在高中或更早阶段培养科学身份的项目或课程。
可以预见的是,那些在STEM相关课程中获得更多学分并在高中数学成绩优异的学生更有可能在大学里选择STEM专业。然而,这两个因素(第三和第四大预测变量)是前两个的“条件”。换句话说,只有学生获得9.8个或更多的STEM学分或表现出出色的数学成绩,再加上获得微积分学分和具有高水平的科学认同,才有可能从37%增加到68%。CART方法揭示的这种“条件”含义是一项新发现,也是对STEM教育和职业发展文献的补充。
我们的研究有四个局限性。首先,我们的研究依赖于公共使用的二手数据。其他未发布的重要预测因素(例如,学校级别的课程设置)或收集的(例如,社区STEM资源)可能会被省略。例如,纳入学校和学区层面的数据可以深入了解相关政策、资源和项目如何促进学生的STEM学习和追求STEM职业。由于这一限制,我们无法确定所选的四个变量与本研究中省略的变量相比的相对重要性。虽然我们不能在我们的模型中包括所有可能的预测因素,但我们的研究涵盖了比以往研究更广泛的预测方面。其次,我们将初始样本(2009年来自944所学校的23,000多名九年级学生)限制为2009年至2016年参加后续调查的学生(n=11,560)。我们承认,损耗偏差可能会威胁到内部和外部的有效性。因此,为了减少威胁,我们的分析采用了NCES提供的学生纵向分析权重。第三,我们的研究结果只能代表2009年九年级队列的研究结果。尽管如此,这个队列是NCES进行的STEM教育研究中最新的具有全国代表性的纵向高中样本。第四,我们的一些测量(例如,父母参与和STEM激励因素)涉及重复测量的项目。然而,这些项目在高中只测量两次(9年级和11年级)。由于重复测量的数量有限,我们在本研究中使用常规的CART。未来在多个时间点重复测量的纵向研究可以考虑采用有前途的纵向CART算法(Kundu & Harezlak, 2019)。
尽管存在这些局限性,本研究的发现在以下几个重要方面为当前的STEM文献做出了贡献:(a)在与STEM大学专业选择相关的丰富预测因素中确定相对重要的变量,(b)展示这四个最具预测性的变量如何交互预测选择STEM大学专业的可能性,以及(c)展示使用CART算法揭示STEM教育和职业道路之前未被研究的细微差别的潜力。完善和有效实施的计划可以增加STEM的参与和动机(Hudson等人,2020;派克和罗宾斯,2019)。我们的研究结果为教育工作者和政策制定者提供了新的视角和见解,即哪些相对重要的因素可以干预年轻学生。
下载原文档:https://link.springer.com/content/pdf/10.1007/s41979-023-00099-5.pdf