培养数据素养技能需要练习并反复接触不同的数据集和分析方法。尽管增加数据分析和解释方面的实践经验的举措并不难实施,但如果没有经过深思熟虑,可能会因为认为主题枯燥而阻碍努力,从而导致参与度差和主题回避。
为了全面优化学生参与度、提高认知并最终最大限度地提高数据科学教育的成功率,需要考虑四个优先事项:
确保我们教学生使用适当的工具
建立对数据解释的牢固基础理解
提供灵活的学习资源
不断强化信息。
通过优化数据科学教育的这四个方面,我们将增强学生对他们正在做什么及其原因的理解,并使他们能够在模块和环境之间转移这些技能。
行业工具:从点击式数据分析平台过渡
从历史上看,数据分析和统计理论在生物科学中的实际应用都是通过用户友好的点击式软件来教授的。这种方法的论点是,简单的用户界面使学生能够专注于分析工作流程和结果解释,而不会陷入实施困境。使用此类软件的决定在直觉上是明智的;然而,点击式界面意味着学生可以点击说明,而无需考虑其分析的合理性或解释。
点击式软件的另一种选择是使用编码语言,例如 R。长期以来,反对以这种方式教授数据分析和统计理论基础知识的一个观点是,学习编码语言会带来陡峭的学习曲线和统计概念。同时学习两者可能会让本来就害怕的学生不知所措。
然而,情况并非一定如此。向学生介绍 R 编码在短期内可能会很困难,但它也创造了许多学生喜欢的解决问题的元素。这也意味着学生在执行每个分析步骤时更有可能放慢速度、思考并参与其中。
正因为如此,学生在更有意义的水平上参与并开始质疑他们结果的解释,从而导致对统计概念的更深入学习和更深入的理解。
应用理解:数据可视化优先于统计理论
诸如“ p < 0.05,这是显着的”之类的陈述在刚接触推论统计的学生的工作中相对常见。从表面上看,这种说法可能是正确的,但它几乎没有显示出对数据的参与。信号的方向和强度经常被忽视,并且在学生的写作中很少体现出其在特定学科层面的重要性(在本例中为生物相关性)。
我们通过最初重点关注数据可视化来解决这种对p值的痴迷。当学生开始掌握 R 的使用时,他们最初的分析任务主要围绕如何呈现数据。学生学习如何为他们正在使用的假设、数据类型和样本量选择最佳的绘图类型。然后,我们围绕如何最好地解释这些图进行课堂讨论,引导学生思考数据显示的内容以及它们在数据集上下文中的含义。通过将最初的解释技能仅基于学生在绘图中可以看到的内容,我们将重点从对p值的盲目依赖中转移出来,奠定了坚实的基础,在此基础上学生可以对推论统计建立更深入的理解。
资源灵活性:优化所有学生的学习资源
正如已经提到的,使用 R(或其他编码语言)教授数据素养和分析技能的主要批评是陡峭的学习曲线。然而,通过应用灵活的学习资源,这些梯度可以降低,这些资源允许学生在他们想要的时间和地点工作。我们的一年级本科生都可以访问一本工作簿,该工作簿目前发布在 Bookdown 上并托管在 GitHub 上。
为了消除障碍并最大限度地提高对这些资源的可访问性,学生可以轻松修改美观(字体大小和样式以及背景色调),并可以下载它们或在浏览器上查看它们。
该工作簿的章节结构与教学周相对应,因此每周所有学生都应该完成工作簿的一章(这些章节应该需要一个小时左右才能完成)。随着章节的进展,关于做什么和如何做(R)的指导水平会降低,因此对学生编写或编辑 R 脚本的要求逐渐增加。
我们使用的第二个灵活资源是 Posit Cloud(一个在云环境中托管 RStudio 和其他数据科学工具的平台)。学生通过设置一个免费帐户来开始本单元,这意味着他们在设备上下载和安装 RStudio 时不会遇到错误。在 Posit Cloud 中,每个工作区的文件系统都是统一的,学生可以在任何地方访问他们的工作,只要他们安装了浏览器并有互联网连接。
可以预见的是,学生经常会遇到错误并需要帮助对脚本进行故障排除。在时间表会议中始终可以提供帮助,但为了最大限度地提高灵活性和包容性,他们还可以通过时间表会议之外的工作区共享功能与教学人员远程共享项目。
强化:支持员工创建一致的数据素养教学方法
我们经常观察到,学生在模块和学习年限之间很难继承和应用概念或技术知识。在 STEMM 科目中,整个课程中的许多模块都要求学生将他们的分析和解释技能应用于数据集。不同的学科可以有不同的专门方法,这意味着大多数具有数据分析或解释元素的模块必须为此内容运行一些教学和支持课程。为了防止矛盾或混乱,确定一系列商定的核心价值观和方法至关重要,以便教学数据分析和解释在模块和课程线索之间保持一致。
与任何大规模的内容更新一样,这需要对员工持续专业发展的支持和支持。我们通过员工“编码静修”来解决这个问题,帮助他们对 R 的使用更有信心,并更熟悉如何教授第一年的分析和解释。
此外,我们还支持各个模块组织者修改现有的教学内容,使其与学生之前的学习和数据素养技能保持一致,同时仍然满足特定学科的学习成果。这种方法意味着,随着时间的推移,整个课程中数据科学的所有方面都将在模块和学习年限之间保持一致,这将加强所教授的分析概念和方法,并培养具有更强整体数据素养的毕业生。
成功的数据科学教育需要采用整体方法,包括修改我们教授数据科学的方式并在整个课程中强化课程。通过我们的努力,我们发现学生对分析方法的参与度有所提高,对图表和统计输出的解释也更加有意义。