过去的几年中,厦门医学院累积了大量数据,为大数据综合分析平台提供了良好的数据支撑。在此基础上,学校认为,有必要建设“大数据综合分析平台”项目,为综合运用学校大数据提供技术平台支撑,为学校的进一步发展奠定基础。
厦门医学院
厦门医学院的大数据综合分析平台,主要由点击流大数据分析平台、综合分析数据仓库建设及学生行为心理指标体系平台共同搭建完成。根据厦门医学院的数据情况和分析需求,学校采用多层次的校园数据仓库系统架构,保证在复杂的数据种类和关系的海量数据上进行业务分析和查询。对全校的数据和信息进行分层、分类存放,并制定相应的数据分层、分类规范,使得数据分析人员能够用最短的时间熟悉并掌握各类数据。
考虑到应用方便、高效查询的问题,学校对源系统进行适当整合、拆分,裁减掉源系统中没有必要整合的数据,同时对各系统冗余及标准不一致的数据进行规范和整合。而针对数据隐私保护,学校也建立了相关制度,严格管理权限,访问留痕,并对外发布采用数据脱敏技术。
管理场景
在基础数据模型中按照七大主题对全校数据进行整合、分类组织和存储,这七大主题包括学生、教师、科研过程、教学资源、教学过程、学习过程、生活过程,每个主题下设计相应的数据模型,最后构成全校统一的基础数据模型。由此,实现全面掌握学生的学习与生活情况,从而达到科学决策、智慧决策、精准管理的目标。
场景一学生网络行为与心理大数据模块
教育部于2018年7月印发了《关于加强普通高等学校大学生心理健康教育工作的意见》,要求各地教育部门和高校充分认识加强高校大学生心理健康教育的重要性。厦门医学院对此高度重视。
在学生网络行为与心理大数据模块,数据处理包括网页文本获取与分析、人脸获取与表情分析、数据抽取、人格计算、心理健康计算、综合查询等,主要是将网络日志中的浏览内容、人脸图片中的表情数据、其他校园中的业务数据进行处理、抽取等,为展示与分析提供数据支持(如图1所示)。展示与分析包括人格分析、心理健康状况分析、行为指标等,给相关老师及校领导提供一个了解与分析学生心理与行为的可视化界面。
图1 学生网络行为与心理大数据模块
本场景设计主要通过学生的上网数据,结合在学校内产生的其他业务数据,帮助负责老师和心理老师快速了解每个学生的情况,并且对有潜在危险的学生进行预警,尽早干预,以防问题出现。
在使用大数据系统进行学生心理大数据分析之前,学校的心理健康教育工作主要依靠个人经验进行相关的心理调查活动,得出的结论可能存在误差较大的情况。心理健康教育方面则只能通过开展心理教育课程,即预先引导学生建立积极向上乐观的心态,而无法及时准确地了解每个学生的心理状态,不利于后续有针对性地指导和干预。
此次厦门医学院把大数据分析运用在学生网络行为与心理,实现了以学生个人为单位做分析,大数据综合分析平台能够根据分析结果,对可能存在心理异常的学生做出预警,教师只需根据预警名单尽早联系学生进行心理辅导,同时可提供以院系为单位的群体分析,让老师们能够了解到心理问题发生概率较高的群体,提高学校心理健康工作的科学性与系统性。
图2 学生心理统计(抑郁统计)
图2展示有抑郁倾向的学生数统计,后台从网络日志数据库获取日志记录和网页文本,解析日志记录中的xml字段并提取其中的重要信息,将处理后的结果以JSON格式的数据保存。从解析日志所保存的JSON文件中提取学生信息、日志的基本信息,包括URL、日志时间等;使用爬虫技术爬取学生浏览的网页,并从获取的网页中提取全部文本,将网页基本信息和学生基本信息存储到数据库。
此外,通过人脸识别系统取得人脸图片的参数,获取到人脸部分并进行人脸表情分析,将分析结果存储到数据库中。最终,将汇总统计过的数据,按照五大人格子维度的对应关系和各数据类型占比,统计各个子维度的分数(5分为最高分),再从子维度分数汇总到五大人格分数,由此统计出哪些学生有抑郁倾向,以及学生数量(如图3所示)。
图3 班级心理健康倾向统计
(针对一个群体做分析)
场景二:综合业务分析模块
在这个打开网页就能查找信息的时代,需要通过大数据与教育的结合,有效分析每位学生的学习状态和生活状态,帮助学生管理者做出更合理的决策、提供更好的服务、最大化地配置资源,增强教学目标与实际教学的互动性。
结合厦门医学院的实际工作习惯和流程,平台的设计结构合理、功能易用、符合实际业务的需要,依托FineReport数据决策系统,建成报表中心,方便报表管理、用户管理及系统个性化设置,进而支撑起各种学校主题分析。
利用ETL工具,主动抽取业务系统的明细化数据,进行数据转换,并对数据进行数据合规性、匹配度、错误值、脏数据等的清洗之后,装载入企业数据仓库,生成源数据。
源数据是BI系统的数据基础,在源数据的基础上构成各种数据报表模型和分析模型,提供给报表查询、报表输出、数据分析挖掘使用。进一步深入,可以在这些源数据和已构成的数据报表、分析模型的数据之上,按分析需求和数据关系,把它们组合成各种立方体(Cube),从而支持多维分析,切片(Slice)、切块(Dice)、聚合钻取(Dill-down和Roll-up)、旋转(Pivot)等OLAP高级分析及查询,甚至支持假设分析(What-If)和预测。
使用报表工具,进行数据的数据模型定义、报表处理、展现、数据分析,乃至数据挖掘,并在报表门户上展现数据处理结果。这些处理包括预置开发的数据报表、业务分析报表、随机查询、多维分析和数据挖掘。
通过分析现有的教务系统、学工系统、人事系统、图书馆系统、网管系统、一卡通系统、科研系统等多个业务系统数据,最终将分析结果通过报表的形式展现出来,老师及校领导可通过访问数据决策系统查看报表,同时也支持手机移动端查看,实时了解学生的学习情况及生活情况。
图4 综合业务分析模块
上线综合业务分析模块后(如图4所示),学校教师和校领导能够通过网页端和移动端快速了解学生在校的各项情况,例如通过学生的社团数据、选修课、体育课项目选择、志愿者活动数据来分析学生的兴趣偏好;通过分析学生一卡通数据,消费项目、时段和金额等特性,得到学生消费心理画像。
此外,还有关于教学质量主体分析,包括成绩详细统计分析、各学院学年总学时变化趋势、各专业中不同科目成绩排名及趋势分析、学校开设课程情况统计、网络学习统计分析、按教学课时量对教学部门排名、各专业中科目成绩排名及历年趋势、教职工教学任务统计、各院系成绩情况对比、专业中不同科目挂科率排名及趋势分析等不同维度的分析。
不仅针对学生,还有一些办公流程统计分析,分析各个部门内部事务处理及部门协作办公情况,教师评教情况、课程评教情况,以及一些科研成果获奖情况等。通过综合分析报表展示,能够使学校管理者快速高效了解学生日常生活习惯、兴趣爱好,同时掌控学生是否有外宿或者网瘾等不良习惯,有效了解学校的整体教学情况,为管理者提供更加科学、可靠的决策依据。
1.疑似外宿学生名单分析
通过对一卡通门禁、淋浴数据分析,得到近14天内疑似外宿学生名单,学校教师和校领导可以根据名单对外宿学生重点关注,了解外宿原因并预防外宿安全问题。
2.学生画像
结合学生的图书借阅、一卡通刷卡及上网数据分析形成学生画像,辅导员可更快了解学生生活情况。
3.全校用餐趋势分析
通过一卡通消费数据分析各院系各班级用餐消费情况及每个月的用餐消费情况,为食堂管理者提供参考数据,同时也可以根据数据推测学生在校用餐情况。
4.评教分析
分析各班信息员对各位教师的评教情况,展示每位教师被评教的得分及排名,为校领导提供科学的评教数据。
5.各科成绩分析(以班级为单位)
汇总各班各学科成绩,做平均分、及格率、优秀率、最高分和最低分各项指标对比排名,让各科任课教师及辅导员更直观地了解各班各科考试情况。
6.移动端报表展示一一学生用餐趋势
基于一卡通用餐支出部分的数据,统计对象为全校学生,展示用餐总费用和总次数的年趋势和次均(每次刷卡的平均消费)的年增长趋势。
7.移动端报表展示——图书馆借阅逾期扣费情况
基于一卡通的消费数据,对图书馆借书逾期未还扣费数据进行统计分析,为图书馆图书管理业务人员提供真实可观的数据,使其能够更快了解扣费情况及扣费趋势。
场景三:疫情期间学生返校模块
厦门医学院通过ETL工具对疫情期间各相关应用进行数据抽取,数据清洗,数据装载,历史数据存储(反应数据的历史变化),数据快照,数据集市,数据的增量更新等操作,针对师生体温上报数据、师生返校数据、外来人员来访申请数据、后勤人员健康数据,以及师生所在地分布数据进行多维度分析,制作多张数据报表供教师和校领导查阅了解疫情期间相关情况,同时汇总各项数据分析情况并以大屏的形式呈现。学生分批返校前制作了返校信息实时监测大屏,为校领导实时呈现返校当天学生到校情况(如图5所示)。
图5 返校信息监测大屏
学校联合多个部门建立“指挥中心”。“指挥中心”依托大数据技术,大屏显示各种返校动态信息(如图6所示),各个关键通道的实时视频,现场视频会议解决突发问题,远程关心一线工作人员和学生的返校情况。大大提高了领导决策的科学性、精准性和快速性。
图6 厦门医学院疫情工作汇总
建设心得
通过此次大数据综合分析平台建设,厦门医学院发挥技术优势,变革传统模式,推进大数据分析技术与教育教学深度融合,推动改进教学,优化管理,对学校的管理决策和内部治理发挥着巨大作用。
从领导决策分析角度上说,传统的学校领导者决策主要依据个人经验和直觉,易造成决策不够民主,不够专业,决策效率较低。学校领导基于大数据综合分析平台的分析结果做出决策,使得决策更为客观、科学、合理和有效。
从管理层角度上说,传统高校教育教学管理工作形式较为单一,一般由教师或辅导员对学生进行引导,管理人员缺乏与学生的交流和沟通,无法理解学生的想法。在大数据综合分析平台的支持下,管理人员可以更好地了解掌握学生的学习进度,还可以通过学生的行为习惯分析结果对其做出相应调整,有效提高了工作效率。
从服务学生角度上说,通过大数据综合分析平台分析每个学生的学习情况、兴趣爱好、生活作息、心理健康情况,建立学生画像,帮助老师更好地了解学生,在发现学生异常的情况下,提前预警和干预,在学习上为学生提供学习建议和个性化练习,从而最大限度地实现精准服务和因材施教。