吴文峻博士:云计算和大数据支撑下的大规模在线学习研究和实践丨锦囊云计算大会专题报道

微博 微信

2016年第八届云计算大会,锦囊专家特承办大数据与教育创新论坛。本次专题论坛将汇聚产学研用四方智慧资源,邀请国内外在互联网教育领域的权威专家、知名企业家等,以全方位的视角,从趋势观察、实践共享、技术变革等多维度展开深度探索,搭建政府、学校、企业、研究机构的高端交流平台,推动"互联网+教育"的均衡发展。

下面,小锦首先要把北京航空航天大学“卓越百人”青年人才计划教授,北航高等工程学院副院长,吴文峻先生的精彩发言干货放送给大家!

微信图片_20180320151759.jpg

非常高兴今天下午有机会跟诸位分享我们在云计算和大数据方面做的一些主要工作。我已经是第三次参加这个论坛了,前两年在很多论坛讲了很多高大上的理念,过了两三年以后,希望能够更加具体的让大家看到实践成果。

我今天的报告显示了大规模在线学习几个方面需要的服务。

首先需要有环境。这个环境包括各种各样的课程资源,以及在线的实验部分。现在大家都拿着手机和IPAD这样的移动设备,移动部分的学习是非常重要的。在这之上就会有各种跟学习相关的数据分析、收集、个性化的导学,项目的互评,群体式的学习方式等等,在整个的过程中作为支撑存在。

我们知道教育本身是高度创新、不断发展的行业。每个人都可以因地制宜地根据自己的学生、学校资源,面对不同的教学目标来设置自己的教育理念、方法和模式。比如可以开展积极项目学习,包括像一些竞赛、创课学习等等。

这里面有三方面主要的技术,跟云计算、大数据相关的。首先是云流媒体技术,没有云流媒体的技术,就没有今天MOOC时代。还有虚拟方针和在线实验技术,第三块就是我们每天都在讲的云大数据的分析技术。

微信图片_20180320151803.jpg

一、云流媒体

首先给大家讲云流媒体。以前视频都通过FLASH来传递,现在转到HTML5,同时跟HTML5相生的就是自适应传输技术。根据终端网络情况可以自动地调整传输的质量、速度,使得它能够更好地适应。当然要实现这个技术也涉及到云转码技术的支持。

微信图片_20180320151806.jpg

它把需要传的视频切分成不同的块,根据不同的质量事先给它压缩成面向不同传输数据、不同传输质量的视频单元。同时根据DTML5的结果进行动态的调整,当你在一个合适的带宽,可以达到这个带宽最优化的使用,以及最佳用户使用效率,这就是一个基本的架构。

这个东西跟MOOC有什么关系?首先因为它本身是一个底层的支撑技术,随着MOOC的兴起,我们知道MOOC跟土豆、优酷是类似的,每年MOOC的开发者要花很多钱,保证服务质量。如果你可以使用DASH技术进行传输,一方面可以保证质量,同时可以优化你的运营成本。

目前MOOC就是这四大类,包括讲师、PPT,像电影一样的视频播放资料,还有混合型的,每一类都可以定义成不同的分类,来适应最佳的网络带宽的传输。这是非常简单的识别算法。

微信图片_20180320151808.jpg

我们知道现在有深度学习,这些非常智能的识别算法,这四类划分是非常容易做到的,能够对视频的区域进行有效的识别计算,包括人脸计算以后,就可以对不同的识别区域定义不同的编码参数和带宽要求,最终实现刚才我讲的最优化的内容自适应传输。

这可以看到,当你做这样的工作以后,如果你再把一些MOOC的学习者来进行所谓的测量,你就会发现,实际上在比较低的带宽底下,像PPT,用户同样可以达到非常满意的效果,你不需要花费很高的带宽来传输。由于在MOOC里面有很多是老师的视频,在不同的区域可以采用不同的编码,在低带宽的情况下也可以达到很好的效果,这是我们做的一些方法和传统的OSMF的比较,由于时间关系我就不详细讲了。

微信图片_20180320151811.jpg

二、虚实融合的云在线实验平台

微信图片_20180320151813.jpg

第二部分是虚实融合的云在线实验平台和教学实践,这跟我讲的第二项技术密切相关。这张图显示了我们北航在过去的几年当中,在MOOC跟在线学习方面的实践情况。其实从2012年开始,我们就投入这个工作,2014年建立自己的平台,上面有很多相应的课程,特别重要的是,随着这个工作的逐渐进展,我们意识到仅仅一般的MOOC,包括录制、播放,很难满足理工科学习特点的在线需要,特别是对实验的支持是非常薄弱的。

大家上MOOC平台上看,除了软件编成,可以搞个笔记本来编,如果想做硬件的实验根本是不可能的,所以我们当时把在线的硬件实验平台作为我们MOOC实验平台中非常重要的内容来推进。

目前在MOOC平台里我们可以把跟实验有关的平台分这么几类。你可以到真正的机房里面,像每个大学都有它实验中心、实验机房,让学生来进行学习。我们上大学的嘉宾都有体会,这可以做很复杂的实验。但是你只能在规定的时间内,规定的空间内,它不可能给你开放到晚上十二点,让你做实验。

MOOC上面大部分是软件和仿真性的实验,但是很难支持复杂的实验,真实感比较差。我们这里重点强调的是软硬结合的、虚实结合的实验,能够更好地结合我刚才提到的既能提审实验的真实感,又可以使学生随时随地操作试验设备,同时使试验设备的用率得到提高。

微信图片_20180320151817.jpg

这是现实我们在线实验的基本架构图很简单。我们需要有一个试验设备的管理层,把这些设备进行抽象,纳入到核心服务层,这里面包括实验课程的管理、接入,实验设计、导学等等,在上面用户看到的是完全网页式的,比如原来的操控板就变成了一个网页,路由器就变成一个可以编辑的可视化的界面,实现学生对设备的访问。

这是我们使用了在线实验和MOOC教学以后,教学效果的一个评价分析,大家可以看到,从2010年到2014年,基本上优秀、良好、中等的情况没有太大的变化,可能稍许有些波动,但是通过了MOOC和在线平台相结合,我们的优秀人数明显增加了,同时不及格的人数明显减少,整体的学生学业表现都有很大的提升。

实际上我们在开展在线学习的同时,实际上把实验的本身难度和深度是增加了,在过去很多复杂的实验做不下去,很难完成。有了这个以后,使得教学的效果得到了明显的改善。

微信图片_20180320152243.jpg

这是我们在在线平台上开展的计算机组成原理的实验情况,这个实验对学生难度要求非常高,学生要在一学期的实验里面完成十个这样的组成设计,要把从部件级的设计向加法器,包括CPU的设计器,流水线,都要一步一步地设计出来,同时要把它装在一起,能够形成一个至少支持四十条到五十条MIPS指令,这在目前大部分学校能够做到,能做的学校大概只有十几条CPU,CPU的指定条路增加以后,整个系统的设计难度也有很大的提高。

在2014年到2015年,我们增加了一些难度,在多周期的CPU流水线方面都有很大的难度增加。

同样,我们看到难度增加的情况下,学生的优秀率也有明显的提高,从2014年的10%,到2015年的17%,不及格率有了明显的下降,同时愿意参加比较难的提高级的实验人数明显增加,达到了23%,这些都是非常欢欣鼓舞的效果。

目前我们在计算机,特别是像网络操作系统组成原理这样的课程实验,在计算机教学领域得到高度重视,因为我们国家计算机教育很重要的是要对标国际标准,在国际标准一个非常重要的指标,就是提高学生解决复杂工程的能力,也就是给一个比较复杂的工程问题,计算机专业毕业的学生,应该东西怎么样用手头的工具创造性地解决。

你给他一个组网任务他可以很快地完成,你给他一个CPU设计任务,他也可以很快的完成。这里头仅仅靠简单的教学模式调整是不行的,必须要有很好的在线教育手段,配合教学改革的调整,才能使学生得到解决复杂工程问题的程度。所以我觉得推广虚实结合的实验,对于提高我们国家计算机专业人才的培养有非常重要的意义。

三、学生行为数据分析

最后一部分,我给大家介绍的是学生行为数据分析和学习效果的评价。有了MOOC,有了在线实验以后,除了我们能够提高学习效率以外,还能够帮助我们对学生的学习情况进行定量的分析,使得我们走入自由王国,你可以更好地了解教学教育,大数据的手段可以帮助我们更好地改进教学。

微信图片_20180320152313.jpg

这是我们学习数据分析和教学干预的基本概念图,我们知道加上MOOC和在线实验以后,学生的无是观看视频行为,还是在线讨论行为,以及刚才讲的作业和实验等很多行为,都可以捕捉到数据,过去在课堂教学就很困难,现在也有很多中小学推一些IPAD可以一部分解决这些问题。

但是课堂的行为从实践上非常难以做到,有了在线平台以后这个问题得到明显的解决。得到了学生的行为以后,就可以利用我们的大数据技术对学生的行为特征进行分析,就可以更深入地了解到,学生在完成教学任务认知过程当中的一系列变化,基于不同变化和状态划分,就可以制定相应的教学政策,这就是所谓的科技化学习。

微信图片_20180320151825.jpg

微信图片_20180320151828.jpg

通常我们都会采用随机图的模式,根据教学的知识表格划分,同时把他每一步的学习行为纳入到学习状态的观测当中,通过学习状态,通过学业表现,分析他在每一个知识点上认知状态的变化,有了这个变化以后,我们就可以做学业的规划,辅导答疑,包括作业评判等等。

最后总结一下,我们认为MOOC教育不光是让大家看视频做练习,替代简单的课堂学习就完了,很重要的一块,它可以改变我们的实验教学,实验教学比课堂学习重要得多。

所以我们需要大力地推广在线实验,真正把我们所在实验室、所在机房里面的剩余资源释放出来,可以让学生二十四小时使用资源、仪器设备,让老百姓的纳税钱得到更好的利用,同时能够让学生有更多的时间学习、尝试解决复杂工程,这是我们教学探索最重要的一点。

另外一点,有了MOOC平台在线学习以后,真正使得我们学习过程的个各种行为交互,包括教师的传业授道过程,以及学生的交互讨论,过去这都是写在《论语》里面,这些都可以数字化,定量的记录下来。

最大的好处是它能够使得我们进行分析,能够对我们的课堂教学情况给予定量的评判,教学方法效率进行定量的比较,对每个学生的学习动态和学习情况进行咨询调整,如果真做到这一天,我们的云计算和大数据才是智慧的使用。


锦囊专家原创文章,欢迎联系小锦转载

我要留言