“大数据的核心价值在于应用,而应用需要专业知识与数据思维相结合。然而,大数据的应用能力培养用现行书本教学的方法很难实现。”清华—青岛数据科学研究院执行副院长韩亦舜表示。
随着产业结构不断优化与转型,数据科学及人工智能技术与行业的应用逐步深入,数字经济的黄金时代已经来临,对数据人才的需求也持续增加。为应对市场对数据人才的需求,全国已有1355所院校开设了数据科学及人工智能相关专业,作为新的学科、新的专业,如何突破传统的教学模式,培养出能满足行业实际应用需求的数据人才依然是高校数据人才培养中的难题。
如何才能真正让在校大学生将所学知识与未来工作中所要具备的技能相融合,摆脱因在校所学内容过于笼统而导致与实际工作所需技能脱节,无法应用到其中的窘境?这也是教师及学生自身最关心的问题之一。
「智算之道——2020人工智能应用挑战赛」则是以解决这个问题为首要目的,致力利用数据竞赛这种全新的方式来探索让数据科学教学更高效的可能性。
此大赛通过设置「疾病预测结构化数据」与「天气情况图像分类」两个赛题,面向各高校的研究生、大学生、大专生,切实地帮助在校大学生、企业与社会共同应对数据科学及人工智能的快速发展,对接经济社会人才需求,促进学生在数据科学及人工智能的研究与设计、开发与应用方面的创新能力培养,更能促进相关专业的应用型人才培养与课程体系变革。
为什么说数据竞赛能促进数据科学教育体系的变革,从而让教学变得更高效?
1、高校数据人才教育还需实战打磨,实践练习依然是难点
数据科学是一门实践性极强的学科,其研究和应用都不能脱离现实中的领域,在使用几年之后大家才发现,快餐式的教学只能承载技能培养而无法打磨人才的数据思维,有很多传统教学工具其实远脱离了实际场景,仅满足了基础的教学要求,而无法进行工业级生产应用。
在数据人才的培养中高校意识到不仅需要优质的教学课程,更少不了实践和实战的经验。目前国外已有较多高校开设以培养学生达到能用数据科学方法解决实际问题的目的实训营,然而在现阶段国内高校中,依然缺乏统一的学习实践平台、数据与案例等,实战练习依然是高校数据人才培养中的难点。
2、数据竞赛融入教学,成高校应用型数据人才培养关键突破口
数据科学教学亟需一个将理论落地的实践场景,而数据竞赛不仅能将高校数据科学理论教育与研究进展放诸真实的业务环境中,还能让参与者在团队协作中完成算法的开发以及其它成果的产出,对学生的技能运用能力有很大提升。以赛促学,拉近教学与产业应用的距离,加强学科建设和人才培养。
此外,在数据化转型探索中,国际顶级学术会议、大型企业、政府部门都纷纷引入了数据竞赛的探索模式。国内大厂甚至将数据竞赛成绩作为数据人才能力评估的重要标准之一。高校若能将这种模式引入课堂,能让学生在国内外大型比赛中获得更好的表现,从而为未来求职就业准备更好的条件。
ModelWhale“赛练用”一体化云端实训平台赋能高校数据人才培养
以赛促学,产学融合显著提升学生应用能力。
在数据科学教学实训平台上,老师可根据教学内容及进度配置不同规模的数据竞赛,让学生在实际的应用场景和数据中培养良好的科学研究素养和技术应用能力,最终提升教学能力。
赛评一体化释放教师生产力,提升实训水平。
数据教学实训平台提供全自动评估方法,预设常用评估指标,老师在设置比赛的时候可自定义配置功能,轻松自动计分排名。
随学随练,无缝调用社区实训资源。
和鲸社区沉淀了海量真实商业数据和跨行业优质项目案例。在云端实训平台中,学生可通过模块应用中的资源库无缝接入社区资源,并在平台上利用多元的案例进行课后巩固和研究练习,真正的实现产学结合。
“教学练”深度融合,开箱即用的环境让零基础学生轻松上手实践。
为了让学生快速上手实践,实训平台提供免安装部署的统一计算环境,为降低分析门槛,配备多种代码片段并支持Canvas环境下通过拖拉拽和点击进行分析。
与生产应用相结合是高校数据科学教育未来趋势,如果想提高学生的实战能力,将教学和数据竞赛结合起来肯定会事半功倍。另外,专业的工具和实训平台也是教学应用落地不可或缺的因素。深耕数据科学领域多年,和鲸科技一直以丰富的数据竞赛运营经验、专业的数据分析工具、开放的数据科学社区搭建起产学融合、校企合作的桥梁,为高校数据人才培养提供全方位资源支撑。
BDOS平台加持:快速应对随时增长的应用容量,满足大规模集群算力
在本次人工智能挑战赛中,参赛选手们也完全不必担心因数据量过大,平台无法智能的进行集群动态运维和资源算法分配管理,从而导致应用程序性能下降,无法顺利发挥自己真实技术水平的意外状况。
在本次挑战赛的实训平台中,一体化云端实训平台与 BDOS 的“协作”可确保大赛平稳顺利进行,完全无后顾之忧。具体而言,智领云 BDOS 大数据解决方案中的容器大数据平台,能够完美解决因用户规模大、数据量激增所带来的海量数据的处理问题,原因在于 BDOS 大数据解决方案架构体系中,容器大数据平台所具备的分布式存储系统、分布式计算框架、任务调度框架以及多租户管理等功能,可以一次性满足竞赛平台同时拥有高可用、易伸缩、可扩展、高安全的多重特性。
BDOS体系架构
以本次挑战赛为例,以往高校、科研院所、企业在大数据/人工智能模拟竞赛、培训、实验中,往往会遇到诸如高成本、长周期;系统僵化、难维护;模式单一,难通用;大数据专业团队难寻等诸多难题。
如何快速搭建多租户大数据及人工智能使用环境,协同式在线科学研发、实验及管理,保障其在模拟竞赛、培训以及实验中达到理想状态则成为当务之急。对此,智领云 BDOS 大数据解决方案所具备的优势,完全可以解决以往企业、高校及科研院所所面对的困难,其方案优势具体体现在:
完整的产品体系
可以提供计算机基础,以及课程所需的在线实验环境,持续不断跟进技术革新,在线调整和升级课程设置;
优秀的性能
夯实的系统基础,提供高可用且性能优秀的平台,能够应对随时增长的应用容量,并且保证高效的资源使用率,完善的多用户管理,细粒度的资源共享,充分利用硬件资源;
灵活的横向扩展能力
依托 BDOS 通用性大数据平台的特性,能轻松扩展至 TensorFlow、PyTorch、Zeppelin 的学习和实验平台;同时对新组件/系统的支持也非常轻松,Presto、Cassandra、MongoDB 等都能够轻易在原有的解决方案上进行扩展;
按需建设及使用
快速按需实施,轻松应对教学需求以及突发的科研计算,同时在需求淡季能自动降容来确保资源使用不浪费;
大数据平台能力
提供了大数据收集、储存、分析、可视化的一站式平台,帮助用户快速提升对业务状况及用户学习行为的实时洞察力;
安全稳定
提供全程操作审计和监控、用户安全组配置、统一授权/验证,满足教育行业核心数据的安全诉求,避免数据资产泄露,保障教学的安全与可用性。
由此可见,在本次挑战赛中,BDOS 平台所表现的突出优势,不仅能够助力参赛选手发挥出自己真正的技术实力,顺利完成比赛,更为高校、科研机构等教育行业在培养数据人才方面提供了全方位的技术支持。
万丈高楼凭地基,“赛练用”一体化云端实训平台与智领云 BDOS 数据平台的“协作”,为助力在校大学生将所学知识与未来工作中所要具备的技能相融合,促进学生在人工智能研究与设计、开发与应用方面的创新能力培养,促进相关专业的应用型人才培养与课程体系变革,促进创新教育范畴的产教融合、产学协同育人等方面提供了可靠的技术支撑与突出贡献。