导读
为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。
回首即将过去的2020年,清华大学大数据能力提升项目取得了丰硕的成果,同学们将课程中学到的数据思维和技能成功地应用在本专业的学习和科研中,在看到数据科学魅力的同时,也将自己打造成为了交叉复合型的创新型人才。下面让我们通过来自12个院系的16位同学代表一起领略他们的风采吧!
苏子怡
土木工程专业博士生
建筑学院土木工程专业,直博三年级。研究方向为公共交通建筑用能评价指标体系,对高铁、地铁车站建筑用能分析的研究已发表3篇SCI和EI论文。在大数据实践方面,参加了潍柴动力工业园能耗分析项目,获得了暑期实践优秀团队奖。
成果展示
项目题目
工业园能耗分析项目
选题缘起
2017年8月,山东省列入首批国家电力现货交易试点省份,使得用能预测成为企业的一大需求。潍柴工业园的智慧能源管理平台已上线运行多年,采集并存储了大量小时级和分钟级历史数据,需要建立用能预测模型挖掘数据价值,辅助园区的智慧化管理,为能源预算考核和节能决策提供算法和技术支持。
项目简介
为了满足业务的需求,我们对采暖和用电2个项目的4个变量在8种不同的应用场景下进行了研究,采用了多种算法进行了模型调参和优化,对比了各算法在用能总量和强度预测中的表现。最终针对企业的各种业务场景和应用需求,选择了合适的算法建立了预测模型,并应用到了工业园的数字化能源管理平台上,为企业优惠购电策略的制定和智慧化能源管理提供了算法和技术支撑。
项目节选
滑动查看更多
2021年祝语
2021年希望能够更多地参加到大数据研究中心和协会的活动中,了解行业前沿和企业发展。祝愿大数据能力提升项目越办越好,能够帮助到更多对数据分析有学习需求的小伙伴们!
郝奇
建筑系
我是来自建筑系的郝奇。从小就喜欢抱着家里的各类地图品味的我,对于探索大千世界和探究城市运行机制乐此不疲。大学期间,我的旅行足迹遍布11个国家和30个国内省市,坚持用脚步丈量世界,用摄影记录美好。学术上,我也秉承这种“执念”,参与了诸如城市街道空间品质测度、长租公寓租金影响因素分析、新冠肺炎诊所规划与快速建造设计、基于犯罪行为预测的城市空间安全评价与设计决策等众多研究项目,积极拥抱大数据技术,以实现探究城市的初心。
成果展示
论文题目
城市空间安全评价与设计决策——基于犯罪空间数据的集成学习
选题缘起
2020年,新冠疫情席卷全球,城市安全韧性问题获得关注。从泛城市安全的角度看,犯罪预防亦是公众安全保障的重要一环,对城市空间的安全评价和设计干预,可以有效遏制犯罪行为,提升城市安全韧性。当时适逢《大数据与城市规划》结课,队友在课程中恰好探究了犯罪的空间影响因素,因此沟通后我们决定以此为主题,组队参加“城垣杯”规划模型大赛,继续深化研究。最终我们夺得一等奖,成果经提炼后撰写为了科学论文,目前正在投稿阶段。
成果简介
竞赛成果:
利用极限树模型,对影响犯罪行为的自变量进行特征筛选,并按照重要性排序,而后根据特征集构建犯罪指数预测模型,用于城市空间安全评价、犯罪行为预防,经验证,模型在北京市五环范围内拟合效果较好(调整R方超过0.9)。通过对特征集的分析,我们提出了基于犯罪预防的规划设计导则,借助预测模型还可以对设计的安全效果进行动态反馈,辅助决策制定。各成果结合,形成完整的城市空间安全提升方法路线。
论文成果:
论文聚焦POI和land use两类变量在犯罪行为模式预测模型中的性能差异,通过线性回归与地理加权回归等方法,验证了POI的优越性,同时探究了POI数据最佳的处理和使用方式。
成果节选
滑动查看更多
2021年祝语
新的一年,希望自己可以继续尝试在“大数据×城市科学”的交叉领域深耕,用新方法新手段深化人们对于城市这个复杂系统运作原理的理解,为提升城市生活体验、提高广大人民的幸福感而努力。
也祝愿未来“大数据提升项目”能吸引更多同学加入,帮助大家发掘科研兴趣点,练就过硬的技术能力,培养迎难而上的自信心,积极拥抱大数据时代的机遇与挑战。
吴曼
工业工程系博士生
研究方向是人因工程与人机交互,曾在清华大学研究生社会实践中被评为校级优秀个人,作为组长带领的团队在清华大学大数据实践中被评为优秀项目团队。目前已发表SCI索引的论文两篇,发表EI索引的论文三篇。
成果展示
论文题目
Using Live Video Streaming in Online Tutoring: Exploring Factors Affecting Social Interaction
选题缘起
2016年被称为中国网络直播元年,观看直播的用户规模超过3亿。除了常见的娱乐类和游戏类直播之外,直播技术也开始被应用到教育领域,成为一种全新的在线教育方式。直播课堂提供了老师与学生以及学生之间即时互动的机会,但由于直播课堂通常没有人数限制,有的课堂有数百名甚至上千名学生同时参加,大规模的即时互动为课堂带来了极大的挑战。因此,我们希望研究直播课堂中的社交互动行为,并为直播课堂的平台设计提供指导和建议。
论文简介
本研究对参与直播课程的189名高中生进行了调查,结果表明,在当前直播课堂的系统设计中,相比于学生之间的社交互动行为,学生与老师的社交互动行为占了主导地位。同时,本研究还探索了影响社交互动行为的因素,结果发现,直播技术能够提高学生在课堂中的归属感和与其他参与者的感情联结,并提高学生上课的愉悦感,从而提高学习的积极性,促进学生在课堂中与老师进行更多的社交互动,带来更好的学习效果和更高的满意度。
论文节选
滑动查看更多
2021年祝语
脚踏实地,实事求是,厚积薄发,天道酬勤!
张正超
土木工程系
主要研究方向围绕交通大数据。已发表学术论文6篇,其中SCI论文5篇,EI论文1篇,有多篇论文发表于交通领域国际顶级、知名期刊。荣获2019年度国家奖学金,参与国家级、省部级课题各一项。
成果展示
论文题目
大规模路网多步交通速度预测:一种时空深度学习方法
选题缘起
随着社会经济的快速发展,城市中的交通拥堵问题呈现出蔓延趋势。利用交通预测信息规避未来潜在拥堵的主动式交通管理方法成为了关注的热点。然而,已有的交通预测模型难以精准地刻画交通网络中复杂的时空关联规律且在多步预测的情形下存在着误差累计问题。通过亲身参与大数据竞赛,我发现深度学习方法在多种大规模竞赛任务上取得了显著优于传统方法的效果。结合自己的专业知识,并进一步通过文献调研,验证了将定制化的深度学习模型应用于交通预测问题的可行性及创新性。由此,我开始了这项研究工作的探索之旅。
论文简介
针对大规模交通路网交通状态多步预测的问题,论文提出了全新的端对端深度学习架构。首先,通过图卷积神经网络对于复杂的路网拓扑关联进行刻画,进一步采用序列到序列模型捕捉时序变化趋势。通过融合注意力机制使模型能够有效改善长距离序列关联性减弱的问题,同时提出了融入了更多维度的信息的改进训练算法。利用北京市二环以及天津市核心区的两个大规模路网进行算例实验,结果显示所提出模型的效果显著优于已有的经典基准模型。针对深度学习广为诟病的“黑箱问题”,探索了模型的可解释性。从特征重要度及参数的时空关联性给出了交通场景下的理解分析。
论文节选
滑动查看更多
2021年祝语
用心感受生活,探索更多的美好。
张恩嘉
城乡规划专业博士生
清华大学建筑学院城乡规划专业直博三年级学生,研究方向为数据增强设计与新城市科学,致力于探索新数据和新方法在认识、理解城市及支持城市设计等方面的应用潜力。曾获2019年硕士研究生国家奖学金及多项学科设计、模型、论文竞赛奖。
成果展示
论文题目
数字经济时代的城市商业重构与治理——基于数据透视的商圈识别、分类与评价
选题缘起
在学习大数据科学与应用系列讲座中,美团大数据专题的相关讲座引起了我对基于外卖的在家消费情景与基于团购券及扫码机的在店消费场景的关注。幸运的是,当时我所在的实验室与美团研究院正在开展一项关于城市数字商圈研究的长期合作项目。基于对该课题的兴趣和在大数据能力提升项目课程中学习到的数据处理、分析及可视化的方法,我主动申请并参与到该项目中。至今,我本人作为主要负责人和核心成员已完成两期项目研究报告。
论文简介
数字经济时代,城市传统的商业活动形式发展转变。这种转变不仅体现在以外卖为代表的在家消费场景的拓展,也体现在受线上购物冲击后,线下零售的体验转型,还体现在受线上评价和算法推荐的消费引导。基于以上背景,本研究旨在依托美团点评平台上的消费数据,划定数字时代商圈的四重边界——实体空间范围、在家消费范围、在店消费范围以及潜在影响范围,并评估商圈的发展情况,探索数字时代城市商圈发展的规律及特点。
论文节选
滑动查看更多
2021年祝语
希望大数据能力提升项目能够惠及更多的同学,期待更多跨学科的突破性成果在此萌芽。也祝各位老师/同学在新的一年里身体健康、工作/学业顺利!
编辑:黄继彦
校对:汪雨晴