受疫情影响,计算学部第十二期青年学者沙龙于10月8日中午在线上举行,本次沙龙邀请的嘉宾是计算学部计算机科学技术研究所的丁小欧博士,讲座题目为“工业大数据质量管理与数据清洗”。来自学部各研究中心和实验室的20余位师生出席了本次活动,活动由生物信息学研究中心胡杨副教授主持。
工业领域积累了丰富且大量的数据,除了大数据的“4V”特征,工业大数据更具有反映工业逻辑的高通量、强关联、低质量特征,工业数据质量管理及劣质数据修复技术需求迫切。系统性、智能化的数据清洗和数据治理也是工业大数据研究领域亟需实现突破的关键问题。
丁小欧博士在本次沙龙中首先提出了工业大数据中存在的数据质量问题、数据质量管理难点、执行数据清洗任务所面临的挑战;详细介绍了面向工业领域的劣质数据检测技术以及其所在团队在工业大数据清洗上的研究进展;最后,丁晓欧博士简要介绍工业大数据清洗的未来研究方向,并与在线师生就感兴趣的话题进行了热烈交流。
计算学部青年学者沙龙为广大青年教师提供了一个互动交流的平台,旨在关注每一位青年教师的专业化发展,不断提高青年教师的师德修养和业务能力,丰富青年教师的业余生活,进而达到青年教师彼此科研互助、人文互补、相互扶持、共同发展的最终目的。
报告人简介:
丁小欧,师资博士后、助理教授。主要研究方向为大数据质量管理、数据清洗、时序数据挖掘、工业大数据分析等。在TKDE、VLDB、CIKM、APWeb等数据科学领域国际高水平期刊和会议上发表学术论文11篇、国内高水平刊物发表论文4篇。参与国家自然科学基金、国家重点研发计划课题、中国计算机学会-华为数据库创新研究计划等多个项目的研究工作。是工业时序数据清洗系统Cleanits的主要研发人员,获2019年度人民网优秀技术课题三等奖、2020年第五届中国科协优秀科技论文奖。