学术讲座 | 今日哈工大：哈尔滨工业大学校内综合信息网

讲座报告：学术讲座

时间	2021年06月18日 09:00 - 16:00
地点	一校区活动中心216；科学园科创大厦 J1622
网址

应计算学部机器学习研究中心邀请，南京理工大学潘金山教授、中科院信工所任文琦副研究员、香港中文大学(深圳) 张瑞茂助理教授、天津大学张长青副教授、王旗龙副教授、曹兵助理研究员将于2021年6月18日到访哈工大，并做学术报告，欢迎参加。

上午报告安排

报告时间：2021年6月18日（星期五）9:00-12:00

特邀讲者：潘金山博士、张长青博士、任文琦博士、张瑞茂博士

论坛地点：一校区活动中心216

主持人：任冬伟博士、武小荷博士

下午报告安排

报告时间：2021年6月18日（星期五）14:30-16:00

特邀讲者：王旗龙博士、曹兵博士

论坛地点：科学园科创大厦 J1622

主持人：任冬伟博士、武小荷博士

上午报告安排：

9:10-9:50

1. 报告一题目：知识驱动的图像/视频复原网络

报告摘要：基于深度学习的图像/视频复原方法取得了显著的效果，然而现有的算法大多依赖模型的容量，网络结构设计上没有有效利用图像/视频退化过程的性质。针对这一问题，首先介绍基于统计先验知识建模的相关复原算法，并以此为基础讨论如何利用成像模型和先验知识建模的方法约束深度神经网络，使得深度神经网络能够有效地刻画并解决图像/视频复原及增强问题。

讲者简介：潘金山，南京理工大学计算机科学与工程学院教授、博士生导师。主要从事图像/视频复原与增强等相关底层视觉问题的研究。在计算机视觉和人工智能领域的顶级国际期刊（IEEE TPAMI、IJCV等）和国际学术会议（CVPR、ICCV、ECCV等）上发表论文60余篇，其中CCF推荐A类论文40余篇。研究工作获得国家自然科学基金优秀青年科学基金资助、中国人工智能学会优秀博士学位论文奖以及辽宁省优秀博士学位论文奖。

9:50-10:30

2. 报告二题目：多模态机器学习：从精准到可信

报告摘要：多模态人工智能技术正在被广泛应用到智能医疗等重要领域。精准、可靠的多模态机器学习成为支持重要应用的关键技术。多模态数据为智能系统决策提供了丰富信息，使得多模态智能系统可以“兼听则明”，提高分类和预测准确性。然而，在许多代价敏感场景中多模态融合及决策的可信性往往更加重要。本报告将介绍多模态机器学习中面向精准的融合技术和面向可信的融合技术，并重点介绍一种端到端的可信多模态融合技术，在多模态协同学习（兼听则明）时，对不同模态进行证据估计（信而有征），从而支持融合及决策的可靠性和稳定性。

讲者简介：张长青，天津大学智能与计算学部副教授、博士生导师。在IEEE TPAMI / IJCV / NeurIPS / ICLR等期刊和国际会议上发表论文90余篇，9篇论文单篇引用超过100次，4篇论文入选CVPR/NeurIPS口头报告或亮点论文，4篇论文入选ESI高被引论文，1篇论文入选ESI热点论文。获得重要国际会议论文奖2项。主持和参与多项国家自然基金面上项目/重点项目、国家重点研发计划项目。

10:30-11:10

3. 报告三题目：图像复原及其轻量级网络模型设计

报告摘要：日常生活中，由于不可控拍摄环境（抖动、暗光）及恶劣气候（雨、雪、雾）等影响，手机摄影或监控视频往往伴随着图象质量的退化。本次报告主要对面向图像恢复及增强的深度模型进行介绍，分别针对图像去模糊、去雾、超分辨等不同增强任务提出针对性的深度网络模型，通过结合传统图像先验知识和深度网络特征学习的方法，对图像质量进行恢复和增强。在此基础上，进一步介绍可应用于4K超高清图像视频增强的轻量级网络模型设计方法。

讲者简介：任文琦，中国科学院信息工程研究所信息工程国家重点实验室副研究员。天津大学与加州大学Merced分校联合培养博士。先后在微软亚洲研究院、腾讯人工智能实验室、滴滴人工智能实验室访问研究。主要研究方向包括图像视频处理与增强等相关问题。在本领域内国际主要期刊和会议IEEE TPAMI/TIP/TIFS、IJCV，CVPR/ICCV/NeurIP/ECCV等发表学术论文40余篇。曾获中国计算机学会优秀博士论文奖、CCF-腾讯犀牛鸟基金卓越奖、及中办科学技术进步一等奖（排名第四）等。并入选了微软亚洲研究院“铸星计划”、北京市科协“青年人才托举工程”、北京市“科技新星”等。

11:10-11:50

4. 报告四题目：面向人体服饰视觉内容的分析、编辑与生成技术

报告摘要：随着互联网媒体技术的发展，虚拟主播、虚拟换装、交互式互动游戏、在线会议室等智能化产品收获了巨大用户群。与之相关的面向人体视觉内容的分析、编辑以及生成技术也受到了学界和业界的广泛关注。然而当前技术在面对细粒度生成、小样本学习等问题时依然存在生成精度不高、泛化能力不佳等问题。在本报告中，将首先针对虚拟换装问题，介绍如何利用多模态知识蒸馏技术以及循环一致性技术获得高精度的换装结果。同时，针对服饰关键点检测问题，将介绍一种新颖的元学习方法，从而提升模型在针对不同服饰类型进行关键点检测时的迁移能力。

讲者简介：张瑞茂，香港中文大学（深圳）数据科学学院研究助理教授，副研究员。分别于2011年和2016年在中山大学数据科学与计算机学院获得学士与博士学位。2013年到2014年间以访问生的身份赴香港理工大学电子计算学系从事计算机视觉相关领域的研究。在2017年到2019年间，在香港中文大学多媒体实验室担任博士后研究员。后于2019年加入商汤科技研究院，任高级研究员至2021年2月。主要的研究领域为计算机视觉、深度学习以及智能多媒体技术。近几年在IEEE T-PAMI, CVPR, ICCV, ICML等计算机视觉、机器学习知名期刊和会议发表论文30余篇，其中包括一篇ESI高被引论文。同时近年来也在多个计算机视觉国际挑战赛中夺魁，如2017年Youtube-8M视频分类挑战赛金奖，2020年AIM图像信号处理挑战赛冠军等。

下午报告安排：

14:30-15:10

1. 报告五题目：时空敏感的二阶池化网络及其在视频识别中的应用

报告摘要：在视频识别任务中，视频片段的全局表示对最终的识别性能有着重要的影响。然而，现有的视频架构通常使用一种简单的全局平均池化方法来生成视频表达，这种方法无法捕获复杂的视频动态变化。本文提出了一种基于时空敏感协方差池化的深度架构，可以生成强有力的视频表示。所提出方法可以有效的利用视频特征中高阶统计信息，从而捕获复杂的时间动态变化。在6个标准数据集上的大量实验结果表明提出的时空敏感的二阶池化网络明显优于同类算法，并具有较强泛化能力。

讲者简介：王旗龙，天津大学智能与计算学部副教授，2018年毕业于大连理工大学，获得博士学位，主要研究方向是深层网络架构设计与优化、视频图像分析。目前发表学术论文40余篇，大多数发表在国际顶级会议CVPR/ICCV/ECCV/ NIPS以及IEEE T-PAMI/IEEE T-IP/IEEE T-CSVT等国际权威期刊，谷歌学术引用1500余次。曾获得中国人工智能学会优秀博士论文，入选2018年博士后创新人才计划。

15:20-16:00

2. 报告六题目：多模态图像重建与识别

报告摘要：多模态图像被广泛应用于医学诊断、公共安全、科学探测以及智能无人系统环境感知等领域，以从不同视角不同层面获取观测对象的信息。由于成像条件复杂多变，不同模态图像质量参差不齐，即使是同一模态数据不同部位也可能存在不同的噪声干扰，单一模态很难提供有效且完备的信息。而图像多模态重建与识别是指综合利用多模态图像之间内容的关联性、表达的互补性和目标的一致性，对缺失的图像模态进行重建，或由一个域的图像识别另外一个图像的过程。本报告将介绍现有的现有的多模态图像重建方法以及我们在此方向上的进展。

讲者简介：曹兵，男，2020年6月博士毕业于西安电子科技大学。现任天津大学智能与计算学部助理研究员。2019年4月至2020年7月在美国北卡罗来纳大学-教堂山分校访问。致力于计算机视觉和统计机器学习方面的研究，在多模态图像重建与识别进行了深入研究，内容包括了多模态人脸图像重建与识别，多模态医学图像处理等，发表多篇国际期刊和会议论文。

发布：周小燕审核：王忠杰来源：计算学部

点击微信扫一扫

讲座报告：学术讲座

关联阅读

活动预报

最新发布
更多

相关链接

相关服务

相关站点

讲座报告：学术讲座

关联阅读

活动预报

recommendation 网站推荐 更多

recommendation 读者推荐 更多

最新发布 更多

相关链接

相关服务

相关站点

recommendation

网站推荐
更多

recommendation

读者推荐
更多

最新发布
更多