特邀报告

高文 院士

北京大学

胡事民 教授

清华大学

Dr. Yan Shuicheng

CTO of YITU

 

讲者介绍:

高文 院士

北京大学

题目:数字视网膜 – 城市大脑从云计算走向端边云混合的体系架构

报告简介:智能城市浪潮使得城市云计算系统绝大部分算力被图像和视频的检索与分析所消耗,而且随着应用的普及对算力的需求越来越大,资金投入也越来越大。为了缓解此矛盾,城市云视觉系统中越来越多的视频设备从传统摄像机升级为智能终端或者智能边缘设备。然而,对于终端和边缘设备到底应该具备多少智能,以及云计算系统如何平衡系统的一致性与智能性,仍有一些不同争论。人类视觉系统(HVS)经历了数亿年的进化达到其目前的状态,它可能还不完善,但比任何现有的计算机视觉系统要好得多,不论是基于云计算还是超级计算机系统。大多数的人工视觉系统是由摄像机和计算机组成的,对人类来说就相当于眼睛和大脑。但与人类相比,两者之间的视觉通路模型水平很低,几乎就是简单通信链路。人眼和大脑之间的通路模型是相当复杂的,但高能效和全局准确,它是由自然选择进化而来。本报告将介绍讨论一种新的思路,即通过类人视觉系统的视觉通路模型(称为数字视网膜)来改进云视觉系统,从云计算逐步走向端边云混合的体系结构,其中端负责视频的压缩以及特征的抽取与压缩,边负责特征有效汇集与模型更新,云负责分析与决策。端边云结构将大大提高系统的响应速度,减少云的投资和电力消耗,使得城市大脑更加高效和智能。数字视网膜框架模型有三组关键特征,细节将在报告中给出。

个人介绍:高文,北京大学博雅讲席教授。1982年于哈科大获得学士学位,1985年于哈工大获得硕士学位,1988年和1991分别获得哈工大计算机应用博士学位和东京大学电子工程博士学位。1991至1996年就职于哈尔滨工业大学,1996至2006就职于中国科学院计算技术研究所,2006年2月至今就职于北京大学。 IEEE Fellow、ACM Fellow、中国工程院院士。他的研究领域为多媒体和计算机视觉,包括视频编码、视频分析、多媒体检索、人脸识别、多模态接口和虚拟现实。他最常被引用的工作是基于模型的视频编码与基于特征的对象表达。他先后出版著作七本,合作发表300余篇期刊论文、700余篇国际会议论文。先后多次获得国家科技进步奖、国家技术发明奖、国家自然科学奖等学术奖励。


胡事民 教授

清华大学

题目:可视媒体的认知计算与交互合成

报告简介:计算机图形学从60年代开始逐步发展为计算机科学中的重要学科方向,并成为虚拟现实、数据可视化、智慧城市等领域的共性基础。计算可视媒体作为图形学的发展和延伸,强调与视觉感知与认知、人工智能和几何学的结合,为人类研究现实世界提供重要手段,蕴涵着无数影响人们认知方式和生活方式的应用。
可视媒体的认知计算从认知和心理学的角度出发,对可视媒体内容进行分析,为诸多可视媒体合成任务提供底层基础。借助认知计算方法,用户可以在场景语义理解层面进行可视媒体的内容生成。本报告首先以图像显著性检测为例介绍可视媒体认知计算的研究进展与代表性成果,然后介绍清华大学可视媒体研究中心在基于认知计算的图像视频交互合成方面的工作:基于互联网数据从草图合成图像(Sketch2Photo),基于人体姿态的图像合成(PoseShop)以及基于文字交互的视频剪辑(Write-a-Video)等,并展望研究与应用前景。

个人介绍:胡事民,清华大学计算机系教授、北航虚拟现实技术与系统国家重点实验室主任。1996年毕业于浙江大学,获博士学位。2002年获得国家杰出青年基金资助,2006-2015年担任国家973计划项目首席科学家,2007年入选教育部长江学者特聘教授,2015年成为国家自然科学基金委创新群体负责人。曾任美国Solid Modeling Association(2011-12)的执委会主席、 IEEE Transactions on Visualization and Computer Graphics副主编,现任亚洲计算机图形学学会副主席、Computational Visual Media (Springer)主编,以及CAD (Elsevier), Computer & Graphics (Elsevier)等多个国际刊物的编委。胡事民教授主要研究领域为计算机图形学、虚拟现实、智能信息处理与系统软件等,在ACM Transactions on Graphics,IEEE Transactions on Visualization and Computer Graphics以及ACM SIGGRAPH,IEEE CVPR等重要刊物和国际会议上发表论文100多篇。培养博士研究生 40余名,其中一名博士生的论文入选全国百篇优秀博士学位论文, 三名博士生获中国计算机学会优秀博士论文奖,三名博士生获得海外名校教职。


Dr. Yan Shuicheng

CTO of YITU,IEEE Fellow, IAPR Fellow and ACM Distinguished Scientist

Title: AI: From Artificial Intelligence to Affordable Intelligence

Abstract: In this talk, I mainly introduce the research and practices of making AI affordable. Two orthogonal lines of efforts shall be included: 1) research towards improving the efficiency of the AI models, and 2) research towards mutually promoting AI algorithms and AI chip for efficient AI solutions to customers.

Dr. Yan Shuicheng is currently CTO of YITU. He is an IEEE Fellow, IAPR Fellow and ACM Distinguished Scientist. His research areas include computer vision, machine learning and multimedia analysis. Till now, he has published over 600 papers in top international journals and conferences, with Google Scholar Citation over 40,000 times and H-index 100. He had been among “Thomson Reuters Highly Cited Researchers” in 2014, 2015, 2016, 2018, 2019.
Dr. Yan’s team has received winner or honorable-mention prizes for 10 times of two core competitions, Pascal VOC and ImageNet (ILSVRC), which are deemed as “World Cup” in the computer vision community. Also his team won over 10 best paper or best student paper prizes and especially, a grand slam in ACM MM, the top conference in multimedia, including Best Paper Award, Best Student Paper Award and Best Demo Award.