特邀报告 – NCIG 2020 第二十届全国图象图形学学术会议

潘云鹤院士

浙江大学

高文院士

北京大学

胡事民教授

清华大学

Dr.Yan Shuicheng

CTO of YITU

讲者介绍：

潘云鹤院士

浙江大学

题目：视觉智能的五个基本问题

报告简介:报告指出，近年AI热潮的形成动力之一，是图形识别水平的快速提升。视觉智能对AI很重要。进而分析视觉智能的五大基本问题，即视觉感知、视觉形象思维模拟、视觉知识表达、视觉知识的学习、跨媒体的多重知识表达。最后重点阐述视觉知识概念和命题，分析了它与迄今为止AI所用知识表达方法不同的特点，其中视觉概念具有典型（prototype）与范畴结构、层次结构与动作结构等要素。视觉概念能构成视觉命题，包括场景结构与动态结构，视觉命题能构成视觉述事。指出重构计算机图形学成果可实现视觉知识表达及其推理与操作，重构计算机视觉成果可实现视觉知识的学习。实现视觉知识表达、推理、学习和应用技术的研究是发展新的视觉智能的关键，也是促进AI2.0取得重要突破的关键技术。

个人简介：潘云鹤，中国工程院院士、浙江大学教授。原中国工程院常务副院长、浙江大学校长。兼任国务院学位委员会委员、国家教材委员会委员、国家新一代人工智能战略咨询委员会组长、中国人工智能产业发展联盟理事长、中国创新设计产业战略联盟理事长、中国发明协会理事长、中国战略性新兴产业发展专家咨询委员会副主任、中国图象图形学学会名誉理事长等职。
潘云鹤是中国智能CAD和计算机美术领域的开拓者之一。他长期从事人工智能、计算机图形学、CAD和工业设计的研究，在计算机美术、智能CAD、计算机辅助产品创新、虚拟现实和数字文物保护、数字图书馆、智能城市和知识中心等领域，承担过多个重要科研课题，创新性地提出跨媒体智能、数据海、智能图书馆、人工智能2.0、视觉知识等概念，发表多篇研究论文，取得了一系列重要研究成果，多次获得国家科技奖励。

高文院士

北京大学

题目：数字视网膜 – 城市大脑从云计算走向端边云混合的体系架构

报告简介:智能城市浪潮使得城市云计算系统绝大部分算力被图像和视频的检索与分析所消耗，而且随着应用的普及对算力的需求越来越大，资金投入也越来越大。为了缓解此矛盾，城市云视觉系统中越来越多的视频设备从传统摄像机升级为智能终端或者智能边缘设备。然而，对于终端和边缘设备到底应该具备多少智能，以及云计算系统如何平衡系统的一致性与智能性，仍有一些不同争论。人类视觉系统（HVS）经历了数亿年的进化达到其目前的状态，它可能还不完善，但比任何现有的计算机视觉系统要好得多，不论是基于云计算还是超级计算机系统。大多数的人工视觉系统是由摄像机和计算机组成的，对人类来说就相当于眼睛和大脑。但与人类相比，两者之间的视觉通路模型水平很低，几乎就是简单通信链路。人眼和大脑之间的通路模型是相当复杂的，但高能效和全局准确，它是由自然选择进化而来。本报告将介绍讨论一种新的思路，即通过类人视觉系统的视觉通路模型（称为数字视网膜）来改进云视觉系统，从云计算逐步走向端边云混合的体系结构，其中端负责视频的压缩以及特征的抽取与压缩，边负责特征有效汇集与模型更新，云负责分析与决策。端边云结构将大大提高系统的响应速度，减少云的投资和电力消耗，使得城市大脑更加高效和智能。数字视网膜框架模型有三组关键特征，细节将在报告中给出。

个人简介：高文，北京大学博雅讲席教授。1982年于哈科大获得学士学位，1985年于哈工大获得硕士学位，1988年和1991分别获得哈工大计算机应用博士学位和东京大学电子工程博士学位。1991至1996年就职于哈尔滨工业大学，1996至2006就职于中国科学院计算技术研究所，2006年2月至今就职于北京大学。 IEEE Fellow、ACM Fellow、中国工程院院士。他的研究领域为多媒体和计算机视觉，包括视频编码、视频分析、多媒体检索、人脸识别、多模态接口和虚拟现实。他最常被引用的工作是基于模型的视频编码与基于特征的对象表达。他先后出版著作七本，合作发表300余篇期刊论文、700余篇国际会议论文。先后多次获得国家科技进步奖、国家技术发明奖、国家自然科学奖等学术奖励。

胡事民教授

清华大学

题目：可视媒体内容生成：从数据驱动到深度学习

报告简介:可视媒体内容生成是计算机图形学的重要研究分支，强调与视觉感知、人工智能的结合，自动或交互地合成逼真图像视频内容，为数字媒体、城市街景、虚拟现实等领域提供内容支撑。从历史发展来看，可视媒体内容生成经历了从数据驱动到深度学习的方法演变。本报告将回顾可视媒体内容生成的研究进展，介绍基于互联网海量可视媒体和基于生成对抗网络的图像视频生成工作，从模型和平台的角度探讨可视媒体内容生成的发展趋势，并展望其研究与应用前景。

个人简介：胡事民，清华大学计算机系教授、北航虚拟现实技术与系统国家重点实验室主任。1996年毕业于浙江大学，获博士学位。2002年获得国家杰出青年基金资助，2006-2015年担任国家973计划项目首席科学家，2007年入选教育部长江学者特聘教授，2015年成为国家自然科学基金委创新群体负责人。曾任美国Solid Modeling Association(2011-12)的执委会主席、 IEEE Transactions on Visualization and Computer Graphics副主编，现任亚洲计算机图形学学会副主席、Computational Visual Media (Springer)主编，以及CAD (Elsevier), Computer & Graphics (Elsevier)等多个国际刊物的编委。胡事民教授主要研究领域为计算机图形学、虚拟现实、智能信息处理与系统软件等，在ACM Transactions on Graphics，IEEE Transactions on Visualization and Computer Graphics以及ACM SIGGRAPH，IEEE CVPR等重要刊物和国际会议上发表论文100多篇。培养博士研究生 40余名，其中一名博士生的论文入选全国百篇优秀博士学位论文, 三名博士生获中国计算机学会优秀博士论文奖，三名博士生获得海外名校教职。

Dr. Yan Shuicheng

CTO of YITU，IEEE Fellow, IAPR Fellow and ACM Distinguished Scientist

Title: AI: From Artificial Intelligence to Affordable Intelligence

Abstract: In this talk, I mainly introduce the research and practices of making AI affordable. Two orthogonal lines of efforts shall be included: 1) research towards improving the efficiency of the AI models, and 2) research towards mutually promoting AI algorithms and AI chip for efficient AI solutions to customers.

Dr. Yan Shuicheng is currently CTO of YITU. He is an IEEE Fellow, IAPR Fellow and ACM Distinguished Scientist. His research areas include computer vision, machine learning and multimedia analysis. Till now, he has published over 600 papers in top international journals and conferences, with Google Scholar Citation over 40,000 times and H-index 100. He had been among “Thomson Reuters Highly Cited Researchers” in 2014, 2015, 2016, 2018, 2019.
Dr. Yan’s team has received winner or honorable-mention prizes for 10 times of two core competitions, Pascal VOC and ImageNet (ILSVRC), which are deemed as “World Cup” in the computer vision community. Also his team won over 10 best paper or best student paper prizes and especially, a grand slam in ACM MM, the top conference in multimedia, including Best Paper Award, Best Student Paper Award and Best Demo Award.

特邀企业报告

赵斌强资深算法专家

阿里巴巴

赵斌强资深算法专家

阿里巴巴

题目：3D视觉在新零售领域的探索及应用

报告简介:需求和供给的匹配效率是零售的精髓。通过将物理世界的商品和服务变成虚拟的3D模型，可以大大提高匹配效率，为商家、消费者和设计师提供更先进的服务和产品体验。本次报告重点介绍3D结合机器视觉的技术，在家具家装行业的应用，通过技术降低设计师和消费者产品的智能化水平和易用性，为海量普通用户提供优质价廉甚至免费的设计方案。解决方案涉及户型重建、风格搭配、智能布局等各3D和视觉算法。

个人简介：阿里巴巴资深算法专家，2006年硕士毕业于清华大学自动化系，2008年加入阿里巴巴，在推荐、搜索和广告算法领域工作十余年，对机器学习、推荐算法与机制方面有深入的研究。曾开辟了首图、会场、淘宝直播等算法并建设通用TPP平台。现带领淘系技术部-商业机器智能部团队，负责淘宝、天猫、聚划算、闲鱼和淘宝直播的运营智能化、用户增长、内容社区、3D家装智能设计和端上智能等算法方向。