CSIG交通视频专委会讲座圆满举办
本网保定讯:12月24日,由中国图象图形学学会(CSIG)主办,CSIG交通视频专委会与我校自动化系、计算机系共同承办的CSIG交通视频专委会讲座在线上举行。本次讲座邀请了北京交通大学赵耀教授和中国科学院自动化研究所的王金桥研究员做特邀报告,讲座由自动化系翟永杰教授和电子与通信工程系赵振兵教授主持。
翟永杰首先介绍了本次讲座的情况和两位特邀嘉宾。CSIG交通视频专委会副主任、北京大学田永鸿教授致辞,田永鸿介绍了交通视频专委会的概况,表达了对与会师生的欢迎和会议组织者的感谢,并希望大家能通过本次讲座了解领域前沿技术并加深交流。自动化系主任王印松教授致辞,王印松希望参会人员能利用此次机会深入探讨领域学术问题,共同进步,并预祝本次讲座圆满成功。
王金桥的报告题目为《基于多模态大模型的智能理解与内容生成》。他从当前人工智能的三大局限出发,指出人工智能正从单模态有监督迈向多模态自监督学习。之后重点介绍了团队开发的全球首个千亿参数级多模态大模型——“紫东太初”,其基础模型包括语言模型、语音模型、视频掩码自监督模型和视觉序列化自监督模型等,具备大规模分布式训练优化架构,在多项国际顶尖竞赛中性能刷榜。最后,王金桥结合卷烟品牌识别和行为识别等具体实例进一步论证了大模型的优势。报告后参会师生针对自己感兴趣的方面进行了提问,王金桥进行了详细解答。
赵耀的报告题目为《人机共友好的深度视频编码》。他首先介绍了研究背景,针对传统视频编码技术对机器不友好的问题,从层次化视频内容感知、特征驱动的视频编码、层间特征增强的视频解码以及人-机视觉特性引导的编码器优化四个方面入手,致力于打造一种视频编解码新范式和人机共友好新形态。最后,赵耀介绍了团队近期的研究工作,包括基于空间重要性的可变码率图像编码算法、基于尺度空间的自适应视频编码算法、基于帧间预测的B帧编码算法,以及基于可变码率的人机多任务编码算法。报告后赵耀与参会师生就相关问题进行了讨论。
本次报告得到了交通视频研究领域学者和相关研究人员的广泛关注,百余名听众通过腾讯会议线上参加了本期活动。
初审:牛杭
审核:石立宁
责任编辑:陈嘉昕