作为深圳市人工智能学会(SAAI)的品牌活动,青年研享论坛旨在为人工智能、计算机视觉、模式识别与机器学习研究领域内的粤港澳大湾区青年学者(包括硕士/博士研究生、博士后、青年教师等)提供一个深层次学术交流平台,促进青年学者的思想交流、灵感碰撞与学术合作。
国际计算机视觉与模式识别大会CVPR(Computer Vision and Pattern Recognition)是计算机视觉领域的三大顶级会议(CVPR/ICCV/ECCV)之一,每年召开一次,其录用的论文代表了计算机视觉与模式识别领域最新的发展方向和研究水平。在谷歌学术2023所有学科期刊和会议总榜中,CVPR排名第4(前3依次为Nature/NEJM/Science)。CVPR 2024将于2024年6月17日至21日在美国西雅图举行。
本次SAAI青年研享论坛-CVPR2024深圳分享会将于2024年4月26日(周五)下午2点到5点半在北京大学深圳研究生院会议中心举行。
本次分享会从北京大学深圳研究生院、清华大学深圳国际研究生院、哈尔滨工业大学(深圳)、深圳大学、南方科技大学、深圳北理莫斯科大学、中山大学、华南理工大学、香港科技大学、香港理工大学、香港城市大学、香港中文大学(深圳)、西安交通大学、国防科技大学等报名中遴选出28篇优秀论文,特邀请论文作者提前分享CVPR2024的研究成果,内容涵盖扩散模型、AIGC、多模态大语言模型、底层视觉、视觉检测等多个领域(论文列表见最后)。同时邀请到OPPO计算影像专家联谊会的两位成员——香港理工大学教授、OPPO研究院AI科学家张磊老师和北京大学深圳研究生院助理教授张健老师进行最新研究成果分享。
本次分享会活动时间安排
14:00 | 正式开始 |
14:00-14:05 | 分享会开始、领导致辞、全体合影 |
14:05-14:15 | OPPO实力展示和第一轮幸运抽奖 |
14:15-14:35 | 张磊老师报告:迈向复原一切图像的模型(Restore Any Image Model) |
14:35-14:55 | 张健老师报告:AIGC背景下图像内容安全 |
14:55-15:35 | 精选5位作者进行论文汇报(每人8分钟) |
15:40-17:20 | Poster自由交流环节,对你最感兴趣的论文投票 |
17:20-17:30 | 颁发最佳Poster奖和第二轮幸运抽奖 |
17:30 | 活动结束 |
现免费开放280名线下参会名额,欢迎青年学生、老师、研究人员参加,与作者以及彼此都能够面对面展开深入交流,提前亲身感受顶会的魅力,结识志同道合的伙伴,碰撞灵感火花,加强讨论合作。
学会为本次分享会的所有参会者免费提供饮用水和精美零食,尽量创造一个舒适的学术交流平台。本次分享会将评出最佳Poster论文奖5名,幸运参会奖5名。每位获奖者将获得精美OPPO耳机1副。
线下参会者报名链接:https://docs.qq.com/form/page/DZkFScEdvRGphUVZt
请于2024年4月25日中午12:00 点前填表进行报名登记,以便我们能够帮助提前制作你的铭牌,方便大家交流。
线下活动时间:北京时间2024年4月26日(星期五)下午2点到5点。
线下活动地点:
北京大学深圳研究生院会议中心(深圳市南山区西丽湖丽水路2199号西丽大学城北大园区J栋,离会场最近的校门为北大深研院北门)
注:西丽深圳大学城已经对外开放,提前或者现场登记就可以从北大、清华、哈工大各个门进入。届时专家学者老师同学共济一堂,一定收获满满,欢迎大家预留时间参加。
及时了解更多信息可扫码加入SAAI青工委4月26日的本次活动交流群
(邀请入群,请备注单位+姓名添加工作人员微信)
报告嘉宾介绍:
报告嘉宾:张磊,香港理工大学/OPPO研究院
嘉宾简介:张磊教授(IEEE Fellow)于2006年加入香港理工大学电子计算学系,2017年起任职讲座教授,长期致力于计算机视觉、图像处理、模式识别等方向的研究,是底层视觉方面的国际权威学者,担任IEEE Trans. on Image Processing(TIP)的高级编委,IEEE Trans. on Pattern Analysis and Machine Intelligence(TPAMI)、SIAM Journal of Imaging Sciences 等多个国际期刊的编委。从2015年至2023年,张教授连续被评为Clarivate Analytics Highly Cited Researcher。张磊教授现亦担任OPPO研究院AI科学家,致力于AI影像前沿技术在手机等产品中的落地,让科技更好地回馈社会。
报告题目:迈向复原一切图像的模型(Restore Any Image Model)
报告摘要:图像复原和增强是一个被研究多年的底层视觉基础问题,但在实际的拍摄场景中,我们依然碰到很多挑战。AI大模型,特别是生成式扩散模型的出现,突然间给我们打造Restore Any Image Model(RAIM)的梦想带来了曙光。那RAIM离我们还有多远?生成式模型能够解决真实场景拍照的挑战吗?本报告将尝试对这些问题做些粗浅的探讨,并对CVPR2024的RAIM挑战赛的结果做介绍,期待有志于研发RAIM的学生和学者,能够和我们一起在探索RAIM的道路上前行。
个人主页:https://www4.comp.polyu.edu.hk/~cslzhang/
报告嘉宾:张健,北京大学
嘉宾简介:张健,北京大学深圳研究生院信息工程学院助理教授/研究员、博士生导师,视觉信息智能学习实验室(VILLA)负责人,深圳市人工智能学会青工委主任,OPPO计算影像专家联谊会委员。主要研究方向为底层视觉、图像重建、图像内容生成与安全,以第一/通讯作者在ACM/IEEE汇刊和CCF-A类期刊/会议上发表论文60余篇,谷歌学术引用7300余次,h-index值为43,连续四年入选斯坦福全球前2%顶尖科学家榜单,获得国际期刊/会议最佳论文奖三次、全球挑战赛冠军一次。致力于产学研相结合,研究成果应用于Stability AI、Hugging Face、兔展等AIGC产品中。
报告题目:AIGC背景下图像内容安全
报告摘要:随着AIGC技术的飞速发展,其在伪造和篡改领域的滥用已引起广泛关注。在此背景下,保护图像内容的安全性显得尤为迫切。本报告将分享我们团队在图像内容版权保护与数字取证方面的探索,尝试探讨当前所面临的挑战,并对未来的发展趋势做一点展望。
论文详情
标题:Dual Memory Networks: A Versatile Adaptation Approach for Vision-Language Models
作者:Yabin Zhang, Wenjie Zhu, Hui Tang, Zhiyuan Ma, Kaiyang Zhou, Lei Zhang
单位:香港理工大学,香港科技大学,香港浸会大学
标题:EditGuard: Versatile Image Watermarking for Tamper Localization and Copyright Protection
作者:Xuanyu Zhang, Runyi Li, Jiwen Yu, Youmin Xu, Weiqi Li, Jian Zhang
单位:北京大学深圳研究生院
标题:360DVD: Controllable Panorama Video Generation with 360-Degree Video Diffusion Model
作者:Qian Wang, Weiqi Li, Chong Mou, Xinhua Cheng, Jian Zhang
单位:北京大学深圳研究生院
标题:DiffEditor: Boosting Accuracy and Flexibility on Diffusion-based Image Editing
作者:Chong Mou, Xintao Wang, Jiechong Song, Ying Shan, Jian Zhang
单位:北京大学深圳研究生院,腾讯
标题:BT-Adapter: Video Conversation is Feasible Without Video Instruction Tuning
作者:Ruyang Liu, Chen Li, Yixiao Ge, Thomas H. Li, Ying Shan, Ge Li
单位:北京大学深圳研究生院,腾讯
标题:GraCo: Granularity-Controllable Interactive Segmentation
作者:Yian Zhao, Kehan Li, Zesen Cheng, Pengchong Qiao, Xiawu Zheng, Rongrong Ji, Chang Liu, Li Yuan, Jie Chen
单位:北京大学深圳研究生院,厦门大学,清华大学
标题:DETRs Beat YOLOs on Real-time Object Detection
作者:Yian Zhao, Wenyu Lv, Shangliang Xu, Jinman Wei, Guanzhong Wang, Qingqing Dang, Yi Liu, Jie Chen
单位:北京大学深圳研究生院,百度,天津大学
标题:FaceChain-SuDe: Building Derived Class to Inherit Category Attributes for One-shot Subject-Driven Generation
作者:Pengchong Qiao, Lei Shang, Chang Liu, Baigui Sun, Xiangyang Ji, Jie Chen
单位:北京大学深圳研究生院,阿里巴巴,清华大学
标题:Selective Hourglass Mapping for Universal Image Restoration Based on Diffusion Model
作者:Dian Zheng, Xiao-Ming Wu, Shuzhou Yang, Jian Zhang, Jian-Fang Hu, Wei-Shi Zheng
单位:中山大学,北京大学深圳研究生院
标题:Latent Modulated Function for Computational Optimal Continuous Image Representation
作者:Zongyao He, Zhi Jin
单位:中山大学
标题:Learned Scanpaths Aid Blind Panoramic Video Quality Assessment
作者:Kanglong FAN, Wen Wen, Mu Li, YIFAN PENG, Kede Ma
单位:香港城市大学,哈尔滨工业大学(深圳),香港大学
标题:Modular Blind Video Quality Assessment
作者:Wen Wen, Mu Li, Yabin ZHANG, Yiting Liao, Junlin Li, Li zhang, Kede Ma
单位:香港城市大学,香港中文大学(深圳),字节跳动
标题:Perceptual Assessment and Optimization of HDR Image Rendering
作者:Peibei Cao, Rafal Mantiuk, Kede Ma
单位:香港城市大学,剑桥大学
标题:Genuine Knowledge from Practice: Diffusion Test-Time Adaptation for Video Adverse Weather Removal
作者:Yijun Yang, Hongtao Wu, Angelica I. Aviles-Rivero, Yulun Zhang, Jing Qin, Lei Zhu
单位:香港科技大学(广州),剑桥大学,上海交通大学,香港理工大学
标题:SEED-Bench: Benchmarking Multimodal Large Language Models
作者:Bohao Li, Yuying Ge, Yixiao Ge, Guangzhi Wang, Rui Wang, Ruimao Zhang, Ying Shan
单位:香港中文大学(深圳),香港大学,腾讯,新加坡国立大学,复旦大学,香港中文大学(深圳)
标题:A Dynamic Kernel Prior Model for Unsupervised Blind Image Super-Resolution
作者:Zhixiong Yang, Jingyuan Xia, Shengxi Li, Xinghua Huang, Shuanghui Zhang, Zhen Liu, Yaowen Fu, Yongxiang Liu
单位:国防科技大学,北京航空航天大学
标题:DiffSCI: Zero-Shot Snapshot Compressive Imaging via Iterative Spectral Diffusion Model
作者:Zhenghao Pan, Haijin Zeng, Jiezhang Cao, Kai Zhang, Yongyong Chen
单位:哈尔滨工业大学(深圳),根特大学,苏黎世联邦理工学院
标题:DiffCast: A Unified Framework via Residual Diffusion for Precipitation Nowcasting
作者:Demin Yu, Xutao Li, Yunming Ye, Baoquan Zhang, Luo Chuyao, Kuai Dai, wangrui, Chenxunlai
单位:哈尔滨工业大学(深圳),深圳市气象局
标题:RTracker: Recoverable Tracking via PN Tree Structured Memory
作者:Yuqing Huang, Xin Li, Zikun Zhou, Yaowei Wang, Zhenyu He, Ming-Hsuan Yang
单位:哈尔滨工业大学(深圳),鹏城实验室,加利福尼亚大学默塞德分校
标题:Unsupervised Deep Unrolling Networks for Phase Unwrapping
作者:Zhile Chen, Yuhui Quan, Hui Ji
单位:华南理工大学,新加坡国立大学
标题:Depth-Aware Concealed Crop Detection in Dense Agricultural Scenes
作者:Liqiong Wang, Jinyu Yang, Yanfu Zhang, Fangyi Wang, Feng Zheng
单位:三峡大学,伯明翰大学,南方科技大学
标题:CoSeR: Bridging Image and Language for Cognitive Super-Resolution
作者:Haoze Sun, Wenbo Li, Jianzhuang Liu, Haoyu Chen, Renjing Pei, Xueyi Zou, Youliang Yan, Yujiu Yang
单位:清华大学深圳研究生院,华为,中国科学院深圳先进技术研究院,香港科技大学(广州)
标题:Universal Segmentation at Arbitrary Granularity with Language Instruction
作者:Yong Liu, Cairong Zhang, Yitong Wang, Jiahao Wang, Yujiu Yang, Yansong Tang
单位:清华大学深圳国际研究生院,字节跳动,上海人工智能实验室
标题:Open-Vocabulary Segmentation with Semantic-Assisted Calibration
作者:Yong Liu, Sule Bai, Guanbin Li, Yitong Wang, Yansong Tang
单位:清华大学深圳国际研究生院,中山大学,字节跳动
标题:RTMO: Towards High-Performance One-Stage Real-Time Multi-Person Pose Estimation
作者:Peng Lu, Tao Jiang, Yining Li, Xiangtai Li, Kai Chen, Wenming Yang,
单位:清华大学深圳国际研究生院,上海人工智能实验室,南洋理工大学
标题:Narrative Action Evaluation with Prompt-Guided Multimodal Interaction
作者:Shiyi Zhang, Sule Bai, Guangyi Chen, Lei Chen, Jiwen Lu, Junle Wang, Yansong Tang
单位:清华大学深圳国际研究生院,卡内基梅隆大学,北京科技大学,腾讯
标题:Benchmarking the Robustness of Temporal Action Detection Models Against Temporal Corruptions
作者:Runhao Zeng, Xiaoyong Chen, Jiaming Liang, Huisi Wu , Guang-Zhong Cao , Yong Guo
单位:深圳北理莫斯科大学,深圳大学,马克斯普朗克研究所
标题:Equivariant Multi-Modality Image Fusion
作者:Zixiang Zhao, Haowen Bai, Jiangshe Zhang, Yulun Zhang, Kai Zhang, Shuang Xu, Dongdong Chen, Radu Timofte, Luc Van Gool
单位:西安交通大学,上海交通大学,西北工业大学,赫瑞-瓦特大学,维尔茨堡大学,苏黎世联邦理工学院