【会员动态】副理事长邹月娴教授带队参加ICASSP 2026国际会议

2026年5月4日至8日,第51届国际声学、语音与信号处理会议(International Conference on Acoustics, Speech and Signal Processing, ICASSP 2026)在西班牙巴塞罗那举办。SAAI常务副理事长兼秘书长,北京大学教授、北大深研院现代信号与数据处理实验室(ADSPLAB/ADSP实验室)主任邹月娴与博士研究生杨绪升作为实验室代表参加了本次会议,展示实验室在语音编解码、多模态感知、对话系统等方向的最新工作。

邹月娴教授与博士研究生杨绪升在会场合影留念

ICASSP由电气电子工程师学会(Institute of Electrical and Electronics Engineers, IEEE)信号处理学会主办,是声学、语音及信号处理领域规模最大、影响力最广的学术会议之一。今年会议吸引了来自全球各地的研究机构与科技企业的参与者,议程涵盖了语音大语言模型、深度生成模型、图神经网络、医学图像分析、多模态情感识别、神经音频编码、视觉-语言模型、联邦学习、鲁棒语音识别、扩散模型、集成感知与通信、可解释机器学习、隐私保护AI、强化学习、时间序列预测等数十个研究方向。

本次会议,ADSP实验室共有六项研究成果被接收:

尹永康等人提出基于音频引导的多模态对齐方法,有效提升了主动说话人检测任务中的边界建模精度。林义凯等人构建自迭代蒸馏框架,较好解决了视觉 – 语言模型在无监督场景下的领域适配难题。杨绪升等人研发超低复杂度神经语音编解码系统,内嵌实时变声模块,可支撑个性化实时语音通信场景落地。万子翔等人面向极端低资源场景,设计了高性能轻量化语音编码方案。熊长柱等人一方面通过信号解耦与动态提示机制构建元网络框架,提升任务导向对话系统的稳定性;另一方面依托大语言模型驱动的对比记忆机制,有效改善了对话系统在知识稀缺场景下的交互表现。

邹月娴教授和博士研究生杨绪升进行Poster展示

会议现场,杨绪升在海报展示环节系统介绍了VChangeCodec编解码器的设计理念。该编解码器通过标量量化将模型参数量控制在百万级别,同时在Token域深度集成实时变声功能,整体算法延迟低至40毫秒。展示期间,来自中国科学院声学所、美国思科系统公司等机构的学者,对模型低复杂度设计与实时性能的平衡方案表现出浓厚兴趣,各方围绕量化策略、量化精度与音质权衡、因果卷积网络优化等技术细节展开深入交流。多位业界技术人员也重点咨询了该算法在移动端部署的落地可行性与功耗性能表现。

博士研究生杨绪升同时在大会上进行了口头报告,该论文提出了一种音频引导的多模态方法,通过精细化对齐与边界建模技术提升主动说话人检测的准确性。该方法利用音频信息引导视觉特征学习,实现了音频-视觉模态间的细粒度对齐,并针对说话人活动的时序边界进行精确建模,有效解决了复杂场景下的说话人定位问题。

实验室博士研究生杨绪升进行Oral Presentation

邹月娴教授在会场与俞凯、俞栋、李宏毅、王文武等知名学者就低资源语言建模、个性化语音合成、未来高校实验室的课题研究方向等议题深入探讨。并与腾讯、华为、英伟达、海天瑞声等企业技术负责人围绕大语言模型在语音任务中的应用、语音数据标注与质量控制等热点问题开展交流。

邹月娴教授与俞栋老师进行学术交流,杨绪升博士研究生与两位老师在会场合影

两人还参加了官方组织的全体会议,包括斯坦福大学Emmanuel Candès教授的”What Statistics and AI Offer Each Other?”以及洛桑联邦理工学院Michael Unser教授的”Variational Splines and Stochastic Processes: From Kernel Methods (and Norbert Wiener) to ReLU Networks”。报告中,Candès教授探讨了统计学与人工智能的互补关系,Unser教授阐述了从核方法到神经网络的理论演进路径。这些内容为实验室后续工作提供了新的理论视角。

全体会议报告

会议期间,邹月娴教授还应邀参加了华为组织的技术晚宴。晚宴上,华为技术团队与高校学者共同介绍了URGENT语音增强挑战赛和全双工情感对话语音大模型挑战赛两项技术竞赛的最新进展。报告后,邹老师与来自各高校的研究者及业界专家就语音增强在真实场景中的鲁棒性问题、全双工对话系统的延迟优化等话题展开了深入讨论。

应邀出席华为技术晚宴并开展学术交流
华为技术晚宴大合影

本次参会让实验室全面把握了语音信号处理与多模态学习的前沿动态,也促使团队从数据分布、跨模态对齐等维度重新审视研究范式。六项成果的集中展示拓展了与国际顶尖高校和产业界的合作网络,为后续的技术转化和人才培养奠定了基础。之后,ADSP实验室将继续融合深度学习与信号处理理论,推进神经编解码器的轻量化研究,探索多模态模型在资源受限场景下的适应机制,同时关注对话系统的可靠性与可解释性建模。并在医疗辅助、具身智能等场景推动技术落地,促进产学研深度融合。实验室计划在2027年继续向ICASSP投稿并参会交流,持续在国际学术平台上贡献高水平研究成果。

深圳市人工智能学会(Shenzhen Association for Artificial Intelligence,英文简称SAAI),是由深圳市人工智能科学与技术领域科技工作者和相关企事业单位自愿组成,依照国家有关法律法规登记的深圳市地方性、非营利性学术社团组织。中国科学院深圳先进技术研究院是SAAI理事长单位,北京大学深圳研究生院、清华大学深圳国际研究生院、哈尔滨工业大学(深圳)、南方科技大学、香港中文大学(深圳)、深圳理工大学、深圳大学、深圳技术大学、深圳职业技术大学、华为技术有限公司、深圳市腾讯计算机系统有限公司、中兴通讯股份有限公司、中国移动等21个高等院校、科研机构和高新技术企业为SAAI理事会员单位。SAAI积极推动专业委员会和工作委员会建设,现已成立十四个专业委员会:1)机器人智能系统专业委员会(SAAI TC-RIS);2) 自然语言理解专业委员会(SAAI TC-NLU);3) 智能金融专业委员会(SAAI TC-IF);4) 认知系统与智能信息处理专业委员会(SAAI TC-CSIIP);5) 法律人工智能专业委员会(SAAI TC-LAI);6) 智慧空间专业委员会(SAAI TC-SmartSpace);7) AI伦理治理专业委员会(SAAI TC-AIEG);8)AI红树林专业委员会(SAAI TC-AIM);9) 智慧海洋专业委员会(SAAI TC-SmartOcean);10) 大模型技术及应用专业委员会(SAAI TC-LM);11)脑机智能专业委员会(SAAI TC-BCI);12)智能医工融合专业委员会(SAAI TC-AIME);13)言语与情感智能专业委员会(SAAI TC-SEI);14)具身智能专业委员会(SAAI TC-EI);以及五个工作委员会:1) 女性AI科技工作者委员会(SAAI WC-WAIP);2) 青年工作委员会(SAAI WC-Young);3) AI城市治理工作委员会(SAAI WC-AIUG);4) 财经人工智能工作委员会(SAAI WC-FEAI);5) 教育工作委员会(SAAI WC-AIEC)。

SAAI作为一家非营利性科技服务平台,汇聚产、学、研、政、投多方力量和资源,学会秉持服务国家“科教兴国”战略愿景,以“持续推进人工智能前沿基础理论和与关键技术研究”、“促进人工智能赋能新兴产业发展”和“推广人工智能科普教育”为三大核心使命,确立了“学术高地、引领知识、赋能产业”三大核心价值。SAAI全力打造了一系列专业品牌活动,包括:“深圳人工智能奖”、“信息科技女性精英论坛(Women’s Elite Forum of Information Technology, 简称WeFIT)”、“人工智能科普基地”、“深圳市优秀科技学术论文遴选”、“SAAI -产学研政投沙龙”、“SAAI -博士论坛”、“SAAI -高质量科技探索营”、“SAAI -青年研享论坛”、和“SAAI -新兴产业智库”等。依托丰富的专业资源与人才优势,SAAI积极开展国内外学术交流、科学普及、专业培训、学术出版、人才推荐、学术评价、成果鉴定、评优评奖、专家咨询、建言献策以及科技会展等工作;加速推动深圳市和广东省人工智能科研成果产业转化,助力我国新兴产业升级与新质生产力提升,吸引世界各地的人工智能人才、技术与资源,向深圳及广东聚集,提升深圳市在全国以及全球人工智能领域的技术标准制定权和产业降本增效影响力。

SAAI的三服务SAAI的三支持
服务支撑国家战略
服务助力创新知识和创新技术
服务粤港澳大湾区人工智能技术及应用的可持续发展
支持产学研政投的发展需求
支持会员个人的发展需求
支持会员单位的发展需求

欢迎加入深圳市人工智能学会,请咨询秘书处的微信号:

电话 (Phone): +86 (755) 2690 2448

网站 (Website): saai.net.cn

邮箱 (Email): saai2019@163.com

地址 (Address): 深圳市留仙大道3370号南山智园崇文园区T1(1号楼)4层405房

发表评论

电子邮件地址不会被公开。 必填项已用*标注

The maximum upload file size: 50 MB. You can upload: image, audio, video, document, spreadsheet, interactive, text, archive, code, other. Links to YouTube, Facebook, Twitter and other services inserted in the comment text will be automatically embedded. Drop file here