【学会活动】 SAAI-青年研享论坛:NeurIPS 2023论文预讲会

11月19日下午,SAAI-青年研享论坛“NeurIPS 2023论文预讲会”在深圳市南山智园崇文园区T2-国际会议厅成功举办。本次论坛主席为哈尔滨工业大学(深圳)教授/博士生导师、国际神经网络学会副理事长(教育)徐增林博士以及香港中文大学(深圳)理工学院助理教授/博士生导师、深圳市人工智能与机器人研究院副研究员唐晓莹博士。

本次论坛是在深圳市科学技术协会、深圳市科技创新委员会的指导下,由深圳市南山区科学技术协会主办,深圳市人工智能学会、哈尔滨工业大学(深圳)和香港中文大学(深圳)联合承办;支持单位为International Neural Networks Society(INNS),Chengdu Chapter及西丽湖人才服务中心。活动邀请了来自哈尔滨工业大学(深圳)、香港中文大学(深圳)、腾讯人工智能实验室、北京大学深圳研究生院、清华大学深圳国际研究生院等多所高校与企业专家学者进行现场报告和交流。本次论坛的形式分为口头报告、圆桌讨论以及海报展示。

下午两点,活动正式开始。首先由论坛主席徐增林博士与唐晓莹博士做开场发言,两位论坛主席简单介绍了本次论坛的活动议程及重要嘉宾,对参与活动的嘉宾朋友们表示热烈欢迎。

论坛主席徐增林博士与唐晓莹博士做开场发言

紧接着,深圳市人工智能学会常务副理事长兼秘书长邹月娴教授代表学会致开幕词。她介绍了深圳市人工智能学会的成立初衷和基本概况,并表示学会将一如既往地支持开展各种学术活动,为老师和学生搭建学术交流平台,共同推动深圳市人工智能领域基础研究和成果转化。最后预祝本次论坛取得圆满成功,期待与各位来宾一起聆听本次论坛专家学者的报告。

 邹月娴教授致开幕词

报告环节开始,第一位进行报告的是来自香港中文大学计算机科学与工程系的Irwin King教授,他带来的报告主题为《Trustworthy AI with Federated Learning: Concepts, Methods, Applications, and Beyond》。Irwin King教授从生活现状切入,阐述人工智能在生活中的广泛应用,引出人工智能广泛使用需要建立值得信赖的人工智能系统的重要内容。要保证TAI(Trustworthy AI)系统的安全、健壮、可解释、公正,一种可行方法是通过联邦学习(Federated Learning)。Irwin King教授在报告中重点陈述了关于TAI的概念和FL在构建此类系统中的意义,介绍各种攻击技术和防御技术的作用理念,探讨提高FL可信度的方法。

Irwin King教授作报告

第二位进行报告的是腾讯人工智能实验室专家研究员赵沛霖博士,他带来的报告主题为《用于化学反应的人工智能》。赵博士阐述道,化学反应预测是药物发现中的一项重要任务,包括合成反应预测以及逆合成反应预测。合成反应的任务是给定反应物去预测产物,而逆合成反应的任务是给定产物去预测反应物。针对单步合成反应,腾讯团队提出了一个新的框架。它结合了两个双随机自注意力映射,以获得遵循两个约束的电子再分配预测。实验结果表明,所提出的方法提高了非自回归的合成反应模型的预测性能,并且不会带来明显的额外计算成本。针对多步逆合成,腾讯团队提出了一个利用上下文信息来改进逆合成规划的新框架。将合成路线视为反应图,并建议通过三个原则性步骤来整合上下文:将分子编码为嵌入物,在路线上聚合信息,并用聚合信息预测反应物。综合实验表明,通过在路线上融合上下文信息,所提出的模型显著地提高了在非上下文感知的基线上进行逆向合成规划的性能,特别是对于长合成路线。

赵沛霖博士作报告

演讲嘉宾报告完毕后,都会有来自现场的观众朋友们进行提问。观众们积极举手发言,演讲嘉宾认真作答,互相友好交流,场面十分活跃。

现场参会场景

现场嘉宾提问

嘉宾交流

接下来的环节是圆桌讨论,圆桌讨论环节的主持人由香港中文大学(深圳)助理教授、博士生导师唐晓莹博士担任,参与圆桌讨论的嘉宾包括清华大学深圳国际研究生院副教授杨余久博士、深圳市人工智能学会常务副理事长兼秘书长邹月娴教授、香港中文大学Irwin King教授、香港中文大学(深圳)助理教授王本友博士、腾讯人工智能实验室专家研究员赵沛霖博士、哈尔滨工业大学(深圳)教授、博士生导师徐增林博士。

圆桌讨论场景(照片自左向右依次为唐晓莹、杨余久、邹月娴、Irwin King、王本友、赵沛霖、徐增林)

圆桌讨论主题围绕“可信AI(trustworthy AI)方向前景”、“智能科学(AI for science)面临的挑战”、“大模型背景下可信AI和AI for science未来发展”几个要点,各位嘉宾各抒己见,积极阐述自身的观点和想法,与其他嘉宾共同探讨交流。

邹月娴博士认为AI for Science正在发展初期,需要交叉学科领域的专家学者共同推动,其中最大的困难在于对问题的理解、建模和数据采集,需要做科学的老师把问题描述清楚,做AI的老师把问题理解清楚,共同推动训练人工智能模型所需的数据的获取,这个工作我们国家过去的积累还不够深厚,需要积极推动。王本友博士认为大模型的快速发展带来了更多的隐私和可解释的风险,但是大模型本身也给隐私和可解释性带来新的可能性。王博士团队在做医疗领域的垂直大模型华佗GPT,其中第二代华佗GPT参数高达340亿参数,在上个月的药剂师考试中唯一一个通过的模型,超过GPT-4和文心一言。在医疗大模型过程中,王博士团队用大模型技术本身可以给隐私和可解释性提供新的途径。例如利用大模型可以更方便地对医疗数据做隐私脱敏,而且大模型的COT过程也可以提供更多文本可解释的内容,方便大家理解大模型的决策逻辑。而AI for science目前是一个蓬勃发展的时期,在地球历史上没有语言的时候,如何将知识和经验传递下来呢?一定程度上这些知识和经验都是记录在生命体里,随着一代一代单细胞生物到哺乳动物,到灵长类动物,基因和它生成的蛋白质分子这些里面存在着大量的知识。这些知识并不见得都是以文本形式,但是它们都可以人为地或者自然地成为一个token序列,而这也是大模型最擅长的数据,训练容易scale up。因此他相信除开文本序列以外,其他形式的序列会给大模型带来新的东西,可能会成为某个领域的game-changer。

赵沛霖博士认为可解释性成果较多,相对容易落地;公平性是目前更值得关注的研究方向。AI for Science的难点在于数据的缺失;落地的难点在于相关产业的发展。杨余久博士认为可信AI这几个问题都很重要,但目前个人更关注公平性。这里公平性包括生成结果的公平性和评估公平性,眼下后者需求更迫切,对我们理解大模型更重要。就落地而言,隐私保护方面已有很多企业试图去落地。而AI for science 对AI研究人员而言,目前挑战主要还是领域知识的匮乏、相关数据和问题理解的不对称。可信AI和AI for Science的发展必然要拥抱大模型,增加可解释性和公平性依然是当前主要挑战。

Irwin King教授结合自身与其他领域专家合作的经历再次强调了,可信AI对于不同应用和不同领域内的合作者的重要程度。并举例,在一些领域,如医疗健康,模型的可解释行和隐私保护对于医生的决策而言至关重要。徐增林博士认为,社会上人跟人交互、机器跟机器交互、人跟机器的交互,这些不同场景的合作机制都需要可信。可信性是人工智能的重要方面。如何保证数据的隐私性又能实现数据价值是我们未来需要进一步研究的方向,联邦学习是保护数据隐私和模型价值的重要方式之一。 在AI for Science领域,需要AI和Science领域的研究者共同努力,特别是准备数据和理解业务方面要勇于做一些脏活累活。唐晓莹博士认为涉及可解释性、隐私保护的可信AI技术都是相对容易落地的方向。在大模型时代,可考虑结合多模态与大模型的分布式学习模型,实现安全、高效、经济的模型训练。 听完圆桌讨论环节嘉宾们的精彩分享,接下来还有三位嘉宾的报告值得期待。首先是来自鹏城实验室网络智能研究部的彭涵阳带来主题报告《Birder: Communication-Efficient 1-bit Adaptive Optimizer for Practical Distributed DNN Training》。彭涵阳讲述道,深度学习模型规模增长速度远快于硬件摩尔定律,因此需要进行分布式训练。然而,在此过程中,节点间通信带宽常成为瓶颈。美国对中国高端模型训练芯片的禁运,目前国产芯片最大的差距也在通信带宽。未来十万亿参数级别的大模型可能超越单一集群的计算能力,而鹏城实验室提出的跨地域计算系统–中国算力网可能成为解决方案之一,然而,跨地域分布式训练的最大瓶颈仍是通信带宽。硬件上的通信带宽瓶颈可以从软件层面进行缓解。在这一背景下,他提出了一种实用的1比特分布式训练优化算法,名为Birder。Birder结合了SignSGD和Adam算法的优点,实际应用中有以下优势:首先,它将通信数据流从32比特压缩到1比特,极限压缩率达到32倍。其次,算法结构像SignSGD一样简单,压缩/解压缩成本非常小,使得高压缩比带来的通信时间真正缩短为系统时间的减少。理论上,证明了Birder和Adam的收敛速率是同阶的。此外,由于1比特通信流和All-Reduce不能兼容,还提出了新的通信原语1-bit-All-Reduce。在实验中,展示了在典型10Gbps的网络带宽环境下,与SGD/Adam相比,Birder在64个节点上训练ResNet-50和BERT,在性能不降的情况下,训练速率分别提升了2.5倍和6倍。

彭涵阳《Birder: Communication-Efficient 1-bit Adaptive Optimizer for Practical Distributed DNN Training》

随之清华大学深圳国际研究生院的吴天鹤带来主题报告《Assessor360: Multi-sequence Network for Blind Omnidirectional Image Quality Assessment》。吴天鹤针对于360全景图像的图像质量评估问题,提出了名为Assessor360的新型网络框架,是首个从人类观察状态角度出发构建的神经网络。该网络能够针对不同的全景图生成不同的观测轨迹,并且能够给出相应观测轨迹图像的质量分数。提出的新型网络达到了盲场景任务的SoTA性能。

吴天鹤《Assessor360: Multi-sequence Network for Blind Omnidirectional Image Quality Assessment》

最后是来自香港中文大学(深圳)的赵润泽带来主题报告《Boosting Spectral Clustering on Incomplete Data via Kernel Correction and Affinity Learning》。赵润泽阐述道,谱聚类方法因其简单性和有效性在非凸数据的聚类中备受欢迎。在谱聚类中,相似性度量衡量数据样本之间的局部近邻关系,使用高质量的相似性度量对构建有效的相似性图是非常重要的。然而,缺失数据可能导致不准确的相似性度量,从而降低聚类性能。为了解决这些问题,他提出了一个无插补的框架,和两类新颖的方法来改进缺失数据上的谱聚类。首先引入了一种新的核校正方法,该方法增强了基于缺失数据估计的核矩阵的质量,且具有理论保证,从而使基于预定义核的经典谱聚类任务受益。其次开发了一系列新的相似性学习方法,基于自表达框架和Lp范数,并构建具有自适应扩展的内禀相似性矩阵。该方法在基准数据集上超越了现有的数据插补和距离校准技术,为各种实际应用中缺失数据的谱聚类提供了有前景的解决方案。

赵润泽《Boosting Spectral Clustering on Incomplete Data via Kernel Correction and Affinity Learning》

本次论坛的最后一个环节是海报展示,会场整齐排布着各个论文海报展板,论文作者向嘉宾朋友们介绍自己的论文成果,大家表现出浓厚的兴趣并与作者进行深入友好的探索和交流,场面十分热烈,气氛持续高涨。

海报展示现场热烈交流景象

本次NeurIPS 2023论文预讲会是深圳市人工智能学会品牌活动“SAAI-青年研享论坛”系列的第三次活动,活动吸引了线上线下一千余名观众参与其中。SAAI-青年研享论坛旨在搭建一个专业学术平台,促进粤港澳大湾区青年沟通交流、互学互鉴,学习前沿成果,激发创新思维。

与会嘉宾大合影

深圳市人工智能学会(Shenzhen Association for Artificial Intelligence,简称SAAI),是由深圳市人工智能科学与技术领域科技工作者和相关企事业单位自愿组成,依照国家有关法律法规登记的深圳市地方性、非营利性学术社团组织。中国科学院深圳先进技术研究院是SAAI理事长单位,北京大学深圳研究生院、清华大学国际研究生院、华为技术有限公司、深圳市腾讯计算机系统有限公司、中兴通讯股份有限公司等21个高等院校和高新技术企业为SAAI副理事长单位。现有十一个专业委员会和三个工作委员会,其中专业委员会包括:1)信息与生物科技专业委员会;2)机器人智能系统专业委员会;3)自然语言理解专业委员会;4)智能网联汽车专业委员会;5)智能金融专业委员会;6)认知系统与智能信息处理专业委员会;7)法律人工智能专业委员会;8)智慧空间专业委员会、9)元宇宙专业委员会、10)AI伦理治理专业委员会、11)自动驾驶专业委员会(筹);另外,工作委员会包括:1)女性科技工作委员会;2)青年工作委员会;3)产学研转化工作委员会(筹)。

SAAI是产学研政投的非营利科技服务公共平台,旨在以“持续推进人工智能前沿基础理论和前沿技术研究”和“大力推动中国战略性新兴产业的可持续发展”为战略愿景,确立“学术高地、引领知识、创造价值”三大核心价值,倾力打造“深圳人工智能奖”、“信息科技女性精英论坛(Women’s Elite Forum of Information Technology,简称WeFit)”、“深圳市人工智能学会科普基地”、“深圳市优秀科技学术论文成果遴选”、“SAAI-产学研政投沙龙”、“SAAI-博士论坛”、“SAAI-高质量科技探索营”、“SAAI-青年研享论坛”和“SAAI-新兴产业智库”等系列专业活动品牌。

 SAAI基于专业优势和人才优势,积极开展国内外学术交流、科学普及、学术教育、科技会展、学术出版、人才推荐、学术评价、学术咨询、技术评审与奖励、专家咨询和建言献策等活动;加速推动人工智能科研成果转换,赋能我国新兴产业升级,吸引各地人工智能人才、技术、资源向深圳聚集,提升深圳在全国以及全球人工智能领域的影响力。

欢迎大家关注深圳市人工智能学会公众号

发表评论

电子邮件地址不会被公开。 必填项已用*标注

The maximum upload file size: 50 MB. You can upload: image, audio, video, document, spreadsheet, interactive, text, archive, code, other. Links to YouTube, Facebook, Twitter and other services inserted in the comment text will be automatically embedded. Drop file here