讲座题目:多模态大模型的最近进展和趋势 (Recent Advances in Multimodal Large Language Model and Beyond)
讲座时间:2023.11.17 14:00-15:30
讲座人:王龙跃 博士
地点:T2407
讲座内容:
随着大模型时代的到来,从机器到类人智能的研究逐渐成为焦点,尤其是在多语言、多模态、多智能体等方面。本报告主要以视觉与语言融合为例,首先介绍在文生图、文生视频的上初步探索。接着,报告回顾多模态大模型的演进,以理解和生成为例揭示模态对齐的核心问题。最后,报告还对语音、制药、医疗等其他模态融合进行调研,并讨论未来发展趋势。
讲座人简介:
王龙跃,博士,腾讯人工智能实验室资深研究员。2018年于都柏林城市大学获计算机应用专业博士学位,欧洲机器翻译学会2018年最佳博士论文奖获得者。其主要从事自然语言处理、多模态融合、机器翻译方向的研究,在ACL等国际期刊和会议上发表论文五十余篇,累计申请相关专利五十项。参加WMT等国际学术比赛十余次,其中获得国际机器翻译比赛六项冠军。担任IEEE 高级会员 、腾讯AI Lab犀牛鸟专项研究计划项目负责人、中文信息学会青年工作委员会委员、ACL领域主席、AACL 高级领域主席。