粤语语料库建设与大模型评测重点实验室2025年 第一季度工作研讨会在广州大学举办

作者:    时间:2025-04-13    点击数:

2025年4月8日,由广州市社会科学界联合会指导、广州大学主办的“国家语言服务与粤港澳大湾区语言研究中心学术活动暨粤语语料库建设与大模型评测重点实验室(下称“重点实验室”)工作研讨会”在广州大学大学城校区召开。广州大学副校长李进、广州市社会科学界联合会党组书记崔颂东、香港科技大学(广州)党委书记、国家语委科研机构国家语言服务与粤港澳大湾区语言研究中心主任屈哨兵教授出席会议并发言,重点实验室成员及广州大学人文学院师生参加了会议。

会议报告环节由广州大学人文学院院长禤健聪教授主持。广州大学副校长李进在致辞中指出,希望通过今天的活动,我们能够进一步推动多学科交叉融合,探索具有中国特色、岭南风格的城市文化传承与发展之路,为大湾区的语言研究和文化传承贡献更多力量。。

图1 广州大学副校长李进致辞

会上举行了国家语言服务与粤港澳大湾区语言研究中心聘任仪式,并正式启动重点实验室2025年度研究课题。重点实验室主任齐佳音教授受聘为国家语言服务与粤港澳大湾区语言研究中心研究员,并担任语言服务产学研促进部主任。

图2 国家语言服务与粤港澳大湾区语言研究中心聘任仪式

图3 重点实验室2025年度研究课题启动仪式

重点实验室主任齐佳音教授介绍了重点实验室2025年第一季度的工作进展:①在语料库平台方面,确定了开源生态的SaaS技术架构、在粤语语料库“AI-DimSum”系统底座和系统上层全面启动了开发工作,完成了语料库数据库结构设计、搜索引擎开发以及语料库平台的产品化设计,上线了重点实验室官网https://aidimsum.com/,在语料标注系统开发方面也取得了实质进展。②在基础研究方面,在粤语文化精神标识体系以及粤语语料标注规范等方面都取得了阶段性进展。③重点实验室整体运行良好,AI-DimSum学术沙龙常态化进行、大湾区粤语语料库创新联盟进入筹备期、粤语语料库开源社区开始为重点实验室贡献资源、与产业机构的粤语语料共享共建顺利推进等。重点实验室的研究工作得到了暨南大学、华南师范大学、香港科技大学(广州)、澳门大学等大湾区高校大力的支持,也得到了广州市大湾区现代产业研究院、广东人民出版社、电子五所等产业机构的大力支持,“1+1+N”(1:广州市社会科学界联合会,1:广州大学)的发展模式效用凸显。在下一阶段,重点实验室将持续推动粤语语料库平台的集成性建设,推动重点实验室各研究课题产生的语料以及社会各界共享语料的入库。

图4 重点实验室2025年第一季度工作进展会

研讨环节,暨南大学汉语方言研究中心研究员彭志峰首先介绍了暨南大学数字人文平台的建设经验,以此来引导交流讨论环节。重点实验室指导专家、暨大大学汉语方言研究中心主任刘新中教授首先发言,他指出粤语语料库要从正字、正音等方面做到学理基础扎实,暨南大学汉语方言研究中心在汉语方言研究方面有深厚积累,可以和广州大学优势互补,合作共赢建设好粤语语料库。除此之外,刘新中教授呼吁破解高校跨学科人才培养的机制难点,促进语言学与信息技术学科的加速融合。重点实验室指导专家、暨大大学汉语方言研究中心前主任甘于恩教授随后发言,强调粤语语料库的国际包容性,充分体现大湾区以及国际其他粤语使用区域的认可度和接受度。

图5 重点实验室指导专家刘新中教授、甘于恩教授发言

会议总结环节,崔颂东书记指出,重点实验室应锚定“建成国家文化大数据体系”目标,发挥粤港澳联动优势,为语言资源保护提供“广州经验”。屈哨兵教授建议,深化粤港高校协作,抓住人工智能带来的机遇,巧干加实干,扎实推进重点实验室各项工作,力争早日取得标志性成果。

图6 崔颂东书记、屈哨兵教授进行会议总结

粤语语料库建设与大模型评测重点实验室由广州市社科联与广州大学联合共建,旨在通过“粤语+人工智能”的文化科技融合创新,推动粤语传承传播和发展。实验室由中国工程院院士、广州大学方滨兴教授,香港科技大学(广州)党委书记、国家语言服务与粤港澳大湾区语言研究中心主任屈哨兵教授担任双首席科学家,广州大学网络空间安全学院齐佳音教授担任重点实验室主任。


Copyright © 2022 广州大学网络空间安全学院 版权所有