为认真学习借鉴国内先进经验,深化新型国家语料库建设合作,推动区域文化数字化战略落地,2026年3月28日,粤语语料库建设与大模型评测重点实验室(下称“重点实验室”)主任齐佳音教授带领团队成员,赴首都师范大学中国语言智能研究中心开展专题调研,广州市社科联科研规划部二级调研员许小龙、广州大学社科处刘和健副处长随同调研。国家语委中国语言智能研究中心主任周建设教授及其团队热情接待了调研团,国家图书馆富平研究员、海淀区教育研究院图书馆张伟、中国电子云副总裁常慧锋共同参与了此次交流。

图1 重点实验室一行赴中国语言智能研究中心调研
调研围绕“新型国家语料库建设与区域文化数字化”核心主题展开深入研讨。周建设教授系统阐述了新型国家语料库的战略定位和架构体系,指出其旨在构建国家规范知识库、人文基因库与认知评估库,是保障国家文化安全与数字主权、增强国际核心竞争力的重大基础工程。他详细介绍了项目在规范体系建立、多学科示范库建设及资源整合方面取得的阶段性成果,为语料库建设的全国推进提供了清晰范式。

图2 周建设教授介绍新型国家语料库建设
齐佳音教授重点介绍了重点实验室AI-DimSum粤语语料库平台的阶段性成果与建设经验。她指出,在市社科联和广州大学的大力支持和倾心指导下,重点实验室通过对岭南特色文化资源进行细颗粒度的专业化标注,构建了规模可观的多模态粤语数据集,并开发了粤语电子工具书、粤语大模型、粤语学习等功能的粤语语料库平台与应用,为方言与地方文化的保护、传承与创新性发展探索了切实可行的技术路径。周建设教授对此高度认可,并进一步提出构建地方文明谱系、深度融入国家语料库体系的构想,肯定了国家战略与地方特色深度融合的广阔前景。

图3 齐佳音教授介绍AI-DimSum粤语语料库平台建设
座谈会上,国家图书馆富平研究员、海淀区教育研究院图书馆张伟、中国电子云副总裁常慧锋分别分享了图书馆智能体系、知识库建设、“AI+智慧阅读”以及图书数字化运营方面的经验和体会。广州市社科联科研规划部二级调研员许小龙、广州大学科研处副处长等分别围绕语料库建设中面临的资源整合、长效运营、版权合规与标准统一等问题,与在座专家进行了交流探讨。

图4 会议座谈
此次调研深化了京穗两地学术界对国家语言资源战略的理解,为粤语语料库的下一步建设与国家语料库体系的衔接指明了方向。双方表示,将以此次交流为新的起点,在未来加强紧密协作,共享资源与经验,共同为筑牢国家文化数字基座、传承中华优秀语言文化贡献智慧与力量。
粤语语料库建设与大模型评测重点实验室由广州市社科联与广州大学联合共建,旨在通过“粤语+人工智能”的文化科技融合创新,推动粤语传承传播和发展。实验室由中国工程院院士、广州大学方滨兴教授,香港科技大学(广州)党委书记、国家语言服务与粤港澳大湾区语言研究中心主任屈哨兵教授担任双首席科学家,广州大学网络空间安全学院齐佳音教授担任重点实验室主任。