市厅级科研平台

作者:    时间:2025-04-23    点击数:


粤语语料库建设与大模型评测重点实验室(202411月)

粤语语料库建设与大模型评测实验室(以下简称“实验室“)通过建设粤语文化精神标识数据库,对大模型粤语交互实现文化传承、内容监管、质量评测、产业服务和传播创新作用:

文化传承:推动粤语语料库建设。在广泛文献萃取和调研论证基础上,提炼出粤语文化的精神标识和精神精髓,为粤语语料库建设提供指引框架,而在此指引下的粤语语料库就能将粤文化的精髓借助科技的方式融入到广泛的数字应用中,实现文化的数字化传承与发展。

内容监管:维护意识形态安全。粤港澳大湾区特殊的发展历程,塑造了“‘一国两制’三法”的现实情况,使得国家意识形态安全的“南大门”守门把关任务更为复杂而重要。大模型粤语交互质量评测中意识形态安全是首要维度,将意识形态安全延伸到大模型交互质量评测中是必然要求,对国家安全具有重要意义。

质量评测:推动粤语的语言保护。方言作为一种独特的民族文化,它传承千年,有着丰厚的文化底蕴。为推广和规范使用国家通用语言文字,科学保护各民族语言文字,我国从2015年启动中国语言资源保护工程(简称“语保工程”)。大模型方言服务不仅能方便方言用户的数字化生活,更能对推进方言的保护与传承起到重要作用,大模型粤语应用也是如此。

产业服务:促进粤港澳文化共同体形成。粤港澳三地虽然都使用粤语,但是文字、发音等还是有一定差异,重点实验室可以在充分考虑各地差异的基础上,最大程度地聚合粤语文化的公约数,推动粤港澳大湾区的言语规则对接以及文化认同软联通。通过对大模型粤语交互质量评测这个关卡口的把控,促成数字空间文化域中的良性言语生态,推动粤港澳文化共同体层次的不断提升。

传播创新:引领粤语的国际话语权。粤语除了是香港、澳门的官方语言外,也是美国、加拿大的第三大语言,澳大利亚的第四大语言,粤语在海外的语言地位很高。从语言文化的正本清源层面讲,借助大语言粤语质量评测,加快建设粤语数字化语料库,对于由我国来确立粤语国际规范等具有重要意义。





Copyright © 2022 广州大学网络空间安全学院 版权所有