广州大学网络空间安全学院二级教授、粤语语料库建设与大模型评测广州市重点实验室主任、联合实验室专家 齐佳音
“联合实验室将集中发力建设大湾区安全语料库,形成全球粤语语料库高地,利好人工智能发展。”广州大学网络空间安全学院二级教授、粤语语料库建设与大模型评测广州市重点实验室主任、联合实验室专家齐佳音接受南都访谈时表示,粤港澳大湾区生成式人工智能安全发展联合实验室(简称“联合实验室”)将在“政产学研用”融合攻关下,探索出一套高效、经济、一致的生成式AI安全发展的大湾区模式。
谈优势
以湾区协同机制推动AI治理
南方都市报(以下简称“南都”):在您看来,联合实验室在大湾区AI产业生态构建中扮演怎样的角色?
齐佳音:联合实验室成立意义重大。大湾区涉及广东、香港、澳门三地,政府层面的资源调动机制将更加重要,有了政府层面的主导推动,资源整合的效率将大大提升。另一方面,AI治理涉及多个学科、多个领域,联合实验室则是一个能聚合粤港澳三地政产学研用优势资源来进行科研攻关的平台,这不仅有利于攻克生成式AI安全发展中的普遍性问题,更有利于推动粤港澳三地之间的AI治理协同,探索出“一国两制三法域”背景下的生成式AI安全发展的大湾区模式,为国际AI治理提供实践经验。
谈挑战
需破解“治理碎片化”难题
南都:生成式AI带来多维安全风险,粤港澳大湾区在应对这一安全风险方面面临哪些特殊挑战?最迫切需要解决的问题是什么?
齐佳音:生成式AI的安全风险具有多维度、多层次的特征,涉及风险来源、风险类型、风险性质以及影响领域等多个方面,各类风险之间相互关联、相互影响。
对于大湾区而言,涉及内地与香港、澳门之间治理规则的跨境协同问题。如香港采用“应用为本”和“风险分级”的灵活监管,内地则有《生成式人工智能服务管理暂行办法》等强制性规定。因此,大湾区的生成式AI安全发展迫切需要推动大湾区内部在AI治理原则、风险分类分级、高风险应用认定等方面的互认与合作。
在这方面,联合实验室既可发挥沟通桥梁作用,更能发挥研发攻关作用,通过粤港澳三方的科研合作,逐步拿出可供政策层面实践的AI治理协同方案。
南都:除了协同治理,制定行业安全发展标准,形成本地化安全标准体系也是联合实验室的重点任务之一。您认为标准体系应如何满足大湾区多元产业结构的需求?
齐佳音:从AI安全发展的角度,急需建立关于AI安全分类分级的实践标准,可以根据大湾区产业特点,优先考虑教育、医疗、金融等领域的AI安全分类分级湾区标准,也就是这些新设立的标准从制订就应该充分考虑到在大湾区的一致性认定;考虑到大湾区也是智能制造高地,要特别关注具身智能发展中迫切需求的安全标准,特别是能够移动且有可能危害到人类的工业机器人的相关产业安全标准;第三,考虑到大湾区的独特背景以及多元化的产业结构,在推动AI安全发展的湾区标准时,要兼顾刚性约束与柔性引导,可先从白皮书、行业指南、最佳实践等探索,然后逐步考虑推荐标准,时机成熟后逐步提升约束力。
谈意义
建设高质量粤语语料库
南都:联合实验室将加强生成式人工智能训练数据安全工作,丰富且高质量的语料库对生成式AI在语言处理领域的发展有哪些重要意义?
齐佳音:生成式人工智能训练需要大量训练数据,训练数据的质量直接影响生成式人工智能的效果。做好训练数据的安全监管,就能从源头上防范生成式人工智能的安全风险。通过联合实验室集中建设安全语料库对于大湾区的生成式人工智能企业是一个重大利好。以前各个企业分散建设,不仅规模小,而且还要投入较高的成本;现在由联合实验室统一建设,不仅可以做大规模,还能极大降低了企业的安全合规成本,积极推动大湾区生成式人工智能发展。
南都:目前粤港澳大湾区在安全语料库建设方面有何基础?如何进一步优化和扩充语料库,以提升粤语相关AI应用的准确性和智能化水平?
齐佳音:此前,由广州市社科联、广州大学牵头,于2024年11月成立建设粤语语料库建设与大模型评测广州市哲学社会科学重点实验室。经过近10个月的建设,完成了通用粤语语料库平台的技术研发,即将发布,并向全球开放。同时完成围绕粤语语料库的AI开发生态构建,发布了一批开放数据集,包含粤语大模型训练问答对数据集等;构建了围绕该语料库平台的应用商店,上线包括粤语大模型内容安全护栏等十余个App;开发了粤语多模态语料标注智能化平台,还完成了岭南文化精神标识体系的多模态语料标注规范,构建了用于粤语多模态大模型安全合规评估的测试题库。
目前,奶茶视频APP也参与到联合实验室的粤语语料库的资源建设中,后续将在联合实验室的统一协调下,通过大湾区的资源支持,以及省级层面的统筹,加快形成与电视台、出版社、博物馆、媒体平台等的资源共建共享机制,扩大粤语语料库的资源容量和提升语料质量;同时,要加大与产业界的语料需求进行对接,建立粤语语料供给与粤语语料需求之间的良性机制以促进粤语语料库建设的可持续发展。通过产业需求带动粤语语料库建设,并在这一过程中,根据具体的场景业务,不断提升粤语相关AI应用的准确性和智能化水平。
聚焦 联合实验室能发挥哪些独特作用
粤港澳大湾区生成式人工智能安全发展联合实验室通过构建“政产学研用”深度融合的创新生态,围绕生成式人工智能安全发展基础理论、前沿技术、产业赋能、监管治理开展科研攻关,目标是使大湾区成为企业生成式AI应用安全合规成本全国最低、安全能力水平全国领先的区域。而通过联合实验室集中建设安全语料库对于大湾区的生成式人工智能企业是一个重大利好。