语料:AI发展核心要素
语料作为AI进步的基础,被冠以“珍贵资源”的美誉,对模型效能的提升起着决定性作用。在上海,与人工智能相关的产业正快速崛起,而语料资源则是推动这一产业发展的关键动力。建立完善的语料体系已成为AI发展战略中的核心目标,有力地支撑着上海AI产业的不断攀升。
聚焦行业需求
上海市正着力构建涵盖金融、制造业、教育、医疗、文化旅游等多个领域的开放语料库和测试数据集。此举旨在提升人工智能技术的应用精度,扩大其实际应用范围,为行业智能化发展提供坚实助力,并加速推进各行业的数字化转型。
战略布局行动
上海市正致力于推动人工智能大型模型产业的发展,全面实施“模塑申城”战略。该举措着重于为大型模型奠定坚实基础,同时创造多元化的应用环境。这一战略的核心目标是培育产业创新的土壤,吸引众多企业和人才共同参与。
措施促生态形成
2024年3月,上海库帕思科技有限公司正式投入运营。这家公司是我国首个由政府引导创立的AI语料企业。公司专注于提供专业的功能性语料服务。它已在具身智能、金融等多个领域全面建立了语料库。此举旨在助力上海成为全球领先的人工智能产业生态圈。
生态协同发展
徐汇区作为我国人工智能产业的重镇,在大型模型领域表现突出。该区与市政府合作,创建了全国首个大模型创新生态社区——“模速空间”。该社区配备了包括算力调度在内的五大功能平台,致力于为相关企业提供服务。这一创新行动有效促进了区域内人工智能产业的协同进步。
未来规划展望
上海致力于巩固高质量综合语料库的基础,打造数据语料的核心节点,迅速推动创新语料服务技术的提升,并加速“5+6”专项语料工程的执行。此外,2025年的语料排名榜单正加紧筹备,语料工作委员会亦计划构建一个高质量、实用的语料生态系统。普遍认为,上海能否利用这些方法,在人工智能语料库这一领域取得显著成绩,进而成为全球的佼佼者。