销售热线
2025年1月13-24日,国际电信联盟电信标准分局第二十一研究组(ITU-T SG21)于瑞士日内瓦召开全体会议。由中国信息通信研究院(简称“中国信通院”)牵头的10个结项项目、5个新立项项目和1个文稿更新项目顺利通过。
其中,结项标准围绕数据标注、云平台建设、模型测评等多个大模型产业化环节展开,聚焦智能体感知评估、机器人流程自动化、代码生成、驾驶员行为检测等应用领域,标志着中国在大模型国际标准领域取得了突破性进展,推动了人工智能及相关技术标准的实现。
结合中国信通院与ITU官网发布内容,中国信通院上海工创中心对10项结项标准的已公开内容进行了梳理汇总。
01 Technical specification forartificial intelligence cloudplatform:Data annotation
人工智能云平台技术规范:数据标注
标准从人工智能数据标注全流程的角度出发,共分为数据接入、数据标注、智能标注、数据交付和生产管理五个部分。
简介 / INTRODUCTION
由于数据标注在改进人工智能算法模型训练中的作用,其重要性正日益受到关注。因此,评估数据标注的能力非常重要。本提案概述了人工智能云平台数据标注能力的一般要求,这些要求有助于行业参与者分析和优化其产品,同时也帮助用户构建和选择符合这些要求的产品。
02 Technical requirements andevaluation methods of AI-baseddriver behaviour detectionapplication
驾驶员行为检测应用的技术要求与评估方法
标准以驾驶员行为检测为核心,明确行为检测应用通用框架,涵盖数据输入、数据预处理、计算与决策及输入等模块,规范其可检测的行为状态及通用检测方法和检测流程。
概要 / SUMMARY
驾驶员行为检测是车辆驾驶安全助手系统中最重要的部分之一。它有助于防止人类引起的安全风险,并大大减少严重事故的发生。因此,如何实现成熟的驾驶员行为检测应用程序引起了公众的关注。需要考虑驾驶员,汽车和环境之间的信息和连接,以在现实的驾驶场景中充分了解驾驶员行为。该项目主要关注使用车辆中的计算机视觉的驾驶员行为应用程序。该建议旨在为驾驶员行为检测应用提供一种一般框架,要求和评估方法,并帮助公司和行业增强对多媒体应用程序上驾驶员行为检测的开发。
03 Framework andrequirements for the foundationmodel platform
基础模型平台框架与要求
标准围绕大模型的数据工程、模型预训练模型调优、模型交付、模型运营、平台能力和监控七个维度,构建了面向大模型全生命周期的功能要求框架,以及各维度的能力要求。
概要 / SUMMARY
多媒体中的基础模型平台旨在解决应用程序障碍,资源和计算能力需求以及复杂的内容生产过程。它为多媒体应用提供了AI功能。该基础模型平台框架的表述填充了多媒体领域中基础模型的平台标准的真空,帮助生产者企业指导产品研究并标准化其基础模型平台的构建,并为企业用户选择基础模型平台产品提供参考。
04 Assessment criteria for foundation models:Benchmark
基础模型的评估标准:
基准测试标准提供了大模型基准评测的参考架构、技术要求和评估方法,包括测试能力、测试数据集、测试方法以及测试工具四个部分。概要 / SUMMARY该建议着重于基础模型的要求和评估方法。它涵盖了基础模型基准的概述,并确定了基础模型的要求和评估方法。这对于确保不同基础模型的一致性,透明度和可比性,实现公平评估并明智的决策很重要。它可以帮助行业参与者分析和优化基础模型,并帮助用户构建和选择与这些要求保持一致的产品。
05Technical requirements and evaluation methods of Al based codegeneration in multimedia applications
多媒体应用中基于AI的代码生成技术要求及评价方法
标准围绕代码大模型相关的通用能力、专用场景能力和应用成熟度,从输入多样性、任务多样性、语言完备度、结果可接受性、结果准确度等维度,提出了全栈技术要求和评估方法。
概要 / SUMMARY
该建议制定基于基础模型的代码生成技术要求和评估方法。它旨在指导代码生成能力构建,并提供一般用户指南。
06 Requirements and evaluation methods of artificial intelligence agents based on large scale pre-trained model
基于大模型的智能体能力要求与评估方法
标准主要涉及评估智能体感知和认知、规划、记忆和执行的功能和性能能力。从智能体实际应用出发,部分涉及智能体与智能体群、智能体与外部环境间的交互能力。
概要 / SUMMARY
该建议旨在为基于预训练的智能体提供要求和评估方法的框架。它试图帮助企业和用户了解智能体,并帮助他们更快,更准确地构建和实施产品和应用程序。此外,该建议旨在促进行业的健康发展。
07 Functional capabilities for artifigial intelligence development within the Al cloud platform: Automated machine learning
人工智能云平台中面向人工智能开发的功能能力:
自动机器学习标准包括数据处理、模型开发、模型部署以及管理和维护四部分,关注人工智能多媒体应用开发过程中各环节所应具备的自动机器学习技术和算法,以及平台底层支撑能力。
概要 / SUMMARY
该建议草案侧重于AI云平台内人工智能开发的自动化机器学习(AUTOML)功能,涵盖了术语,功能和参考设计,以实现面向业务的智能多媒体应用开发。
08 Requirements and evaluation methods for retrieval augmented generation of large scale pre-trained model
大模型检索增强生成技术要求与评估方法
标准从检索增强生成流程出发,划分为数据库建设、信息检索、答案生成和应用生态四个阶段,分别明确了关键能力点,并构建了统一的评估方法
概要 / SUMMARY
标准建立了基于大规模预训练模型的检索增强生成技术要求和评估方法的框架,将为用户更好地了解检索增强生成技术,并帮助他们更快,适当地设置检索增强应用程序。
09 The technical requirements and evaluation methods of robotic process automation system
机器人流程自动化系统技术要求与评估方法
标准从RPA系统功能评估的角度出发,划分为管理监控、开发测试、流程运行和 AI增强四个模块,涵盖了系统部署与监控、机器人开发与优化、任务执行与数据收集,以及能力融合的功能要求。
概要 / SUMMARY
该建议提供了机器人流程自动化系统的技术要求和评估方法,设置了一些评估机器人流程自动化系统功能的关键指标。
10 Technical requlrements and assessment methods of generative artificial intelligence enabled multimedia applications
生成式人工智能对多媒体应用服务的技术要求和评估方法(冻结)
标准从技术能力、产品能力、基础能力、交互能力等多角度,全方位构建了对于生成式人工智能应用的评价体系。此外,针对以下在研标准,中国信通院现面向产、学、研、用各界启动标准参编征集工作;针对上述结项标准,将依托人工智能关键技术和应用评测工业和信息化部重点实验室“可信AI评测”体系启动国际标准符合性验证工作。中国信通院希望携手各方,持续推进大模型等关键领域的国际标准研究制定和实施推广,促进国际标准研制应用形成有效闭环。