AI+ID|现有标识体系对新一代AI的适配性研究
作者:微信文章<img />
<img />
<img />
<img />
<img />
<img />
AI + ID
以域名系统为代表的各种标识体系,在互联网演进过程中起到了至关重要的作用。其中域名、IP地址、AS号码等网络基础资源的管理涉及到不同国家和地区对名字空间的自主权利和发展空间,域名解析系统、工业互联网标识解析系统等网络基础设施的服务又涉及到网络的互联互通和稳定运行。
近年来,随着大语言模型、多模态大模型及具身智能、人形机器人、智能体等新一代人工智能技术的快速发展和实践应用,对科学研究、生产制造、生活服务都带来了巨大的影响和变革。
那么新一代人工智能的技术产业中有哪些要素需要标识?原有的域名系统、工业互联网标识解析系统等能否满足这样的需求?反之,新一代人工智能技术是否又会引发原有标识系统自身的变革?是否存在构建AI原生标识体系的必要性和可行性?正是基于这样的考虑,我们希望对上述问题展开思考,为业界相关探索提供参考。
标识是信息技术发展过程中的关键要素之一,几乎任何信息系统或者网络架构的设计都离不开标识问题,但很多术语往往又容易产生误解。因此本文首先对标识体系涉及的基本概念进行厘清,对现有的主要标识体系进行分类研究,然后从技术、标准、产业、治理、安全等不同维度分析新一代AI对标识体系带来的挑战,最后总结现有的标识体系对AI的适配性。
一
AI+ID
标识体系基本概念辨析
1
标识与身份
所谓“标识”(Identifier)就是一个符号(Symbol)或字符串(String),用于在一个特定的命名空间(Namespace)内,唯一地指代、命名或寻址某个物理对象或数字对象。而“身份”(Identity)则是指这个物理对象或数字对象所具有的属性集合、行为历史、权利主张等的总和,用于界定该对象是谁以及具有什么资格。我们经常把标识形象的比喻为身份证,但实际上标识只是用于标记身份的字符串,而身份证则是用于承载这样一个字符串的载体。所以如果用计算机学科术语描述,标识其实是对象身份的“指针”或“句柄”,核心作用是唯一的区分和系统的索引;而标识所指向的身份,在数字世界中通常以元数据或可验证凭证等形式存在,用于表征对象的“档案”(静态属性)或“状态”(动态属性)。
2
标识体系
“标识体系”或者“标识系统”(Identifier System),是指以特定的标识命名空间为核心,由相关编码规则与技术标准、管理流程与治理机制、系统工具与基础设施所共同构成的综合性基础资源服务系统。它支撑该标识从生成到注销的全生命周期管理与服务,完整的标识体系标准作业程序通常包括设计与编码、申请与分配、注册与存证、解析与寻址、查询与发现、认证与核验、更新与维护、注销与回收等8类功能。
3
标识解析
最初的标识技术实际上就是编码技术,只需要在一个特定的信息系统内部保证唯一性,往往关注编码对身份属性的全覆盖和高效性。但随着互联网的诞生,命名空间的范畴被无限放大,网络资源不只是提供本地的索引,而是在全网范围内的唯一索引,网络标识体系应运而生。相较于最初的编码技术,以互联网域名系统DNS为代表的网络标识体系更加关注标识解析技术。标识解析(Identifier Resolution)是指以标识为查询索引,通过特定的网络协议、算法或查询机制,将标识映射为一个或一组标识、网络地址、服务入口、属性信息的过程。而DNS正是因为提供域名标识的注册和解析服务,而成为互联网中最重要的基础资源服务设施。
二
AI+ID
现有主要标识体系分析
随着互联网概念边界的不断放大,物联网、车联网、工业互联网等场景中也需要设计标识体系,然而这些标识系统发生了重大变革:一是标识对象的改变,从最初互联网的网页、网站等纯虚拟化的数字对象扩展到了机器和产品等物理对象;二是标识识读的改变,通过OCR、RFID等技术开展大规模、高速率的标识编码自动识别读取,三是标识解析的改变,技术方案越来越丰富、系统设施越来越分化。
针对众多的现有标识体系技术方案,结合上述演变中的重大特征,我们按照标识对象支持数字对象还是兼容物理对象的数实融合模式,以及是否支持原生的网络化标识解析来进行区分,大体上可分为四类来详细开展研究:
一是算法本地标记 (面向数字对象&无原生网络解析) : 例如UUID(通用唯一识别码)、Git Commit Hash、Docker Image ID(容器镜像标识)等。
二是实体管理编码 (面向数实融合&无原生网络解析) : 例如VIN码(车辆识别代号)、ETC(电子不停车收费系统卡号)、ISBN(国际标准书号)等。
三是网络资源标识 (面向数字对象&有原生网络解析) : 例如DNS域名系统、Handle系统、DOI(数字对象标识)、CID(内容标识)等。
四是数实融合标识 (面向数实融合&有原生网络解析) : 例如GS1标识体系、EPC标识(电子产品代码)、以VAA为代表的工业互联网标识体系、DID(去中心化标识符)等。
三
AI+ID
AI对标识体系的新挑战
上一篇文章中我们分析发展新一代AI对标识技术的需求,归纳形成了五大特征。如果试图去满足这些新的需求、新的特征,就会对现有标识体系带来新的挑战,我们从技术、标准、产业、治理、安全等五个维度进行分析。
1
技术挑战:逻辑改变带来的“计算与存储爆炸”
在“连接时代”,以域名解析为例,只需要返回几字节的IP地址,逻辑是静态的;但在“治理时代”,AI标识解析需要返回身份凭证、验证权限、确认合规性等,逻辑是动态。如果再涉及到高频交互,那现有技术很难同时满足海量高分辨率、实时低延迟、高鲁棒性等要求。细分包括“高分辨率治理”与“实时解析性能”的矛盾、“软硬绑定”带来的跨层互通难题等。
2
标准挑战:主权治理与全球连接的“二律背反”
在“连接时代”,全球共用一个DNS系统(含根节点)是共识,因为“连接”是中性的;但在“治理时代”,标识涉及价值观、法律和数据安全、网络安全、产业安全,“治理”是有立场的。细分包括“治理根”的缺失与地缘冲突、“富语义”标准的语义鸿沟等。
3
产业挑战:成本分摊与商业利益的“负和博弈”
在“编码时代”,标识本身成本极低;在“连接时代”,主要通过注册和解析等增值服务维持运行;在“治理时代”,标识意味着确权和追责,这带来了巨大的隐性成本。特别是考虑到如果推广AI标识,可能将需要巨大的改造成本,但产业界缺乏主动适配的商业闭环。细分包括“透明治理”与“商业黑盒”的冲突、“遗忘权”与“模型训练”的不可逆性等。
4
治理挑战:数字主体与社会责任的“法律真空”
治理的前提是有合格的法律主体。当智能体、具身智能等具备自主性,现有的以“自然人/法人”为核心的法律体系难以适配新的标识逻辑。细分包括代码的责任归属困境、去中心化治理的监管死角等。
5
安全挑战:信任链攻击与系统性风险
在“连接时代”,安全是保密性;在“治理时代”,安全是真实性。细分包括内生性安全风险、量子威胁下的治理崩塌等。
四
AI+ID
现有体系对AI的适配性
我们仅针对各标识体系的设计初心和定位,来分析其是否能够满足AI带来的新挑战。
1
对AI需求的满足情况分析
(1)算法本地标记
表格 1 算法本地标记对AI需求的满足情况
(2)实体管理编码
表格 2 实体管理编码对AI需求的满足情况
(3)网络资源标识
表格 3 网络资源标识对AI需求的满足情况
(4)数实融合标识
表格 4 数实融合标识对AI需求的满足情况
2
对AI挑战的应对情况分析
(1)算法本地标记
表格 5 算法本地标记对AI挑战的应对情况
(2)实体管理编码
表格 6 实体管理编码对AI挑战的应对情况
(3)网络资源标识
表格 7 网络资源标识对AI挑战的应对情况
(4)数实融合标识
表格 8 数实融合标识对AI挑战的应对情况
综合以上的分析,我们可以初步总结:
一是“老路”走不通,即无论是算法本地标记、实体管理编码等没有原生网络解析的标识体系,还是以DNS域名系统为代表的网络资源标识解析,都无法完全适应新一代AI技术带来的需求和挑战。
二是“单点”不够用,例如内容标识CID有助于解决存储挑战,分布式标识DID有助于解决中心化管理问题,Handle系统在细粒度数据资源管理方面有优势,但没有一个现有的技术方案实现能够同时解决“计算+治理+连接+编码”的综合性需求和挑战。
那么是否存在构建统一的AI原生标识体系的必要性和可行性呢?还是通过分散的技术突破来解决各种新场景的需求和挑战?我们将继续开展讨论和研究。
(本文和配图在大模型辅助下完成)
来源:工业互联网标识智库
页:
[1]