多客科技 发表于 2026-1-11 19:17

AI数据训练平台Protege获3000万美元A+轮融资,a16z领投

作者:微信文章




Protege是一家总部位于纽约的AI数据基础设施公司,专注于为大模型和AI应用提供合规、可扩展的真实世界训练数据网络。公司通过撮合数据持有方与AI模型开发方,解决了行业中“好数据难找、难用、难变现”的核心痛点。

Protege宣布由Andreessen Horowitz(a16z)领投的3000万美元A+轮融资,跟投包括Footwork, CRV, Bloomberg Beta, Flex Capital, Shaper Capital,自成立以来总融资额达6500万美元。



Protege成立于2024年,是一套面向AI训练数据的基础设施与交易平台。 公司自定义定位为“AI数据平台”,目标是成为跨行业、跨模态真实世界数据的统一入口,为AI团队提供可信、可授权的数据供应网络。

Protege的业务覆盖数据发现、许可、清洗与交付的完整链路,帮助数据持有方安全变现资产,同时让模型方以更低成本获得高质量数据。 通过标准化流程与技术栈,平台降低了双方建立单独数据合作的时间和合规成本。

Protege提供的是一套平台级数据基础设施,而不是单一工具,核心能力聚焦在“AI训练数据的安全流通和运营”。 其产品大致包含以下几层:

数据供给侧平台:为媒体公司、医疗机构、内容平台等数据持有方提供接入、抽取、脱敏、标签与收益结算等服务,将分散数据接入为可交易资产。

数据需求侧平台:为模型公司、研究机构、企业AI团队提供按需求检索、组合与订阅真实世界数据集的能力,并支持针对特定用例的定制数据项目。

安全与合规模块:在数据全生命周期中引入隐私保护、权限控制、使用审计与合规检查,强调“privacy‑centric”“rights‑protected”。

在数据类型上,Protege支持包括视频、音频、文本临床记录与医学影像等多模态数据,并可根据训练与评测需求进行策划、重组与优化。 这些数据被包装为“AI‑ready”的可直接用于训练与评估的资源,加快模型迭代速度。

Protege创始人Bobby Samuels是连续创业者与AI数据领域的运营型领导者。 团队由来自顶级科技公司与AI机构的运营、产品与技术负责人组成,强调“experienced operators and AI innovators”的组合,既懂企业级数据运营,又了解前沿模型团队的真实需求。

Protege所处的行业属于“AI数据基础设施/数据市场”赛道,处在模型和算力之下的一层关键“数据供给层”。 随着基础模型与应用爆发,真实世界数据的重要性迅速提升,但现有市场长期存在几大痛点:

获取高质量真实数据极度分散且耗时:优质数据掌握在媒体、医疗、内容与垂直平台手中,过去往往需要逐家谈判,流程长且容易失败。

合规与隐私风险高:尤其是涉及医疗、用户内容场景,数据共享如果缺乏标准化机制,很容易在隐私、版权与合规上踩雷。

数据持有方缺乏变现路径:大量历史内容、业务日志与影像数据沉睡在系统中,没有标准化的对外授权与收益分配方式。

Protege通过建立统一平台,把高度碎片化的数据供给端进行聚合,同时用标准化的许可、收益分成与技术工具,让数据方“可控地开放”,让模型方“可预期地使用”。 这一机制既扩大了可用数据池,又在商业与合规层面为双方降本增效。

==========================

加入北美VC/Startup路演平台



==========================

加入美股交流群



广告 - StockFan App
用户覆盖全球50个国家的美股大数据和社区App



下载StockFan App,了解更多实时美股和数字货币动态。
苹果下载:https://apps.apple.com/us/app/stockfan/id6449582336

安卓下载:https://play.google.com/store/apps/details?id=com.stockfan.www

End
页: [1]
查看完整版本: AI数据训练平台Protege获3000万美元A+轮融资,a16z领投