什么是 Grass?
Grass 是一个致力于构建开放互联网规模的网页爬虫项目,其基础设施由两个关键组成部分构成:
- Grass 节点:允许用户贡献未使用的互联网带宽,获得奖励并参与 AI 的发展。
- 主权数据汇总(Sovereign Data Rollup):由节点、路由器、验证者、零知识处理器和数据账本组成,促进数据的获取和转化过程——将非结构化的网络数据转化为结构化数据集。
有哪些主要组成部分?
Grass 正在构建首个主权数据汇总,通过全球分布的 Grass 节点简化数据获取和转化,确保 AI 对结构化网络数据的普遍访问。
验证者(Validator)
验证者接收、验证并批处理路由器的网络交易,然后生成零知识证明(ZK proofs),在链上对会话数据进行检查点记录。这些链上证明可以在数据集中引用,以验证数据来源并追踪其生命周期中的传承。验证者集合将从初始的集中化框架(单一验证者)过渡到去中心化的验证者委员会。
路由器(Router)
Grass 路由器将 Grass 节点连接到验证者。路由器确保节点网络的责任,并中继带宽。它们通过所中继的总验证带宽比例获得操作激励和奖励。
Grass 节点(Grass Node)
Grass 节点利用用户未充分利用的带宽,转发流量,以便网络能够抓取公共网页数据(而非个人数据)。运行节点是免费的且简单。运行节点的用户(节点运营者)将因其转发的数据获得补偿。
零知识处理器(ZK Processor)
零知识处理器批处理所有网页请求的会话数据有效性证明,并将证明提交到一层区块链。这一操作为网络上执行的每一次抓取行为创建了永久记录。此外,这为 AI 训练数据的来源提供了完全的可见性奠定了基础。
Grass 数据账本(Grass Data Ledger)
Grass 数据账本是被抓取数据与 L1 结算层之间的联系。账本是一个不可变的数据结构,承载完整的数据集,并将数据与其对应的链上证明连接起来。有效地说,它是确保数据来源的存储库。
边缘嵌入模型(Edge Embedding Models)
边缘嵌入是将非结构化网页数据转换为结构化模型的过程。该过程涵盖所有必要的预处理步骤,确保收集的原始数据经过清洗、标准化,并以符合 AI 模型要求的格式进行结构化。