又一个豪华VC阵容Coinbase、Paradigm、Polychain三大Buff加持的AI+Crypto项目诞生了——Vana。 简单而言,Vana目标将用户私有数据实现Tokenization,搭建一个对用户数据所有权和控制权以及未来经济收益权的分配与激励网络,可以解决AI大模型在训练过程中的数据不足的问题。

AI发展主要围绕“算力”、“算法”“数据”三座大山,其中算力方向有io、Aethir,算法方向有 Bittensor、SaharaAI,Vana锁定的正是被视为AI燃料的“数据”方向。

有了庞大“数据源”的支持,AI可以进行多模态学习、持续学习、自监督学习等以增强AI大模型的应用场景和使用范围。

现阶段AI大模型训练存在隐私、数据来源不均衡等诸多挑战。泛文本类的网络数据又严重过剩,而特定领域(医疗、法律)高质量的数据、(新闻、科技)等实时更新类等数据源又严重稀缺。如何才能打破传统行业数据孤岛,降低数据标记成本,有效解决隐私等复杂问题呢?

初步看了下Vana的技术文档,其尝试构建:

1)数据流动性网络(Data Liquidity layer),可以像在DeFi体系灵活使用Token一样,在Vana网络使用数据; 

2)数据可移植层(Data Portability layer),相当于构建了一个生态系统,是数据提供者、开发者、平台能够协作增进数据的有序流通,让开发者可以通过工具接口直接利用数据,也会记录并激励高质量的数据贡献等等;

3)数据“神经网络系统”(Connectome),构建了一个可记录生态实时数据交易的分布式账本,以及一套POS共识机制,确保DLP流动性层能正常运转,还可与外部EVM环境兼容。这是Vana主网上线能够有效解决AI数据问题的核心,是“数据”转化为可估量价值和可追溯流动性的关键基础设施。