【英文】工具推荐丨加密领域基准知识图谱

快链头条

2024-10-08 06:33

新闻

8414

CryptoBench 的核心是一套为大语言模型设计的基准测试题集，题目来自多位加密领域专家的集体输入。目前包含 230 个复杂任务类题目和 700 多个选择题，涵盖现代密码学、区块链、Layer2、DeFi、零知识证明、DAO 与治理、代码生成、合约审计等方向。与此对应的，是超过 400 个子类别和 1300 个知识点的加密知识图谱。基于现有题集版本，已完成对 24 个大语言模型的测试，详细的记录、评分、评分依据、排行榜，以及自动化的测试和评分程序都已在 GitHub 上公开。虽然内容看起来不少，但整体还很早期，称不上是成熟的大模型测试基准。希望得到大家的批评指正，也期盼更多朋友未来能参与问题设计与加密图谱的梳理。\n原文链接

温馨提示：

快链头条登载此文本着传递更多信息的缘由，并不代表赞同其观点或证实其描述。

文章内容仅供参考，不构成投资建议。投资者据此操作，风险自担。

提示：投资有风险，入市须谨慎。本资讯不作为投资理财建议。