新开普:星普大模型内部测评智能推理效果与DeepSeek-R1相近,算力消耗约其1/20

PANews 3月7日消息,据金十报道,新开普3月6日在机构电话交流会表示,公司自研的星普大模型,通过SFT+RL(监督微调+强化学习)的训练技术,在内部测评验证中,实现了与Dee

2025-03-07 09:52:21   作者:  Plbbdwl

PANews 3月7日消息,据金十报道,新开普3月6日在机构电话交流会表示,公司自研的星普大模型,通过SFT+RL(监督微调+强化学习)的训练技术,在内部测评验证中,实现了与DeepSeek-R1相近的智能推理效果,而算力消耗仅约为其1/20,下一步将参加行业评测,以获取行业公认数据。算力消耗降少可降低硬件投入,节约的算力预算可以为让渡给软件提供了空间,为更多软件、智能体服务及智能应用提供增加预算的空间,在降低算力硬件投入的同时仍要保证使用体验与服务精度。
登录或注册发表您的评论

可能感兴趣的贴文

区块链如何运作?
区块链由三个重要概念组成:区块、节点和矿工。区块每条区块链链由多个区块组成,而区块是由三个基本元素组成:块中的数据。一个 32 位整数,称为nonce……
区块链如何运作?
区块链由三个重要概念组成:区块、节点和矿工。区块每条区块链链由多个区块组成,而区块是由三个基本元素组成:块中的数据。一个 32 位整数,称为nonce……
区块链如何运作?
区块链由三个重要概念组成:区块、节点和矿工。区块每条区块链链由多个区块组成,而区块是由三个基本元素组成:块中的数据。一个 32 位整数,称为nonce……
区块链如何运作?
区块链由三个重要概念组成:区块、节点和矿工。区块每条区块链链由多个区块组成,而区块是由三个基本元素组成:块中的数据。一个 32 位整数,称为nonce……

其他加密货币(Cryptocurrency)社区

对于其他加密货币的统称,包含稳定币,竞争币……如USDT,USDC,BNB(币安币)ETC(以太坊经典)……


社区规则

禁止人身攻击、暴力威胁、八卦、任何形式的诽谤、发布人们的私人信息。

禁止误导性标题宣传

禁止产品和项目促销

仅限中文,对于非中文的文章请提供来源链接以及准确的翻译