欢迎来到ga黄金甲平台阀门科技有限公司,我们竭诚为您服务!

ga黄金甲平台 > ga黄金甲平台新闻中心 > 行业资讯

科大讯飞纯国产算力的讯飞星火X1新版本将在今年三东瀛电竞月完成

时间:2025-02-15 01:16 来源:网络

  纯国产算力的讯飞星火X1新版本将在今年三月完成,预期可实现对OpenAI o1数学答题和过程思维链能力的全面对标甚至超越东瀛电竞。

  杭州深度求索基础技术研究有限公司(DeepSeek)于近期发布的DeepSeekV3和DeepSeekR1大模型引发了全球市场的广泛关注。围绕高效推理和经济训练的创新算法,DeepSeek以较低的成本实现了大语言模型的性能效果突破。

  认为,DeepSeek热潮在全球范围内是一次深刻的用户普及教育,它引发了全球媒体的广泛报道东瀛电竞,使得人工智能的话题得到更广泛的传播,大量原本对该领域了解有限的人群开始接触和使用AI产品。

  同时,DeepSeek吸引了大量云服务厂商、算力企业、芯片厂商、应用端企业等产业链上下游积极参与,国产算力厂商将会投入更多资源支持国产大模型的适配,更多的行业客户对大模型技术和应用有了广泛的关注和期待。人工智能产业规模将加速发展,对国内长期投入培育人工智能市场的企业大有裨益。

  对标DeepSeek,科大讯飞分析了二者在大模型训练和推理方面的特征。DeepSeek的训练算东瀛电竞力设施基于英伟达A800和H800。通过多个有效的软硬件结合深度工程优化创新,DeepSeek最终基于2048张H800卡,以约560万美元就能完成V3模型的一次完整预训练,实现东瀛电竞了成本的大幅降低。

  讯飞星火大模型在算力设施上则选择全国产路线,是当前通用大模型APP中,唯一一家训练与推理均在国产算力上进行的大模型。在训练成本上,讯飞星火使用一万张910B国产算力卡,取得了大模型研发上的第一梯队成果,将通用大模型训练效率相比A100从最初的30%-50%优化达到了85%-95%以上。公司表示,星火大模型的单次训练成本和DeepSeekV3在一个层次,随着国产算力在底层能力上的提升,讯飞星火的训练成本有望进一步下降。

  在推理模型的应用领域方面,科大讯飞认为,DeepSeek R1作为慢思考类深度推理模型,在强化学习训练方面和数学、代码等推理任务上有着出色表现。讯飞星火则更适用于、医疗等行业场景的深度应用,在专业积累方面更加突出。通过基础模型叠加行业知识RAG、场景定制优化工具链、多模态能力等配套组件及解决方案,讯飞星火完成具体场景中端到端的应用。

  今年1月15日,科大讯飞举行讯飞星火升级发布会,正式发布国内首个基于全国产算力平台训练的具备深度思考和推理能力的大模型——讯飞星火深度推理模型X1。据了解,其模型策略在医疗领域的验证已取得初步成效,可使专科辅助诊断和复杂病历内涵质控的准确率达到90%。

  本次电话会中,公司披露,正在训练的星火X1新版本预计将在今年三月完成,预期可实现数学答题和过程思维链能力全面对标甚至超过OpenAI o1。目前,X1深度推理模型正在进一步结合与中国教科院等诸多专家的合作,模型通过专业知识反思及长思维链强化学习结合,生成符合教育教学需求的“教学思维链”,以提高复杂场景推理的逻辑正确性、专业性和可解释性。据悉,该模型将率先应用于教师助手、批改、辅学等产品东瀛电竞创新。

  资料显示,讯飞开放平台已于2月10日正式上线包括“满血版”DeepSeek-V3和DeepSeek-R1在内的DeepSeek全系产品,并支持公有云API调用和一键部署专属模型东瀛电竞。(刘一枫)

Copyright © 2002-2024 ga黄金甲平台有限公司 版权所有琼ICP备2022019106号
HTML地图 XML地图txt地图 | 琼ICP备2022019106号