deepseek“朋友圈”再扩容:华为、京东相继加入 云计算、芯片、ai应用公司都来了-凯发棋牌

凯发棋牌-k8凯发赢家一触即发
更多>
凯发棋牌-k8凯发赢家一触即发
聚焦新闻
×
凯发棋牌-k8凯发赢家一触即发 > 研究 > 研究

deepseek“朋友圈”再扩容:华为、京东相继加入 云计算、芯片、ai应用公司都来了

来源:科创板日报  作者:《每日财讯网》编辑  发布时间:2025-02-06

摘要:  随着deepseek热度飙升,其“朋友圈”也在快速扩容。   今日,京东云宣布正式上线deepseek-r1和deepseek-v3模型,支持公有云在线部署、专混私有化实例部署两种模式。...

随着deepseek热度飙升,其“朋友圈”也在快速扩容。 

  今日,京东云宣布正式上线deepseek-r1和deepseek-v3模型,支持公有云在线部署、专混私有化实例部署两种模式。前几日,阿里云、百度智能云、华为云、腾讯云、火山引擎、天翼云已接入了deepseek模型。海外的亚马逊aws、微软azure等云巨头同样官宣支持。

  多家国产芯片厂商亦纷纷响应。华为今天宣布deepseek-r1、deepseek-v3、deepseek-v2、janus-pro上线昇腾社区;deepseek-v3满血版在国产沐曦gpu首发体验上线。天数智芯、摩尔线程、海光信息也在2月4日宣布支持deepseek模型。而英伟达、amd、英特尔等海外芯片巨头在更早已完成支持。

  此外,无问芯穹、硅基流动等ai基础设施厂商,以及青云科技、ppio派欧云、云轴科技等独立云厂商,已宣布适配及上架模型服务。

  从底层芯片到云服务商,随着deepseek朋友圈的扩大,有望进一步推动大模型的低成本化,扩大ai的垂直应用场景。

  目前,华为小艺助手app的智能体广场已上线deepseek-r1的beta版。科创板上市公司光云科技、当虹软件等也接入deepseek系列模型开展应用探索。

六大云巨头上线deepseek系列模型 推动开源生态发展

  deepseek旗下大模型“爆火”后,国内主流云平台均陆续上线了相关模型。

  今日,京东云言犀ai开发计算平台宣布支持deepseek-v3、deepseek-r1以及所有蒸馏小参数模型(deepseek-r1-distill)的一键部署。

  春节期间,华为云和硅基流动联合首发并上线了基于华为云昇腾云服务的deepseek-r1/v3推理服务。阿里、腾讯、百度、火山引擎等云厂商也上线了deepseek系列模型。其中,百度智能云还提出了限时免费的服务方案。至此,国内六大云巨头都已正式支持deepseek。

  中国云平台集中上线deepseek,其背后是云厂商们希望在deepseek的火爆浪潮中,吸引更多客户使用其算力和服务。

  ai产品榜的数据显示,deepseek仅上线18天时日活就突破1500万,而chatgpt过1500万花了244天,增速是chatgpt的13倍。上线20天后,deepseek日活已达2215万,是chatgpt日活用户的41.6%,超过豆包的日活用户1695万。

  云基础设施厂商有望受益于deepseek带来的新叙事,而deepseek的成功,也将提振整个开源社区的共建氛围,使得更多开源模型能够“站在巨人肩膀上”快速进步。

  相比openai的闭源路线,deepseek选择了开源的开放路线,这类似于pc时代的windows和linux之争。面对deepseek的爆火,openai首席执行官萨姆·阿尔特曼此前承认称,openai在开源策略上“站在了历史的错误一边”,并表示需要考虑制定不同的开源策略。

华泰证券认为,开源模型的优势体现在社区共建和技术共享。理论上所有的小参数模型均能够直接利用deepseek-r1蒸馏出的标签数据,来增强推理性能。2025年或是开源模型快速进步的一年,国产大模型进展值得关注。

  主流国产芯片兼容支持 挑战和机遇并存

  在芯片领域,deepseek-r1、deepseek-v3、deepseek-v2、janus-pro正式上线昇腾社区,支持一键获取deepseek系列模型,支持昇腾硬件平台上开箱即用,同时提供精度性能微调,推理服务化快速部署等能力,

  摩尔线程也发文称,已实现对deepseek蒸馏模型推理服务的部署。为推进国产ai生态发展,摩尔线程即将开放自主设计的夸娥(kuae)gpu智算集群,全面支持deepseek-v3、r1模型及新一代蒸馏模型的分布式部署。

  天数智芯与gitee ai成功完成了与deepseek-r1的适配工作,并且已正式上线多款大模型服务,其中包括deepseek-r1-distill-qwen-1.5b、deepseek-r1-distill-qwen-7b、deepseek-r1-distill-qwen-14b等。天数智芯还称,正在与并行科技、算力互联等多家伙伴,开展deepseek包括r1在内的多款模型的适配与上线,后续即将上线的并行科技平台,不仅面向普通用户和开发者,更是主要面向企业用户的ai服务平台。

  gitee ai联合沐曦于2月2日首发全套deepseek-r1千问蒸馏模型,实现了从芯片到平台,从算力到模型,全国产研发、中国制造。2月5日,gitee ai进一步表示,deepseek-v3满血版在国产沐曦gpu首发体验上线。

  而海光信息也完成了deepseek v3和r1模型与海光dcu(深度计算单元)的适配,并正式上线。

  此外,国家超算互联网平台已正式上线deepseek-r1模型的1.5b、7b、8b、14b版本,并将于近期陆续更新32b、70b等版本。除r1模型外,国家超算互联网平台还上线了deepseek-v3、deepseek-v2.5系列、deepseek-coder系列、deepseek-math系列(7b)和deepseek-v2系列(lite)等模型。

  “deepseek大模型与国产芯片的适配基本不花时间,而性能优化估计一周完成。”有算力领域人士介绍。

  “当下,主流国产芯片已基本实现对deepseek 蒸馏版小模型的兼容支持。这意味着,只要此前能够运行llama、qwen这类常见模型,如今便可直接无修改地运行deepseek蒸馏版小模型。”魔形智能联合创始人徐凌杰对记者表示,“可以预见,随着基于 deepseek的应用如雨后春笋般爆发,越来越多芯片厂商的入局,新一轮市场竞争与价格调整或许即将拉开帷幕。”

  不过,徐凌杰也指出,满血版的v3和r1拥有6710亿参数,这使得它们对硬件的要求大幅提升。同时,由于采用了此前未被广泛应用的moe专家并行(ep)策略,其运行需要额外的推理框架支持。

  “目前,仅有少数几家国产芯片成功上线了满血版。要想完全解锁deepseek高性能、低成本的推理优势,按照官方推荐配置,需在推理的解码部分部署320个gpu,以实现完全的专家并行。这种‘超节点’式的部署方式,对所有国产芯片厂商而言,既是全新的挑战,也是难得的机遇。”徐凌杰提到。

  扩大ai的应用场景

  谈及未来deepseek对国内ai产业链的利好影响,沐曦联合创始人杨建表示,最大的影响是强化学习的蒸馏流程开源,让大模型在垂直领域的后训练和推理成本急剧下降,同时在垂直领域的可用性急剧上升,同时催生大模型在各行各业的认知,拉升私有化垂直模型部署的愿望。r1蒸馏32b模型的能力逼近openai的o1,使得企业可以私有化低成本部署而不用担心泄密问题,部署意愿极大提高。

  trendforce集邦咨询研究指出,deepseek模型虽然降低了ai训练成本,但ai模型的低成本化可望扩大应用场景,进而增加全球数据中心建置量。光收发模块作为数据中心互连的关键组件,将受惠于高速数据传输的需求。未来ai服务器之间的数据传输,都需要大量的高速光收发模块,这些模块负责将电信号转换为光信号并通过光纤传输,再将接收到的光信号转换回电信号。trendforce数据显示,2023年400gbps以上的光收发模块全球出货量为640万个,2024年约2040万个,预估至2025年将超过3190万个,年增长率达56.5%。

  “实际上从22-24年对大模型应用的风险投资在减少,今年可能会逆转。因为后训练成本急剧下降。”杨建对《科创板日报》表示。

  随着deepseek带动模型成本的下降,有望推动ai应用的爆发。科创板上市公司光云科技当虹科技等都在探索deepseek模型的落地应用。其中,快麦小智是光云科技旗下智能客服机器人,其基于大模型的智能体产品绫智的多项业务场景和功能支持deepseek各个版本。光云科技方面称,将持续推动旗下ai产品与包括deepseek在内的大模型深度适配。

当虹科技blackeye多模态视听大模型正式融合deepseek-r1和deepseek janus pro,并完成视听传媒、工业与卫星、车载智能座舱等多行业垂类场景的数据调优训练。

  deepseek给ai应用带来更大的想象力,今日金山办公一度触及20cm涨停。不过《科创板日报》了解到,金山办公尚未与deepseek正式合作,有接近金山办公的人士对《科创板日报》记者表示,金山办公正在与deepseek进行对接测试,未来是否合作要看后续发展。

  在研究层面,杨建预计,各大研究机构都会研究新技术来做预训练和后训练,加快新算法落地。“实际上deepseek使用的很多方法是高校研究成果的优秀集成,每年出现那么多新方法,究竟哪些组合才能产生最大产出和价值,可能有很多组合没有被发现,今年肯定有更多的算法创新爆发。deepseek只是一个星星之火的燃点。”

  在人才方面,杨建判断,大模型应用人才培养会更受重视。2022-2024年聚集在少数企业,整体业界水平在萎缩。同时,2022-2024年高校并没有培养大模型应用人才。25年春节反应比较快的高校已经开始计划春季大模型应用人才培养,到秋天会覆盖数百所高校会跟随,今年全国有望培养大模型应用开发人才30-50万。


责任编辑:《每日财讯网》编辑

上一篇:

下一篇:没有了!

分享到:

〖免责申明〗本文仅代表作者个人观点,其图片及内容凯发棋牌的版权仅归原所有者所有。如对该内容主张权益请来函或邮件告之,本网将迅速采取措施,否则与之相关的纠纷本网不承担任何责任。

相关文章

评论框

请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
用户名: 密码:

 客服电话:010-57135130 传真:010-57135130 邮箱:mrcxnews@163.com

本站郑重声明:每日财讯网所发布的文章、数据仅供参考,本网不对信息的完整性、及时性负任何责任,投资有风险,选择需谨慎。

k8凯发赢家一触即发 copyright up to 2022 mrcxnews.com all rights reserved. 《中华人民共和国增值电信业务经营许可证》编号:京b2-20171131号 【】  

网站地图