您现在的位置是:首页 > 置顶轮播图822*450 >
DeepSeek 一键建群
2025-02-21 11:21:31作者:杨光、王艳、高珊珊来源:中国信息化周报
摘要 人工智能产业2025年年终盘点时,DeepSeek一定会成为绕不开的里程碑。DeepSeek横空出世,成为春节期间当仁不让的流量担当,给产业界带来 ...
理性看待:里程碑式的改进版
DeepSeek是昙花一现,还是基业长青?怎样才能成为长期引领AI发展的关键力量?唯有深挖生态护城河,构筑产业生态的铜墙铁壁。
DeepSeek的日活跃用户数在1月28日首次超越了豆包,并在2月1日突破了3000万大关,成为历史上达到这一里程碑最快的应用。根据Xsignal提供的最新DAU(日活跃用户)数据,截至2月8日,DeepSeek国内APP端日均活跃用户数达到3494万;海外APP端DAU达到3685万,全球Web端日活更是直击4800万。全球日活用户总量达到1.19亿。此外,DeepSeek在2025年1月的活跃用户数跃居国内第一。
用户数量的激增与DeepSeek倡导的价值观密不可分。正如DeepSeek的创始人梁文锋所言,中国AI不可能永远处在跟随的位置。中国AI和美国AI真实的差距是原创和模仿之差,如果不改变,中国永远是追随者。中国产业结构的调整会更依赖硬核技术的创新,当人们发现赚快钱很可能来自时代运气,就会更愿意俯身去做真正的创新。
DeepSeek是否完全走出了一条新路?是否实现了硬核创新?“DeepSeek不一定是原创,但其效果足够颠覆已有的认知。”中国工程院院士邬贺铨对《中国信息化周报》记者表示,“DeepSeek是AI领域的重大技术突破,虽然国外有权威人士认为DeepSeek算不上原创,但从ChatGPT开始,大模型也都是集成了各种新技术并加以实现。”
香港中文大学(深圳)公共政策学院创始院长、前海国际事务研究院院长郑永年认为,DeepSeek是创新,但不是完全另辟蹊径。“我把它称为‘里程碑式的改进版’。如果完全是另辟蹊径,别人就很难复制得了,自己也可能形成新的垄断,自我封闭。实际上DeepSeek和美国一些大模型走的是同一个方向,但证明了有其他的路径可以通往这个方向”。
有专家指出,DeepSeek还没有完成从0到1的核心技术突破。所谓核心技术突破,是主要技术路径的变化,或者具有显著效果的技术升级。而DeepSeek目前最让人称赞的技术能力主要有两点,一是R1模型带火的思维链推理过程,另一个是其联网检索的RAG(检索-增强-生成)效果表现出色。但这两条技术路径都不是DeepSeek开创的。OpenAI在去年9月发布的o1模型带动了思维链的兴起,全球主流大模型纷纷跟进了思维链、推理大模型等能力。各家名称不同,但整体技术路线是非常一致的。DeepSeek确实把思维链展示得更完整、更详细,但使用时能看到,依然有大模型幻觉。而在联网检索方面,其他厂商也早有布局。2023年,百度发布文心一言时,就具备了RAG能力。
虽然没有实现从0到1的突破创新,但影响依旧不容小觑。DeepSeek通过技术实力过硬、性价比高和开源共享三个杀手锏,改变了大模型的游戏规则。DeepSeek以其卓越的推理能力成为AI界的“实力担当”,以实惠的价格成为“性价比之王”,通过开源共享的策略,成为AI界的“组织委员”,凝聚产业链上企业共同推动技术普及和进步。
从技术创新角度看,DeepSeek实现了性能与成本效益的双重突破。DeepSeek的技术创新主要体现在硬件协同设计、训练策略优化等方面。
根据ArtificialAnalysis的评测,DeepSeekV3模型在性能上超越了现有的开源模型,并在多项测试中表现优异,其性能接近顶尖的闭源模型,如GPT-4o和Claude-3.5-Sonnet。DeepSeekV3采用了多种技术创新,如多头潜在注意力(MLA)和负载均衡策略,提高了模型的推理效率和性能。此外,DeepSeek还实现了多token预测(MTP)训练目标,进一步提高了效率。该模型使用了混合专家MoE模型,具有6710亿的总参数量,每个token激活370亿参数,成为目前参数规模最大的开源MoE模型之一。在成本效益方面,DeepSeekV3的训练成本仅为557万美元,远低于行业平均水平,使其成为开源模型中性价比的佼佼者。
有人将DeepSeek在AI技术的创新总结为三个方面。第一,多模态交互能力增强。DeepSeek能够高效处理文本、图像和音频等多种数据类型,满足多样化的应用需求。第二,实现细颗粒度MoE模型。通过动态路由的专家网络,提升任务处理效率。第三,统一自回归架构。采用自回归模型统一处理不同任务和模态,同时注重参数效率和模型的可扩展性。
统信软件高级副总裁、CTO张磊表示,首先,DeepSeek在训练和推理上均有很多创新,能用远低于其他大模型厂商的成本,获得极高能力,减少整个产业对英伟达GPU的依赖,从而更关注软件创新;其次,围绕新的XPU(GPU、NPU、CPU等)将展开更多大模型相关的工作,从而促进AI生态的多样化;再次,各模型团队与AI应用团队都可以参考DeepSeek的方法降低成本,改造模型,尝试嵌入DeepSeek,从而大大促进相关技术与产品在业界的推广,基于新的架构与接口形成新的生态;最后,开源会进一步得到重视,促进开源软件生态的发展。
大模型跨入免费时代:成本降低和AI普及化
幸福来得猝不及防,大模型跨入免费时代。
不知道是不是受DeepSeek触动,中外两大AI巨头同一天宣布了重大决策。
2月13日,百度在其官微宣布,随着文心大模型的迭代升级和成本不断下降,文心一言将于4月1日零时起,全面免费,所有PC端和APP端用户均可体验文心系列最新模型。此外,文心一言即日起还将上线深度搜索功能,该功能也将于4月1日起免费开放使用。
同一天,美国OpenAI公司首席执行官萨姆·奥尔特曼(SamAltman)表示,未来“几周或几个月”推出GPT-4.5和GPT-5。他还提到,免费版ChatGPT将在标准智能设置下无限制使用GPT-5进行对话。此前谷歌也宣布,其最新AI模型套件Gemini2.0正式向所有用户开放使用。
大模型的发展颠覆了摩尔定律———大模型的推理成本,每年能降低90%以上。这一数据不仅令人震惊,也显示出AI技术发展的迅猛势头。
DeepSeek突然爆火,以及全球各大模型宣布免费,是全球大模型成本快速下降大趋势下的必然。成本效益的良性循环是推动技术创新不断向前发展的重要动力。在成本下降的刺激下,创新如雨后春笋,大模型竞赛的下半场已经拉开大幕。
开启一键建群功能 “朋友圈”遍天下
DeepSeek好似春风,吹“绿”产业链的“江南岸”。全产业链热火朝天忙适配,DeepSeek仿佛开启了一键建群功能,一时间“朋友圈”遍天下。从海外巨头到本土企业,从GPU、芯片厂商,到云计算、网络安全厂商争相加入,试图搭上DeepSeek的“青云梯”,进入发展快车道。
英伟达、AMD、微软、亚马逊云科技、英特尔等国际科技巨头已经宣布接入DeepSeek模型服务;华为云、腾讯云、天翼云、阿里云、百度智能云、火山引擎等国内多个云平台已经官宣支持DeepSeek;国内GPU企业如沐曦、天数智芯、摩尔线程、海光信息也在适配DeepSeek;超过15家国产芯片企业,如华为昇腾、壁仞科技、燧原科技、昆仑芯、灵汐科技等,宣布适配或上架DeepSeek模型服务。360集团、安恒信息、奇安信、亚信安全等网络安全公司也宣布接入DeepSeek,提供全方位网络安全防护和智能安全服务。部分工业软件企业也进行了适配,以“AI+工业软件”的方式,助力企业数字化转型。华天软件自主开发的“PLM智能助手”(ProductLifecycleManagement)通过接入DeepSeek大模型技术,解决当前PLM系统存在的知识快速检索及复用难题;而华天软件3DPLAZA智能助手+DeepSeek大模型能通过学习和优化,不断提高软件的性能和准确性。
此外,DeepSeek模型在硬件领域的应用得到了快速发展,多家手机厂商和车企纷纷宣布在自己的产品中接入了DeepSeek模型。OPPO和荣耀已经宣布与DeepSeek达成合作,这将允许用户在手机中直接唤醒和使用DeepSeek的AI功能。
吉利、极氪、岚图、智己等车企也宣布了与DeepSeek模型的深度融合。例如,吉利汽车的自研星睿大模型与DeepSeekR1模型完成了深度融合,这将提升智能座舱的交互能力,例如精准理解用户意图、自动调节空调和座椅通风等。岚图汽车则表示,其智能座舱已经与DeepSeek完成深度融合,并且计划在2月14日开启DeepSeek全民知识蒸馏训练,岚图知音将成为汽车行业首个融合DeepSeek的量产车型。
宝骏汽车、东风汽车、零跑汽车和长城汽车等也宣布接入DeepSeek模型。例如,宝骏汽车的灵语智舱与DeepSeek大模型已完成深度融合,宝骏享境完成实车装载。未来,宝骏云海、宝骏悦也Plus等车型也将陆续通过OTA(“空中下载技术”)实现应用。DeepSeek正在席卷整个APP圈,“包圆”衣食住行玩。“朋友圈”不断扩容,说明DeepSeek模型不仅在技术层面得到了业界的认可,而且在实际应用方面也展现出了广泛的前景和潜力。
开启软件产业新纪元 推动实现三个重构
早在2024年5月份,中控技术便将DeepSeek的V2版本作为公司一款工业AI产品的核心基座大模型,以期为企业研、产、供、销、服、支持保障等各领域推进AI场景应用。这款产品也是中控技术继发布TPT(流程工业时序大模型)之后,又一个工业数智化的“核动力引擎”,预计将在本年度发布。
随着DeepSeekV3、R1等更先进模型的发布,中控技术迅速接入并更新基座大模型,充分利用其卓越的推理能力和开放性,大幅增强逻辑推理能力,大幅降低运行成本,中控技术依托DeepSeek打造的“工业BA超级智能系统”,实现五大多模态感知中枢、工业级BA图数据及图神经网络、工业APP智能构建、全业务链路多智能体协同、工业级分析决策大脑突破。
用友BIP(BusinessInnovationPlatform)近日全面上线以DeepSeekV3和DeepSeekR1作为基座大模型的智能服务,用户可以通过用友BIP3R6智能平台的公有云、专属云模式使用相关服务。此外,还接入了豆包、通义千问、百川智能等多个大模型,实现国产企业软件与国产大模型的融合创新。
中控集团创始人、宁波工业互联网研究院创始人褚健对《中国信息化周报》记者表示,DeepSeek带来的新机遇主要表现在智能化升级加速、软件研发模式革新以及商业模式创新三个方面。第一,DeepSeek为智能化升级带来加速度。通过融合DeepSeek的多模态、强推理等能力,可以极大地拓宽工业软件在执行、管理、决策各环节的智能化边界,融合DeepSeek等大模型能力的工业软件,通过数字劳动力,可以为用户带来极大的运营成本下降和效率的提升;DeepSeek的开源模式以及较低成本运行方式,为智能工业软件的商业部署提供了更好的土壤。第二,工业软件构建模式革新。DeepSeek强大的推理、代码生成等能力,均能深层次改变工业软件企业研发模式,同时提供更好的用户体验,更好地支撑用户的业务变化。第三,商业模式的创新。工业软件企业可以利用DeepSeek,以完善智能化产品和服务、提供数据驱动的决策支持、构建平台化服务、优化产品生命周期管理等方式,应对市场变化,提高服务价值,确保商业模式的可持续性和竞争力。
谈到DeepSeek给工业软件带来深远影响,褚健预测,在不久的将来,传统的工业软件将被由多智能体组成的智能体集群所主导,工业软件行业将出现三个重构。
第一,重构工业软件研发模式。传统面向规则的研发模式转变为AI原生开发过程,基于DeepSeek强大的推理、代码生成等能力,将更高效更低成本地构建工业软件。
第二,重构业务体验。传统面向过程的系统转变为面向目标的系统,基于DeepSeek重构后的工业软件,将从人操作软件变为人机协同的多智能体协同,将传统工业软件变成MAS(Multi-AgentSystem)多智能体系统。
第三,重构决策控制。传统规则式的数据呈现转换为按用户意图构建控制逻辑,基于DeepSeek强大的规划及推理引擎,通过人机协作方式重塑决策过程。
不仅是工业软件,整个软件行业的研发正在迎来新的范式转变。用友iuap平台解决方案专家庄怀轩认为,自大语言模型问世以来,软件行业普遍认为AI原生将成为继云原生之后,引领软件架构新一轮变革的力量。AI原生架构以人工智能模型为核心,依托智能代理驱动和自然语言编程,并通过人机自然交互方式实现应用的智能化。“AI原生架构强调智能和自动化,使开发者能够更加集中精力于业务逻辑的实现,而无需深入关注技术细节。DeepSeek的推理能力,结合智能代理和自然语言编程,极大地提升了开发者编写高质量代码能力,降低了开发门槛,提高了效率。在人机交互方面,系统界面设计更加契合人类思维习惯,使非技术背景人员也能轻松与AI系统互动。与此同时,为了支持AI原生架构的软件开发,需要构建端到端的全方位工具链,这一工具链将涵盖从数据处理、模型管理到应用监控的整个生命周期,极大简化开发流程,提升效率。”
庄怀轩表示,行业标准化也成为必然趋势。DeepSeek针对不同应用场景提供了轻量级、高性能的AI模型版本,以满足多样化的计算需求。未来,模型种类的增多和应用场景的复杂化将促使不同模型间的多次调用成为常态。因此,制定统一的接口标准协议将促进工具和平台间的互联互通,同时鼓励开发者参与构建丰富的AI原生应用生态,实现多方共赢。
DeepSeek带来三大挑战
还有很多企业正在进行适配。统信软件自创立之初就在产品中加入了AI元素,并在2023年推出了UOSAI,发布了世界上首个原生支持大模型的开源操作系统。
张磊表示,DeepSeek受到了广泛的关注,统信软件收到了用户与伙伴希望在统信UOS上部署并使用DeepSeek的请求。“将DeepSeek与用户的业务系统充分结合,还需要做大量工作。DeepSeek使用了多种技术进行性能优化,统信UOS需要与软硬件生态伙伴协作,使其强大的性能充分发挥;此外,从AIforOS来看,DeepSeek的很多特性,如MoE架构、推理增强等,可以给UOSAI相关产品带来新的选择,可以降低整体成本,提高产品质量,但是如何将DeepSeek的创新点融合到我们现有的AI特性中,是一项严峻的挑战”。
“除了技术上带来的影响,本次DeepSeek的爆火对全民做了AI的推广,促进了全民的AI觉醒。”褚健表示,“同时,也带来了新的挑战,主要表现在数据准确性、模式转型、人才三个方面。”第一,对于数据准确性,一定要“锱铢必较”。工业场景下,对于准确性要求极其严苛,基于DeepSeek等大模型驱动的系统,需要在各场景上达到相应的数据准入要求。
第二,传统工业软件企业模式转型势在必行,已到了不转不行的时刻。传统工业软件企业的商业模式、研发模式、交付模式等均需全方位转型,对于企业来说,这将是一场体系化创新,组织架构的革新。
第三,复合型人才稀缺问题不容忽视。既懂工业,又懂数据、AI的全方位人才缺乏。基于DeepSeek等大模型重构工业软件,从模式设计、产品设计到技术落地,均需要人才支撑。
除了DeepSeek,中控技术还陆续引入过ChatGLM-9B、Qwen-13B、Qwen-30B、Qwen-72B等一系列的开源模型。哪个大模型的思维链的推理能力更值得期待?在AI Agent使用场景中,哪个大模型是优等生?褚健表示:“从模型的特点来看,Qwen-72B在对话的稳定性、思维链的推理方面展现出比较出色的能力。同时,我们大量使用了OpenAI的ChatGPT-4o、ChatGPT-o1系列模型,从Agent使用场景来看,ChatGPT表现非常优秀,简单说就是模型参数越大,表现出的问答能力越强,但是部署成本相对较高,类似ChatGLM这类参数较小的模型,问答能力尚可,但是AI Agent的推理能力稍微有点弱。”
是昙花一现,还是基业长青?
目前,DeepSeek模型的生态已经欣欣向荣,成为众多开发者和企业竞相追逐的焦点。很多拥有自研大模型的企业也选择接入DeepSeek模型,给用户提供更多选择,模型和应用端实现了联动与协同。
坚持技术路线的创新,坚持十几年如一日深耕,坚持开源路线是推动DeepSeek火爆出圈的必然因素,但也正因为是开源策略,其他大模型的友商也同样可以找到新的超越路径。更高效的算法、先进的数据处理技术、深度学习和机器学习的进步、跨领域整合、成本效益的提升,任何一种进展都有可能成为超越DeepSeek的捷径。
怎样才能基业长青、一直保持领先?唯有深挖生态护城河,构筑产业生态的铜墙铁壁。
英伟达凭借在GPU领域的持续创新和行业领先地位,建立了宽广的护城河。其技术优势、多元化的生态系统(包括CUDA等开发工具、硬件伙伴关系和开发者社区)以及市场多元化(覆盖PC、游戏、数据中心、自动驾驶等多个高增长领域)增强了客户依赖性,提高了转换成本,降低了市场风险。
北邮人工智能学院教授张闯表示,作为专注于开发先进大模型的企业,DeepSeek需要通过构建开发者生态系统、建立合作伙伴网络、加强研发技术、深化垂直市场、提供优质用户服务以及利用数据驱动创新等策略,加宽护城河,从而增强客户的忠诚度,在激烈的市场竞争中持续保持领先地位。
张闯建议,为了保持领先优势,DeepSeek可以从以下几方面发力。第一,持续开发好底层核心技术,如推理和检索等。第二,尽快赋能前端用户,构建应用生态,形成壁垒。第三,争取得到更多的创新和开发者社区的支持。
尽管DeepSeek“朋友圈”规模不断扩大,但这仅仅是迈出了第一步,毕竟,经营好“朋友圈”,维持好“朋友圈”的阵容不缩水,是一场持久战、攻坚战。
作者手札
在有限的条件下依然能够实现创新突破,进一步巩固中国在AI领域的地位。硬核创新,什么时候都可以开始。如果资源、算力、硬件齐备,万事俱备哪还有创新的必要,更会使创新失去破釜沉舟的冲劲儿。
硬核创新不是模仿与跟随,而是打破桎梏,冲突藩篱,另辟蹊径。硬核创新本就是后来者居上的杀手锏,弯道超车的最佳路径,追随者成为引领者的筹码。
(本文不涉密)
责任编辑:王艳
上一篇:春节中的科技范儿