中国大模型领域最受瞩目的创业者梁文锋和杨植麟在DeepSeek和月之暗面两个公司所面临的挑战。两家公司都在关注Transformer架构最核心的注意力机制,即如何让模型更好地处理长上下文。DeepSeek正在推出新模型Prover-V2,该模型在miniF2F测试通过率以及普特南测试上表现优异,并在算法工程师、知乎用户“小小将”看来,Prover-V2的推出与新模型R2或V4的上线没有必然联系,更像是一个独立模型的更新。另一方面,DeepSeek与Kimi作为明星初创公司正在遭受大公司的追赶和超越,以月之暗面旗下的Kimi为例,在用户数量和投流费用上已经超过了Kimi。DeepSeek也受到了过多的关注和光环,中国大模型产业需要两三个世界领先的大模型,而不是一个,应该鼓励这个领域的竞争和创业。越来越多的玩家参与大模型开源竞赛,但只有技术最先进的玩家才能定义标准。
梁文锋和杨植麟再“撞车”
中国企业家杂志
梁文锋真要读博?网友炸锅了
这篇文章探讨了当前中国科技创业领域的一个热点话题:博士学历与创业成功之间的关系。文章以福耀科技大学校长王树国提出的"灵魂三问"为引子,引发对博士教育价值的思考。文章重点分析了三位成功创业者梁文锋、王兴兴和汪滔的成长经历。他们都是硕士毕业后选...
投资界|2025-05-29 15:40
DeepSeek最新研究揭秘:V3大模型成本降低方案曝光
DeepSeek团队最新发布的论文详细介绍了DeepSeek-V3在训练和推理过程中如何突破硬件瓶颈。这篇由梁文锋亲自参与的论文,展示了仅用2048块H800 GPU就能达到数万块GPU集群训练效果的关键技术。论文重点阐述了四项创新优化方法...
量子位|2025-05-18 12:36
DS爆火100天,创业者想拜拜梁文锋
2024年底还徘徊在倒闭边缘的张旸(化名),年初就接到了DeepSeek带来的泼天富贵。“没能倒闭,全靠DeepSeek。”作为一家AI硬件企业的创始人,张旸去年把国内大小投资机构的码头拜了个遍,尽管出身大厂,却没拿着高管title,没能拿...
字母榜|2025-05-13 16:45
梁文锋和杨植麟再“撞车”
被追赶和超越,是创业者常面对的挑战。文|《中国企业家》记者 闫俊文编辑|张晓迪继2月论文“撞车”之后,梁文锋和杨植麟又在另一个大模型赛道上相遇了。4月30日,DeepSeek上线新模型DeepSeek-Prover-V2,这是一个数学定理证...
中国企业家杂志|2025-05-05 10:36
本信息来自互联网,不代表导读网立场,如若转载,请注明出处:http://www.frfey.com/news/49522/




