最近,硅谷的一众大咖开启了“夸夸模式”,都被国产AI DeepSeek惊艳到了1xbet官网APP。我们也惊喜地发现,这是一个超级年轻、完全本土化的团队。更让人好奇的是,以他们为代表的年轻人,为何如此有创新能力?究竟是怎样的土壤孕育了这样的新生代?
2025年的第一波科技震撼,来自国产人工智能DeepSeek(深度求索)。
1月20日晚,DeepSeek发布新模型 DeepSeek-R1 正式版。很快,访问量激增,甚至一度让DeepSeek闪崩,但问题在数分钟内得到解决。
截至发稿,DeepSeek已经在App Store中国区免费榜登顶,在美区也已经飙升至第二,仅次于ChatGPT。
在专业测试中,该模型表现优于OpenAI、Meta和Anthropic等一众美国领先人工智能公司。
更重要的是,DeepSeek仅仅用了十分之一的成本,就达到了GPT-o1级别的表现。
与国际巨头相比,DeepSeek这个国产AI凭借更低成本、更强性能和更开放的技术路线,迅速引发全球关注。
英伟达高级研究科学家Jim Fan评论说:“我们生活在这样一个时代:一个不是美国公司的AI企业却实现了 OpenAI成立时的使命——做真正开放的前沿研究、为所有人赋能”;
而扎克伯格则立即表示,Meta计划在 2025 年投入超过 600 亿美元,加大对人工智能的投入。
自2022年底ChatGPT问世以来,AI正在空前地快速迭代。如何培养孩子的创新思维和全球视野,在日新月异的科技商业世界中谋求一方天地,成了许多家长最挂心的问题。
创立于2023年7月,DeepSeek诞生至今还不足两年,但这却不是它第一次成为众人瞩目的焦点。
去年,他们发布的DeepSeek V2的开源模型,提供了一种史无前例的性价比:
推理成本被降到每百万token仅1块钱,相当于花1块钱就能写1万条小红书(以350字计算),约等于GPT-4 Turbo的1/70。因此,DeepSeek还得了个“AI界拼多多”的名号。
去年底发布的DeepSeek-V3,延续了这种超高性价比的特点。它以极低的训练成本,实现了与GPT-4o等顶尖模型相媲美的性能。
而此次推出的新模型DeepSeek-R1,不仅成本低,更是在技术上有了大福提升。最重要的是,它还是一个开源模型。
熟悉AI的朋友可能有所了解,以GPT为代表的大语言模型,是以巨大的算力喂养出来的。
而巨大的算力则需要巨大的能耗、高昂的成本——有云计算专家提出,1万枚英伟达A100芯片是做AI大模型的算力门槛——这往往不是一家创业公司能够负担得起的。
而且,根据DeepSeek的说法,国内最好的AI模型水平和国外最好的相比,因为模型和训练方式的差距,可能需要消耗4倍算力,才能达到同等效果。
有钱、有芯片,就卡死了国内一大片想要人工智能大模型的创业公司。套用李开复的话,这是一个“前排玩家”才有资格入局的游戏。
DeepSeek的掌舵人梁文锋,此前更广为人知的身份,是私募巨头幻方量化的创始人。而这家公司,则是迄今为止业内唯一规模曾迈过千亿大关的量化私募,据说每年用于慈善捐款的预算都有数亿元。
梁文锋一直是人工智能的忠实信徒,坚信AI可以改变世界。所以在DeepSeek创立之初,它就是大厂外唯一一家储备万张A100芯片的公司。
但“有资格入局”和“玩出名堂“毕竟是两码事——真正让DeepSeek震撼行业的,是其凭一己之力,实现了技术创新,松动了“唯有大力才能出奇迹”的游戏规则。
训练AI的推理能力传统的方法通常是,给AI模型一个范本答案,通过微调指令和过程奖励模型,来让模型学会用思维链思考。有的还会加入会加入算法,让模型找到最优解。然后再不断反复强化,使模型向范本无限靠近。
而DeepSeek-R1则采用了一种“纯”强化学习路径,只给出两个基本规则:答对了加分,答错了扣分;同时要求模型用特定方式记录思考过程。让模型在不断尝试和得到反馈中来提升推理能力。
这种直接的训练方式,虽不完美,但极大提高了训练效率,也大幅减少了对计算资源的需求。
当然,这只是DeepSeek“减负增效”魔法的一小部分。压缩、并行、提升硬件使用效率,DeepSeek一直在技术端尝试,如何“花小钱办大事”。所以,与外界普遍认为的烧钱不同,DeepSeek已经实现盈利。
2025年了,人工智能领域的竞争已经白热化。Open AI都不open(开源)了,Deepseek此举可不仅仅是姿态上好看,更是对那些试图通过出售技术来获取巨额利润的公司构成了实打实的挑战。
从这个角度上看,让硅谷难安的DeepSeek,可说是翻开了AI技术发展的新一页。
对于DeepSeek模型在美引发的广泛讨论,背后的操盘手梁文锋却很淡然1xbet官网APP。
他在接受媒体采访时表示,“在美国每天发生的大量创新里,这是非常普通的一个。他们之所以惊讶,是因为这是一个中国公司,在以创新贡献者的身份,加入到他们游戏里去。毕竟大部分中国公司习惯follow,而不是创新。”
1985年,出生于广东湛江的梁文锋为人低调,但在技术创新上却是信心十足。
在浙江大学先后拿到电子信息工程学士学位和信息与通信工程硕士学位后,2015年,梁文锋和两位浙大校友共同创立了幻方量化。
之后,仅用了六年,幻方便抵达千亿规模,并被业界称为“量化四大天王”之一。
彼时,幻方就自带一股离经叛道的气质。和其他同类公司创始人大多拥有海外对冲基金履历不同,幻方完全本土起家,独自摸索,而且在很多做法上也没有“按照约定俗成的道路”走,大大方方按照自己想要的方式来。
梁文锋坚持对人工智能的研发投入,就是很好的例证。他从在浙大读书时就坚信,人工智能可以改变世界。在专注做量化的数年间,他也没有停下对AI领域的关注和探索。
2019年,幻方量化成立1xbet官网APPAI公司,其自研的深度学习训练平台“萤火一号”总投资近2亿元,搭载了1100块GPU;两年后,“萤火二号”的投入增加到10亿元,搭载了约1万张英伟达A100显卡。
据梁文锋自己说,这是一个“好奇心驱动”而非商业逻辑下的动作,所以在当时很多人都不理解。不过,如今再看,恰恰是这份对技术的好奇、对创新的向往,让他比很多大厂都更早拿到了做Open AI的算力入场券。
父亲是一名小学老师,经常有家长找到家里来,谈的“基本就是家长觉得读书没用”。九十年代,广东赚钱机会很多,读书反而显得又些“不务实”。
或许是对这件事的反思,也或许是对自身技术能力的自信,梁文锋在采访中透露出一种坚定从容的气质,即使是没有人做过的事、不被理解和支持的事,他也能不被周围裹挟、坚持做自己认为对的事。
这一次,入局人工智能领域,选择做AGI(Artificial general intelligence,通用人工智能)的基础模型,而不是做产品,亦是如此。
在梁文锋看来,以中国今天的经济体量,中国企业完全有资本去创新,真正缺乏的,其实是信心,以及不知道怎么组织高密度的人才,实现有效的创新。
DeepSeek石破天惊一般地问世,让大家不禁好奇,实现了如此创新的团队,是一群怎样的人?
梁文锋对此回应,“并没有什么高深莫测的奇才,都是一些Top高校的应届毕业生、没毕业的博四、博五实习生,还有一些毕业才几年的年轻人。”
年轻化、本土化,是DeepSeek核心团队最鲜明的特点。这也是梁文锋人才观的体现,目前在人工智能领域,“前50名顶尖人才可能都不在中国,但也许我们能自己打造这样的人。”
“量子位”资料显示,在DeepSeek搞科研的人中,有很多是应届生、在读生,尤其是来自清北的。
DeepSeekMath核心作者之一邵智宏,是清华交互式人工智能(CoAI)课题组博士生。研究领域包括自然语言处理、深度学习等,之前还曾在微软研究院工作过;
在DeepSeek担任训练/推理基础架构工程师的赵成钢,此前是衡水中学信息学竞赛班成员,CCF NOI2016银牌得主,清华学生超算团队成员,曾三次获得世界大学生超算竞赛冠军,还有英伟达实习经历。
前段时间被全网热议的“95后AI才女”罗福莉,也是因为在DeepSeek的项目经验,才有了后来被雷军“相中”、许以千万年薪的故事。
和很多科技公司一样,DeepSeek对人才的核心标签都是“年轻高潜”,只是DeepSeek对于没有经验的年轻人的偏爱,要更加极致一些:
年龄在1998年出生左右,工作经验最好不要超过五年,“聪明、理工科、年轻、经验少”。
还有消息称,DeepSeek非常重视竞赛成绩。有多个第三方合作机构表示,DeepSeek对竞赛成绩看得非常重,“基本金奖以下就不要了”。
如此说来,说DeepSeek聚集了一群天才,也不算夸大。这种人才聚集模式,为国内的科技创新组织也提供了全新的组织范式。
不过DeepSeek的特别之处,还不仅仅在于挖掘到这部分顶级人才的能力,更重要的是在管理方式上,这家创业公司也有在认真鼓励创新。
有DeepSeek前员工向媒体透露1xbet官网APP,在那里工作期间,他可以获得丰富的计算资源,并可以自由地进行实验,“这是应届毕业生在其他任何公司都无法享受到的奢侈”。
梁文锋在采访中也证实了这一点。“我们每个人对于卡和人的调动是不设上限的。如果有想法,每个人随时可以调用训练集群的卡无需审批。同时因为不存在层级和跨部门,也可以灵活调用所有人,只要对方也有兴趣。”
所以,DeepSeek也不做前置分工,全部自然分工。每个人自带想法,然后主动拉人讨论,当这个想法显现出潜力,公司再自上而下调动资源支持。
DeepSeek之所以如此青睐年轻人,还有一个很重要的原因,那就是创新的底气。
当ChatGPT出现时,国内对前沿创新普遍缺乏信心,从投资人到大厂,都倾向于做应用而非突破。即便也做大模型,还是离不开堆资源堆硬件的老路子。除了出于盈利模式的考虑,对创新不敢想、不敢做,也是一大阻碍。
初生牛犊不怕虎的道理,自是不用说。不过在外滩君看来,梁文锋,和他手下这群锐不可当的年轻人身上,可贵的并不只如此,还有一种对世界祛魅后由内而外的自信。
可以说,DeepSeek代表了国内新一代年轻人的创新精神:不受传统“美国擅长创新”叙事的束缚、突破了“从1到10”的应用思维局限、对全球科技发展有更加开放和自信的视野。
对上一代创业者来说,科技创新的故事总是围绕硅谷展开,所以很多人心里默认也接受了“美国擅长从0到1的创新,中国擅长从1到10的应用”这套逻辑。
但对这一代年轻人来说,从小就习惯了走出去看世界,他们也自然没有那层“外国月亮”的滤镜。对西方叙事的祛魅,反而让他们无师自通地克服了一些历史遗留的“桎梏”。
如果说一代人有一代人的时代红利,那么这种创新的底气,又何尝不是这一代年轻人天然的优势呢?
孩子的创新能力,需要天赋,更需要后天成长环境的创新生态。毕竟,真正的创新从来都不是一蹴而就,而是在一个宽容、鼓励试错的环境中一步一步迭代出来的。
正如DeepSeek目前打造出的这个创新氛围十分浓厚的环境,每所学校、每个家庭也完全有可能成为一个小小的“创客天地”。
培养新一代创新人才,需要我们用新的教育理念和引导方式。不苛责每一个看似不成功的想法。每一次看似荒谬的尝试,可能都是创造力萌发的契机。
关键是构建一个低压力、高支持的成长空间。鼓励提问,尊重不同观点,让孩子明白探索本身就是一种有价值的学习。创新不仅仅是解决问题,更是培养独立思考和勇于尝试的能力。
最终,孩子们会明白,创新精神不一定非得在硅谷,创新也不一定意味着完美。走在持续探索的路上,那本身就是值得赞许的创新之举了。
原标题:《震惊硅谷,中国AI刷屏!背后奇才团队,揭示了这代孩子突围的关键》
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。