
国产 AI 新锐 DeepSeek(深度求索) 悄然发布了其最新的 o1 级别推理模子R1,犹如一颗深水炸弹,先是引爆整个硅谷,随后战栗整个宇宙!这件事的影响力全球都知说念了, 事情还在不息发酵,刚刚OpenAI 的首席掂量 Mark Chen 躬行下场有计划DeepSeek R1,固然笃定了DeepSeek R1的掂量发现,但是作风终点奥密,还有DeepSeek前实习生工关于Mark Chen的回话体育游戏app平台,整个进程不要太精彩,我整理了一下,共享给全球 Mark Chen “作风奥

国产 AI 新锐 DeepSeek(深度求索) 悄然发布了其最新的 o1 级别推理模子R1,犹如一颗深水炸弹,先是引爆整个硅谷,随后战栗整个宇宙!这件事的影响力全球都知说念了, 事情还在不息发酵,刚刚OpenAI 的首席掂量 Mark Chen 躬行下场有计划DeepSeek R1,固然笃定了DeepSeek R1的掂量发现,但是作风终点奥密,还有DeepSeek前实习生工关于Mark Chen的回话体育游戏app平台,整个进程不要太精彩,我整理了一下,共享给全球
Mark Chen “作风奥密” 回话 DeepSeek:既笃定又“划重心”?Mark Chen 的推文,名义上是祝愿 DeepSeek 取得的成立,但仔细品尝,却能感受到一点奥密的 “酸味” 和 “防护” 姿态
他率先承认 DeepSeek 体育游戏app平台“孤独发现了 OpenAI 在 o1 模子研发进程中的一些核感情念”, 原话:
“祝愿DeepSeek收效研发出o1级推理模子!他们的掂量论文标明,他们孤独发现了咱们在竣事o1进程中所接纳的一些中枢想想”
这无疑是对 DeepSeek 技能实力的一次高调认同,也侧面印证了 DeepSeek 模子的硬核实力。
可是,话锋一滑,Mark Chen 立行将焦点转换到 “资本” 问题上,合计 “外界对资本上风的解读有些偏激”。他抛出了一个略显专科的意见——“双轴优化 (pre-training and reasoning)”, 说明说,将模子锻真金不怕火和推理视为两个可孤独优化的维度,可以更有用地规章资本。他的音在弦外似乎在示意:DeepSeek 你在资本规章上作念得可以,但咱们 OpenAI 也能作念到,况兼咱们还有更全面的上风!
为了进一步 “划重心”,Mark Chen 还提到了 “蒸馏技能” 的熟悉和 “资本与才调理耦” 的趋势, 示意 OpenAI 也在积极探索模子压缩和优化技能,裁减管事资本。他强调, “低资本管事模子(尤其是在较高延伸下)并不料味着领有更强的模子才调”, 试图弱化 DeepSeek 在资本方面的上风对 OpenAI 才调上风的冲击
临了,Mark Chen 不忘 “画饼”, 强调 OpenAI 将不息在 “裁减资本” 和 “培植才调” 两个方朝上 “双管皆下”,并欢喜 “本年会发布更优秀的模子”。这番回话,既有对 DeepSeek 技能实力的笃定,也充满了 OpenAI 算作行业指令者的自信和 “捍卫地位” 的意味。毕竟,DeepSeek 此次发布的 o1 模子,平直挑战的是大模子最中枢的 推理才调,这无疑激荡了 OpenAI 的敏锐神经。
前 DeepSeek 实习生 “扎心”回怼 :OpenAI,说好的“绽开”初心呢?如若说 Mark Chen 的回话还算官方 “过招”, 那么DeepSeek实习生Zihan Wang 对Mark Chen回话较为机敏!(尊府炫耀,他 曾接事于 DeepSeek,并深度参与了 RAGEN 时势!) 他还显现我方 早在 2022 年就暖热 OpenAI,并对其早期的 VPT 和 ChatGPT 时势印象久了,致使在伯克利的课程时势也作念了访佛 VPT 的尝试!曾是 OpenAI 的早期 “粉丝”。
Zihan Wang 坦言,他并非挑升冒犯,只是有趣也曾以 “绽开 AI” 为名的 OpenAI,为安在开源问题上变得如斯 “彷徨” 和 “保守”。他回忆起 2022 年 OpenAI 的 VPT 和 ChatGPT 时势,其时他对 OpenAI 的印象是 “绽开、改进、引颈翌日”,充满了乐不雅和信任。但如今,他嗅觉 OpenAI “变了”,变得不再像过去那样 “地说念”,不再像过去那样 “为了更紧迫的事” 而辛苦, 似乎愈加防备交易利益和竞争上风。
DeepSeek 源代码在那儿?更料想的来了, 另一位网友 Autark 追问Zihan Wang ,他平直 “喊话” DeepSeek:“DeepSeek 的源代码在那儿?我说的不是权重或推理支撑代码,我要的是确凿的源代码!”
濒临 Autark 的追问,Zihan Wang 也给出了他了解到的 DeepSeek 官方说明:
“DeepSeek 团队东说念主数有限,开源需要参加特等的无数职责,不单是是让锻真金不怕火框架跑起来那么肤浅 (open-sourcing needs another layer of hard work beyond making the training framework brrr on their own infra)。因此,DeepSeek 当今优先聚焦于迭代下一代模子, 在开源方面,他们优先开源 ‘最小化 + 必要’ 的部分,同期通过发布瞩方针技能叙述,并饱读舞社区进行复现, 来弥补开源的不及。”
“华东说念主 AI 力量” 的崛起,中好意思 AI 竞争的新注脚?有网友簸弄两位来自不同国度的顶级东说念主工智能公司的华东说念主代表在 X上争论,这可能是 2025 年的一个好兆头
尊府炫耀,Mark chen 高中就读于中国台湾省National Experimental High School(2004年 - 2008年),本科就读于MIT的Mathematics with Computer (2008年 - 2012)。
依然在OpenAI职责6年4个月,今天1月刚刚从OpenAI掂量副总裁升任为首席掂量。
zihan wang 本科就读于中国东说念主民大学,好意思国西北大学在读PhD。
zihan wang 2024年2月 - 2024年7月 在DeepSeek 实习,
A. 期骗疏淡架构锻真金不怕火专科化言语模子。通过选用最好的5%内行进行专科化大言语模子(LLM)调优,梗概竣事接近十足的性能。该论文算作第一作家在EMNLP 2024会议上展示
B. 与团队成立了DeepSeek-V2,一个领有2360亿参数的模子,接纳多头潜在提神力机制来压缩LLM成果瓶颈中的KV缓存,裁减了42.5%的资本,生成速率培植了5.76倍,赢得了3.5k GitHub星标和10万用户
临了,Zihan Wang 也补充声明:强调他的不雅点仅代表个东说念主,不代表 DeepSeek 官方态度
本文开头:AI寒武纪,原文标题:《OpenAI 首席掂量 Mark Chen :DeepSeek孤独发现了o1 核感情念,可是市集响应过度》。
风险教导及免责要求 市集有风险,投资需严慎。本文不组成个东说念主投资忽视,也未探究到个别用户极度的投资方针、财务情状或需要。用户应试虑本文中的任何意见、不雅点或论断是否合适其特定情状。据此投资,包袱自诩。