| |
|
| 知识库 -> 科技 -> 如何看待姚班大神陈立杰官宣入职 OpenAI? -> 正文阅读 |
|
|
[科技]如何看待姚班大神陈立杰官宣入职 OpenAI? |
| [收藏本文] 【下载本文】 |
|
OpenAI内部确认:清华姚班天才、UC伯克利EECS助理教授 陈立杰已加盟OpenAI,负责数学推理!值得一提的是,OpenAI 在去年 9 月发表… |
|
谢邀。首先恭喜陈立杰学弟(学妹?)进入OpenAI。 其次我和陈立杰都在做AI研发。为什么我这么少通稿?为什么没有“清华姚班天才李新野创立Alpha Star Research,负责一切”? 大家还是要辩证地看,不能因为我在文学上的成就就否认我在科学上的成就。 要知道,从古到今,大部分研究都是封闭的。特别是可以运用到军事、商业上的技术。没人会公开给敌人/商业竞争对手。全世界科学家大规模公开发布研究成果也就这几百年的事情。本质上是一种网红经济。一个科学家公开发表了研究成果,然后别人觉得他厉害,然后金主给他打赏。这和我发布《人约》没有本质区别。不能因为我公开发表《人约》但是闭源AI研究成果,就觉得我不是科学家了。 关于现代所谓学术界的本质,可以看这篇回答: 科学研究必须要有足够的证据吗?784 赞同 · 31 评论 回答 我2025年初写过两篇关于我的公司和我们的研究。可以看一下: 如何看待开源模型 DeepSeek 综合性能超过 OpenAI?581 赞同 · 22 评论 回答 广州为什么无法产生类似“杭州六小龙”这样的企业?8073 赞同 · 440 评论 回答 能够把我和陈立杰放一起吗?谢谢大家! |
|
看起来OpenAI对华人AI神童很是迷恋哦。 去年OpenAI挖角XAI的北京神童李雪晨,没想到李雪晨跳槽前卷走了XAI的全部代码。此事惹得马斯克老板龙颜大怒,立刻提出了诉讼。 可怜的李雪晨现在被冻结了所有资产,还被马老板索赔10亿美元,不止OpenAI对他弃如敝履,他自己还被美帝的所有AI公司列入了黑名单,更严重的是不知道要被法院判几年呢。 一失足已成千古恨,再回头不知哪年身。 |
|
一方面,人工智能大公司们和炒作人工智能新闻的“媒体”动辄声称人工智能在多种任务上超越了人类专家、人工智能的能力还在随着规模扩大急速成长,能力是涌现的、增长是指数级的; 一方面,人工智能大公司们和炒作人工智能新闻的“媒体”动辄拿某个“人类天才”、某个“大神”入职作为新闻。看起来,某些关键突破仍然依赖极少数人的“灵感”。 上面的行为展示的两套叙事在本质上矛盾。 显然,现实是,大模型的一些关键能力高度依赖人提供的结构——基础训练数据的标记可以让全球南方的“民工”负责,复杂数学问题要怎么表述、剪枝策略·训练目标·奖励函数要怎么设计、评测要怎么定义、推理框架要怎么构造、如何发现失败模式并加以纠正之类玩意就不是“民工”能处置的了。今日欢呼“大神”来,说明 OpenAI 远未搞定人工智能的认知结构。 这问题是“中文人工智能三大顶刊(贬义)”里最不讲新闻道德的“新智元”发布的,其他用户对问题进行了必要的编辑。 |
|
|
问题日志 Scaling Laws 的适用范围主要是降低交叉熵损失,可能提高概率预测的拟合度。损失函数的下降并不等同于逻辑推理能力的线性提升。引入“大神”,要宣传的大抵是靠个人能力寻找超越单纯堆砌算力的新方法、新机制,提高样本效率。 陈立杰是计算复杂性理论领域的顶级学者,喜欢的话,读者可以考虑他在 P vs NP、电路复杂性、去随机化等数学问题上的造诣。在这问题下,有的回答注意到陈立杰在 Github 的账号用的是犬走椛的头像,他的一些近照是长发清秀男子、跟他上学时的形象大不一样,主张这是“大神经常发生的性别模糊现象”。我认为如此表述是可笑的。在我国,男性数学竞赛高手选择女装的概率高于同龄男性人群的平均水平,这早就不是什么秘密。看起来,陈立杰还没有在公开场合要求学校或媒体改变人称代词。 在此基础上,我认为,OpenAI 画的大饼,靠几个“大神”是烤不出来的。 如果通用人工智能的实现需要超越现有计算层面的硬性障碍,那么数学天才无助于拿当前的硬件搞定问题。“大神”或许能帮助他们寻找近似解的最优边界,但 OpenAI 能靠这玩意兑现他们夸下海口的金钱承诺吗?数学天才可以设计出精妙的推理框架,但要将这框架部署到巨大的人工智能模型里、确保其在成千上万个不同领域表现稳定,是庞大的系统工程问题。“大神”的灵感在工程落地过程中往往被统计规律稀释,除非“大神”找得到比 Transformer 的效率高出数量级的新架构、这种架构还能在超大规模部署时克服硬件加速、数值稳定性等问题。 关于 OpenAI 是怎么走到这一步的、全球南方的数据标注“民工”问题,可以回顾我的回答:ChatGPT 发布三年,你还记得第一次和它的对话吗?这三年间你对 AI 的认知发生了哪些变化?——用来烤饼的燃料是人,是人性。读者喜欢的话,这是黑暗之魂。 “大神”扮演了薪王般的角色,帮助大公司维持大语言模型的“火焰燃烧”。这火炉烧的不止是人类生成的内容,还有数据标注“民工”投入的时间和心理健康。人工智能生成内容对数据的污染还在呼唤更多的“民工”。2025 年 10 月,The Straits Times 报道说,人工智能背后是发展中国家艰苦而低薪的人类工作。世界银行估计,全球有1.5 亿至 4.3亿数据劳动者,他们的工作最终推动了尖端技术的发展。牛津大学的公平工作项目调查了 700 多名在数字劳动平台上工作的劳动者,得出结论:在 15 个受评估的平台中,没有一个在公平薪酬、工作条件、合同、管理和员工权益等方面达到“最低标准”。美国 CBS 电视台的报道称,非洲数据标注员的合同期限非常短,月签、周签、日签。这些工作不仅收入微薄,而且极其耗费精力。截止日期不切实际,而且带有惩罚性——通常只有几秒钟的时间来完成复杂的标注任务。如果你能提前完成工作,那么他们不会付给你定额的工资,而是说声谢谢、给你一瓶汽水和两块肯德基炸鸡。欺诈性的广告把这些工作描述为“呼叫中心代理”,目的是“协助我们的客户社区,并以同理心帮助解决咨询”,然后让他们直面互联网上的黑暗。2023 年初,美国《时代》披露,OpenAI 雇佣肯尼亚工人,时薪不到 2 美元,以降低 ChatGPT 的毒性。这项工作的创伤性最终导致 Sama 在 2022 年 2 月取消了所有与 OpenAI 的合作项目,比原计划提前了八个月。 送礼物 还没有人送礼物,鼓励一下作者吧 |
|
|
OpenAI次世代首席科学家预定! ?在信息学竞赛(OI)和理论计算机科学(TCS)的圈子里,这个名字几乎等同于“传奇”。 陈立杰加入OpenAI 负责Mathematical Reasoning, 了解GPT系列的人,应该知道“数学推理”是OpenAI的金字招牌。 不仅是他们认定的通向AGI路径,更是甩开对手,达成“遥遥领先”,成就未来10倍、100倍回报的基础。 OpenAI对顶级信息数学家的渴望远远超过了Anthropic和Google。 在顶级人才选择中,数学和计算机的双料拉满的,陈立杰应该可以排到全球Top 10。他的学术生涯就是天赋,热情,勤奋全部点满的六边形战士。 他的研究核心是 P vs NP 这一千禧年数学大奖难题。主要研究: ?Circuit Lower Bounds:用数学证明某些计算任务在有限资源下是不可能完成的。 ?Derandomization:研究如何用确定的数学过程取代随机过程。 这些领域要求极强的组合数学、概率论和数论功底。 陈立杰就是给信息学做奠基性的工作。如果OpenAI能用好他,也许可以发现一些人工智能领域的边界性问题。 可以看看他两篇热门文章,都是涉及到最基本的原理层。可以看得出来他的研究野心。 01 / 大语言模型 为何及如何产生幻觉:基于子序列关联的因果探析 这篇文章已经通过了NeurIPS 2025审稿 核心诱因:幻觉源于输入子序列关联强度失衡,模型会因高频共现片段过度拟合,输出统计概率最高的词,进而违背事实约束。 架构机理:Decoder-only Transformer本质是子序列嵌入模型,其线性层编码子序列关联性;受预训练数据长尾效应影响,模型优先习得高频错误模式,导致事实被偏见覆盖。 创新工具:研究开发子序列关联追踪(SAT)算法,通过量化随机化上下文中幻觉概率变化,精准锁定触发令牌,实现幻觉源头的量化分析。 实验验证:SAT算法识别幻觉成因的准确度显著优于传统归因技术,且其识别的错误关联与预训练语料库(如Dolma)数据分布高度一致,证实幻觉与训练数据存在直接因果关系。02 / Reverse Mathematics of Complexity Lower Bounds 复杂性下界的逆数学 ?这不属于那种“提出了一个更快算法”的应用型论文,而是一篇元数学(Meta-mathematical)层面的重量级论文。它解释了“为什么我们在证明复杂性下界时如此艰难”,并给出了精确的逻辑解释。 核心思想: 该论文聚焦证明计算复杂性下界所需的最少数学假设,借助逆数学方法,揭示了计算复杂性下界与基础数学公理的深层关联。 三个核心结论 1. 下界与公理是“一体两面”:诸多经典复杂性下界与鸽巢原理逻辑等价,承认后者即可证前者,反之亦然。 2. 基础下界证明存在逻辑冲突:若现代密码学假设成立,标准数学框架将无法证明部分看似简单的下界,因“加密可行”与“证明计算困难”在逻辑上相悖。 3. 存在下界“放大”现象:特定逻辑系统中,证明弱下界可自动获得证明强下界的能力,二者无本质区别。 送礼物 还没有人送礼物,鼓励一下作者吧 |
|
Trisimo崔思莫再次暴露了他什么也不懂, 内容全靠ai输出... "预定次世代首席科学家", "数学+计算机全球Top 10". 全球的同龄人中他确实非常非常传奇, 但哥们你知道你在说什么吗? 你知道理论计算机的工作是做什么吗? 你但凡知道就不会把计算机和数学拆开评价... 还什么 "顶级信息数学家" , 你想说啥? 还有关于 "Reverse Mathematics of Complexity Lower Bounds", 你的水平不会比我高多少, 都是看不懂论文的路边一条的水平. 举个例子, 给Gemini "Reverse Mathematics of Complexity Lower Bounds 复杂性下界的逆数学, 这篇论文的得出了什么结论?" 这样的prompt. 得到 : "这篇题为 "Reverse Mathematics of Complexity Lower Bounds" (复杂性下界的逆数学) 的论文由 Lijie Chen (陈立杰), Jiatu Li (李佳土) 和 Igor C. Oliveira 撰写,并发表于 FOCS 2024。 这篇论文的主要结论和贡献可以总结如下: 1. 核心结论:复杂性下界与组合原则的等价性 该论文将“逆数学”(Reverse Mathematics)的框架引入到计算复杂性理论中,特别是在**有界算术(Bounded Arithmetic)**的背景下(以 Cook 的 $PV_1$ 理论为基础)。 结论: 许多经典的复杂性下界命题(例如关于通信复杂性、纠错码和图灵机的下界)在逻辑上等价于广泛研究的组合原则,特别是**鸽巢原理(Pigeonhole Principle, PHP)**的各种变体。意义: 这意味着这些复杂性下界不仅仅是独立的定理,它们可以被视为具有基础地位的数学公理。证明这些下界所需的逻辑强度正好等同于证明这些基本组合原则所需的强度。2. 具体案例与等价关系 论文详细分析了几个具体的下界,并建立了它们与逻辑公理的联系: 回文判定(Palindrome)的下界: 对于单带图灵机(Single-tape Turing Machine),判定回文需要 $\Omega(n^2)$ 时间。论文证明这一著名的下界命题在 $PV_1$ 理论下等价于鸽巢原理的某种形式。通信复杂性: 关于“相等性”(Equality)问题的单向通信复杂性下界,也被证明等价于特定的鸽巢原理变体。3. 不可证明性(Unprovability)结果 基于上述的等价性,论文利用密码学假设推导出了惊人的“不可证明性”结论: 结论: 在合理的密码学假设下,上述单带图灵机对回文判定的 $\Omega(n^2)$ 下界在 Je?ábek 的 $APC_1$ 理论(一种包含概率推理的较强理论)中是不可证明的。反直觉: 这挑战了许多研究者的直觉,因为人们通常认为 $APC_1$ 足够强大,可以证明大多数基础的复杂性下界。但这篇论文表明,即使是像“单带图灵机需要平方时间”这样看似简单的下界,在逻辑上也是非常“硬”的。4. 放大效应与随机化 论文还发现了证明复杂性下界时的“放大现象”和与去随机化的联系: 放大(Amplification): 对于某些计算模型,证明一个弱的 $n^{1+\epsilon}$ 下界在逻辑上等价于证明一个更强(甚至紧致)的 $n^c$ 下界。去随机化: 论文证明,在 $PV_1$ 理论中,证明“集合不相交”(Set Disjointness)问题的通信复杂性下界,等价于证明“可行的随机算法可以被确定性地模拟”(即 $APC_1$ 对 $PV_1$ 是保守的)。总结 这篇论文通过将逻辑学的方法应用于复杂性理论,揭示了证明复杂性下界的本质困难。它告诉我们,证明下界之所以困难,是因为在逻辑底层,这等同于确立某些通过算术无法简单推导出的基本组合数学真理。" 但是, 再深入的概念Gemini是解释不出的, 一方面是Gemini智力问题, 另一方面是看不懂论文压根没法问出高质量的问题... 我是读不懂这篇论文, 但我能感觉出你也读不懂, 把论文丢给ai总结出内容的味太浓了. 你是能拿ai生成一些正确挑不出毛病的内容, 但ai没法帮你分析原因, 也没法告诉你OpenAI怎么把理论研究兑换到下一代模型上. 读者从你的内容里获得不了价值. |
|
|
| [收藏本文] 【下载本文】 |
| 上一篇文章 下一篇文章 查看所有文章 |
|
|
|
|
娱乐生活:
电影票房
娱乐圈
娱乐
弱智
火研
中华城市
印度
仙家
六爻
佛门
风水
古钱币交流专用
钓鱼
双色球
航空母舰
网球
乒乓球
中国女排
足球
nba
中超
跑步
象棋
体操
戒色
上海男科
80后
足球: 曼城 利物浦队 托特纳姆热刺 皇家马德里 尤文图斯 罗马 拉齐奥 米兰 里昂 巴黎圣日尔曼 曼联 |
| 网站联系: qq:121756557 email:121756557@qq.com 知识库 |