当前位置: 首页 » 资讯 » 科技头条 » 正文

传微软中国 Azure 裁员,N+7 补偿;黄仁勋网吧见 Faker,抽百万美元显卡;机器人请求流量首超人类|极客早知道

IP属地 中国·北京 极客公园 时间:2026-06-06 10:26:35



OpenAI 升级 ChatGPT 记忆系统:改善记忆过时、提高准确性

OpenAI 公司宣布升级 ChatGPT 记忆功能,新系统基于 Dreaming V3 机制,重点改善记忆过时、准确性和大规模服务能力

ChatGPT 记忆系统原本用于记住用户偏好和长期信息,从而减少每次对话都要重新说明背景的麻烦。

ChatGPT 的记忆功能最早在 2024 年 4 月上线,当时主要是 saved memories(保存记忆)。这套机制依赖用户明确提出「记住某件事」,系统只在对话中写入少量信息。到 2025 年 4 月,OpenAI 首次把 Dreaming 引入 ChatGPT 记忆系统。与保存记忆不同,Dreaming 能借助后台流程参考聊天历史,自动筛选并整理与用户相关的内容,不再过度依赖「请记住」这类强提示。

过去 1 年里,这套能力一直作为保存记忆的补充,显著提升了个性化效果,也缓解了旧记忆陈旧的问题,但当时还不足以单独支撑完整记忆系统。

而本次升级的重点,是把 Dreaming 升级为更成熟的底层架构。OpenAI 用 3 个标准衡量「好记忆」:一是延续有用上下文,二是遵循用户偏好和限制,三是能随时间自动更新。

在运行机制方面,OpenAI 表示本次升级围绕着 dreaming 展开,重点针对记忆容易过时、内容准确性不足,以及面对数亿用户和多年使用周期时的扩展压力优化,在原有基础上更强,也更节省计算资源。

新系统会自动整合重要细节,并把生成的记忆以摘要形式展示在记忆摘要页。用户可以快速查看 ChatGPT 掌握了哪些关于自己的信息,也能补充、修改个人资料,以及告诉 ChatGPT 哪些话题该在什么场景下提起。如果想了解某项记忆的细节,用户还能直接与模型对话追问。

在开放范围上,美国 Plus 和 Pro 用户昨日起可以体验新版记忆系统,同时记忆容量提升至原来的 2 倍。

OpenAI 表示,近期改进已把 Dreaming 服务 Free 用户所需算力压低至五分之一,因此终于能在质量达标的前提下向免费用户推广。(IT 之家)


SpaceX 与谷歌签署 300 亿美元算力服务协议:每月支付 9.2 亿美元,租用 11 万颗英伟达 GPU

Alphabet Inc.旗下谷歌已同意向埃隆·马斯克的 SpaceX 每月支付 9.2 亿美元,以获取算力。这是一项持续至 2029 年年中的云服务协议的一部分,也是谷歌数周内与人工智能(AI)竞争对手达成的第二项此类协议。

根据周五提交的监管文件,谷歌将使用约 11 万个英伟达图形处理器,以及位于 SpaceX 数据中心内的中央处理器、内存和其他组件。该协议从今年 10 月持续到 2029 年 6 月,月费为 9.2 亿美元,按此计算,协议期内总金额约为 300 亿美元。相关算力在 9 月之前将逐步提升,费用会相应降低。

如果 SpaceX 未能在 2026 年 9 月 30 日前交付约定数量的 GPU,在一个月宽限期之后,谷歌可以选择立即终止协议,或接受已交付的 GPU 数量,并相应按比例减少月费。在 2026 年 12 月 31 日之后,任一方均可提前 90 天通知终止协议。(新浪科技)

消息称微软中国 Azure 大裁员,理论最高补偿 N+7

6 月 5 日消息,多名自称微软员工的用户在社交平台发文称,微软中国 Azure 大裁员靴子已落地,ImportBusiness Update 邮件通知已发,被裁人员超过 200,基本上是微软云中国研发「一锅端」了。HR 要求 6 月 11 日前签字,7 月 6 日 last day(最后一天)。

赔偿标准和去年 7 月微软大裁员基本一致,N+4+2(6 月 11 之前签字奖励)+1(离职缓冲期一个月),理论上最高补偿 N+7

公开报道信息显示,自 2025 年至今,微软确实在全球进行了多轮战略重组,已累计开展多轮裁员,总规模超过 24000 人(含自愿离职计划)。2026 年 1 月微软全球范围裁员,当时有报道称,微软计划裁员 1.1 万至 2.2 万人,波及 Azure 云团队。今年 6 月也有消息称,微软将对 Azure for Operators 等团队裁减「数百人」。(IT 之家)

高通宣布车端人工智能 Claw 生态计划,将智能体 AI 引入智能座舱

6 月 5 日消息,在 2026 高通汽车技术与合作峰会上,高通技术公司与诚迈科技、车联天下、斑马智能、德赛西威、镁佳科技、中科创达等生态企业,宣布车端人工智能 Claw 生态计划。

官方表示,此项生态计划将骁龙数字底盘解决方案与高通智能体 AI 运行环境结合,并发挥各家生态企业在座舱、车载操作系统、智能体中间件、AI 应用和量产交付方面的能力。这一计划旨在消除长期以来阻碍下一代汽车智能开发的碎片化问题,为车企提供一条从概念验证到量产落地更快速、更集成化的路径。

通过车端人工智能 Claw 生态计划,高通技术公司与生态企业致力于将 AI 智能体和多模态大模型直接部署到车端,推动汽车从「移动工具」进化为「智能伙伴」。

我们获悉,车端人工智能 Claw 生态计划和智能体 AI 运行环境聚焦全天候多模态感知、支持复杂决策的百亿参数大模型、车规级安全架构、持续演进的 AI 生态系统等核心能力。(IT 之家)


MiniMax 就改用 Token 计费致歉,公布订阅权益保护与档位迁移方案

6 月 5 日消息,MiniMax 发布 Token Plan 升级与权益调整说明,就 M3 模型上线后的 Token Plan 计费切换、订阅权益保护与档位迁移方案进行说明。

MiniMax 官方表示,为了回馈订阅用户,现推出以下方案:

3.22 前购买、没有周限额的老用户,本次升级后 M2.7 和 M3 都将继续保持无周限额

3.22 - 本周五上午 10:00 前购买 Token Plan 的用户,在有效订阅周期内,M3 周限额永久加赠 50%

为了让大家更加畅快地体验 M3 在长程复杂任务上的提升,我们于6 月 2 日统一重置额度,并且在 M3 上线后的前 7 天内(6.1 - 6.7),所有订阅用户的 5 小时 / 周使用额度翻倍,详情可在控制台中查看

关于此前迁移方案中发放的补偿积分,有效期将从一个月自动修正为 1 年(自发放日起),本周陆续订正中,自动生效。(IT 之家)

互联网史上首次:Cloudflare 称机器人请求流量已超人类

6 月 5 日消息,科技媒体 Tom's Hardware 发布博文,报道称 Cloudflare 首席执行官马修 · 普林斯(Matthew Prince)称,互联网机器人请求流量已首次超过真人流量。

按当前统计口径,网站 HTTP 请求中,机器人占 57.5%,人类占 42.5%,而且这一变化比他此前预期更早到来。

普林斯此前预测这一交叉点可能出现在 2027 年末,后来又调整到 2027 年初。而伴随着 AI 智能体的快速崛起,流量增长速度明显超出预估。

这里的机器人流量不仅包含传统意义上的网站爬虫、搜索索引程序,或欺诈、滥用脚本,而且还涵盖 AI 智能体、AI 聊天等。

这些 AI 智能体会像真人一样访问网页,典型任务包括读取商品页面、检查价格、比对航班、抓取和索引网页内容,以及充当个人助手完成点餐、购物比较和客服交互。

Cloudflare 也特别提醒,这组数据统计的是请求次数,而非用户参与度。真人用户依旧主导应用使用时长、视频流媒体观看和信息流浏览。(IT 之家)

消息称小鹏机器人核心产品一号位施晓鑫 6 月初主动离职

6 月 5 日消息,据职场 Bonus 报道,小鹏机器人产品规划高级总监施晓鑫已于 6 月初正式离职。

报道称,从入职到离场,施晓鑫在小鹏机器人完整履职 1675 天,横跨鹏行智能整合、团队并入小鹏集团、IRON 人形机器人从原型迭代至量产筹备全周期,是小鹏人形产品体系从 0 到 1 搭建的标杆元老。

据悉,施晓鑫为南京大学计算机本科、悉尼科技大学 IT 硕士,早年深耕海外商用服务机器人赛道,曾任法国 NAO 机器人亚太区技术负责人,主导多场国际顶级科技展机器人落地项目,是国内最早一批钻研人形交互与产品落地的行业老兵。

文中提到,2021 年前后,他入局小鹏系机器人业务,2023 年小鹏刚完成鹏行智能并购、正式锚定 IRON 人形机器人研发路线,施晓鑫作为产品一号位,全权执掌 IRON 全系列产品定义、落地 IRON 门店导购。(IT 之家)

腾讯首发效率智能体工具集,覆盖 20 多个垂直场景 Agent

6 月 5 日上午消息,2026 腾讯云 AI 产业应用大会在北京举办。面对个人和企业日益增长的 AI 提效需求,腾讯在大会上首次系统发布「效率智能体工具集」,面向个人提效、办公提效、企业提效三类需求,针对 20 多个垂直场景提供差异化的智能体解决方案。

针对个人用户,本地 AI 助手 QClaw 首创「微信直连」模式,并打通腾讯文档、腾讯会议、ima、QQ 邮箱等工具;个人知识智能体 ima 可以支持创建专属 Agent,并通过记忆系统,持续理解用户;个人 AI 助理元宝则支持「元宝派」一键接入「龙虾」;QQ 浏览器也上线了伴随式 Agent 服务,并与元宝联合推出行业首个高考咨询师 Agent「元宝高考通」。

面向白领、开发者、OPC、设计师等职场人群,腾讯推出了「Buddy」家族系列产品,应对代码研发、文档处理、创意设计等高频生产力场景需求。其中,AI 智能体桌面工作台 WorkBuddy 个人版,发布 3 个月以来,累计迭代 43 个版本,按 DAU 计,已是国内最受欢迎的效率智能体工具;编码智能体 CodeBuddy,覆盖编码、评审、测试、运维等研发流程;腾讯妙境 Miora、Ardot 面向创意生成和交互设计场景,提升专业工作效率。

针对企业用户,腾讯还正式发布 WorkBuddy 企业版(WorkBuddy Enterprise)及办公智能体套件 Agent Suite,升级企业智能体管控平台 ClawPro 和智能体开发平台 ADP 4.0,形成完整覆盖 Agent 构建、连接、分发与治理全生命周期的产品矩阵。(新浪科技)

黄仁勋在网吧与 Faker 见面,现场抽了「全球仅此一张」英伟达 RTX 5090 签名显卡

6 月 5 日消息,英伟达创始人兼 CEO 黄仁勋抵达韩国,在机场接受媒体采访后,直接前往首尔西部麻浦区东桥洞的 T1 基地网吧,与电竞选手 Faker(李相赫)会面。

现场视频显示,黄仁勋在网吧现场抽了一张 RTX 5090 签名显卡送给粉丝,该显卡上面有黄仁勋和 Faker 的签名,黄仁勋表示全球仅此一张,价值百万美元。

黄仁勋在抵达聚会地点后接受媒体采访时表示,他为韩国带来了英伟达的四项新业务,作为一份「惊喜」。

据黄仁勋介绍,「四大业务」包括英伟达下一代人工智能(AI)超级芯片平台「Vera Rubin」、「Vera」中央处理器(CPU)、英伟达首款 AI 笔记本电脑系列「RTX Spark」,以及专为下一代人形机器人和物理 AI 而设计的边缘 AI 计算平台「Jetson Thor」。

黄仁勋还表示,英伟达已着手在韩新建 AI 技术中心项目,正在录用韩国 AI 技术研究工程师、机器人工程技术人员。(IT 之家)


全球限 499 辆:奥迪最强超混超跑 Nuvolari 登场,零百加速 2.6 秒

6 月 5 日消息,汽车媒体 gazzetta 发布博文,报道称奥迪在法国发布 Nuvolari 超级跑车,搭载插电混动系统,0 到 100 km/h 加速 2.6 秒,极速超过 350 km/h。

外观方面,Nuvolari 首次在 Audi 公路车上采用完整 CFRP 碳纤维车身,并搭配铝制 Audi Space Frame。

64 个可动金属件组成的新 Singleframe 格栅,加上 3 段式主动尾翼,最高可带来 400 公斤下压力。内饰方面,奥迪重点放在材料质感和驾驶专注度。深色前舱区域减少视觉干扰,显示区和控制区集中在驾驶者视野内。


动力系统采用插电混动设计,4.0 升 V8 双涡轮发动机可输出 800 马力,转速可达 10,000 转。车上还有 3 台轴向磁通电机,每台 150 马力,综合功率升至 1001 马力。

输出方面,Nuvolari 从 0 到 100 公里每小时只需 2.6 秒,0 到 200 公里每小时为 6.8 秒,最高车速超过 350 公里每小时。前轴 2 台电机负责四驱和扭矩矢量分配,另 1 台电机集成在双离合变速箱中。

新车全球限量 499 辆,官方价格未公布,预计超过 50 万欧元(注:现汇率约合 394.1 万元人民币)。(IT 之家)

赛豆科技与字节合作的全新汽车品牌 6 月 9 日将发布

由赛力斯集团参股的重庆赛豆科技有限公司(简称「赛豆科技」)将于 6 月 9 日晚发布全新汽车品牌。新京报贝壳财经记者了解到,这是赛豆科技和字节跳动旗下火山引擎深度合作的汽车品牌,将探索 AI 定义汽车的无限可能。

据知情人士透露,赛豆科技新品牌将按照 LOGO、英文名、中文名逐步释放消息。

此前媒体报道称,赛豆科技与字节跳动旗下的火山引擎深度合作,首款车型预计今年内推出,或为介于 SUV 和轿车之间的跨界车,推纯电和增程双动力。相关车型主要与火山引擎合作车机交互大模型,智驾方案或与元戎启行合作。(msn)

腾讯混元提出 Stem 稀疏注意力算法,首字延迟降低 3.6 倍

6 月 5 日消息,腾讯混元宣布提出 Stem 稀疏注意力算法,已被机器学习顶会 ICML-26 收录。

官方表示,Stem 稀疏注意力算法从「因果信息流」重新审视块级稀疏,用 Token 位置衰减(TPD)和输出感知度量(OAM)两大创新,仅用 25% 算力就逼近稠密注意力的精度。配套的 HPC 算子库则将这份理论加速比真正转化为端到端的实测性能。


▲ Stem 在 Hy3 preview(W8A8-FP8)上更贴近生产环境的真实落地数据

根据 Stem 算法 × HPC 算子的全栈加速方案,算法层面,Stem 通过 Token 位置衰减(TPD)和输出感知度量(OAM)实现25% 预算下的近无损精度;算子层面,HPC 开源的 Stem+BSA 算子将稀疏收益转化为真实硬件加速,128K 上下文下首字延迟降低 3.6 倍。(IT 之家)


▲ 模型精度


剑桥大学团队 AI 设计通用疫苗完成首次人类临床试验,未来有望提前「拦截」大流行病

剑桥大学 6 月 5 日宣布,研究团队利用 AI 技术研发出一种「通用疫苗」,目标是在未来大流行真正暴发前提前拦截风险。这也是人类临床试验首次使用活性成分完全由计算机设计的疫苗,试验结果未发现明显副作用。

研究人员在英国南安普敦和剑桥两家医疗机构,为 39 名 18 岁至 50 岁的健康志愿者接种了这款疫苗。据悉,疫苗主要针对 Sarbeco 冠状病毒,关键活性成分是一种突破性抗原。

试验显示,志愿者接种后,产生了针对 SARS-CoV-2、SARS 及未来可能引发大流行的相关蝙蝠病毒的保护性免疫反应。按照这种开发思路,疫苗甚至有望对尚未出现的新疾病提供保护。

传统疫苗通常是在疫情暴发后才开始研发,面对病毒不断变异时往往难以及时跟上。相比之下,这种新的「超级抗原」有望为流感、埃博拉等会在人群中传播的疾病提供一种一体化防护方案。

剑桥大学兽医学系病毒性人畜共患病实验室教授乔纳森 · 希尼表示:「我们已经把疫苗开发从被动应对变成面向未来。即使病毒变异成新毒株,我们的疫苗也会继续提供保护。传统疫苗保护范围有限,我们已经克服了这个问题。这意味着我们可以摆脱不断追赶人群中流行病毒变体、再更新疫苗试图补上的循环,就像狗追自己的尾巴一样。」

研发过程中,研究团队把全球已经记录的 Sarbeco 冠状病毒基因序列数据全部输入 AI 模型,再通过机器学习设计出一种抗原,让抗原具备整组病毒共有的特征。(IT 之家)

*

播客上新

有人说,这届 Google I/O 2026 遗憾太多:旗舰模型 Gemini 3.5 Pro 缺席,视频模型 Veo 没有更新,Android 17 提前一周「泄」了底,Antigravity 被全网说「抄别人家作业」……

但这些,真的是遗憾吗?

本期节目,我们请来了亲赴 Google I/O 现场的 Alumni Ventures 投资总监 Bryan Liu,和深钻硬件领域的极客公园作者 Alan,揭秘这场发布会背后谷歌藏着的更大野心。

长按下方「卡片二维码」即可收听~我们的播客「开始连接LinkStart」(小宇宙 App),一起用科技、商业和人文的视角描摹这个时代。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。