![]()
![]()
OpenAI 升级 ChatGPT 记忆系统:改善记忆过时、提高准确性
OpenAI 公司宣布升级 ChatGPT 记忆功能,新系统基于 Dreaming V3 机制,重点改善记忆过时、准确性和大规模服务能力。
ChatGPT 记忆系统原本用于记住用户偏好和长期信息,从而减少每次对话都要重新说明背景的麻烦。
ChatGPT 的记忆功能最早在 2024 年 4 月上线,当时主要是 saved memories(保存记忆)。这套机制依赖用户明确提出「记住某件事」,系统只在对话中写入少量信息。到 2025 年 4 月,OpenAI 首次把 Dreaming 引入 ChatGPT 记忆系统。与保存记忆不同,Dreaming 能借助后台流程参考聊天历史,自动筛选并整理与用户相关的内容,不再过度依赖「请记住」这类强提示。
过去 1 年里,这套能力一直作为保存记忆的补充,显著提升了个性化效果,也缓解了旧记忆陈旧的问题,但当时还不足以单独支撑完整记忆系统。
而本次升级的重点,是把 Dreaming 升级为更成熟的底层架构。OpenAI 用 3 个标准衡量「好记忆」:一是延续有用上下文,二是遵循用户偏好和限制,三是能随时间自动更新。
在运行机制方面,OpenAI 表示本次升级围绕着 dreaming 展开,重点针对记忆容易过时、内容准确性不足,以及面对数亿用户和多年使用周期时的扩展压力优化,在原有基础上更强,也更节省计算资源。
新系统会自动整合重要细节,并把生成的记忆以摘要形式展示在记忆摘要页。用户可以快速查看 ChatGPT 掌握了哪些关于自己的信息,也能补充、修改个人资料,以及告诉 ChatGPT 哪些话题该在什么场景下提起。如果想了解某项记忆的细节,用户还能直接与模型对话追问。
在开放范围上,美国 Plus 和 Pro 用户昨日起可以体验新版记忆系统,同时记忆容量提升至原来的 2 倍。
OpenAI 表示,近期改进已把 Dreaming 服务 Free 用户所需算力压低至五分之一,因此终于能在质量达标的前提下向免费用户推广。(IT 之家)
![]()
SpaceX 与谷歌签署 300 亿美元算力服务协议:每月支付 9.2 亿美元,租用 11 万颗英伟达 GPU
Alphabet Inc.旗下谷歌已同意向埃隆·马斯克的 SpaceX 每月支付 9.2 亿美元,以获取算力。这是一项持续至 2029 年年中的云服务协议的一部分,也是谷歌数周内与人工智能(AI)竞争对手达成的第二项此类协议。
根据周五提交的监管文件,谷歌将使用约 11 万个英伟达图形处理器,以及位于 SpaceX 数据中心内的中央处理器、内存和其他组件。该协议从今年 10 月持续到 2029 年 6 月,月费为 9.2 亿美元,按此计算,协议期内总金额约为 300 亿美元。相关算力在 9 月之前将逐步提升,费用会相应降低。
如果 SpaceX 未能在 2026 年 9 月 30 日前交付约定数量的 GPU,在一个月宽限期之后,谷歌可以选择立即终止协议,或接受已交付的 GPU 数量,并相应按比例减少月费。在 2026 年 12 月 31 日之后,任一方均可提前 90 天通知终止协议。(新浪科技)
消息称微软中国 Azure 大裁员,理论最高补偿 N+7
6 月 5 日消息,多名自称微软员工的用户在社交平台发文称,微软中国 Azure 大裁员靴子已落地,ImportBusiness Update 邮件通知已发,被裁人员超过 200,基本上是微软云中国研发「一锅端」了。HR 要求 6 月 11 日前签字,7 月 6 日 last day(最后一天)。
赔偿标准和去年 7 月微软大裁员基本一致,N+4+2(6 月 11 之前签字奖励)+1(离职缓冲期一个月),理论上最高补偿 N+7。
公开报道信息显示,自 2025 年至今,微软确实在全球进行了多轮战略重组,已累计开展多轮裁员,总规模超过 24000 人(含自愿离职计划)。2026 年 1 月微软全球范围裁员,当时有报道称,微软计划裁员 1.1 万至 2.2 万人,波及 Azure 云团队。今年 6 月也有消息称,微软将对 Azure for Operators 等团队裁减「数百人」。(IT 之家)
高通宣布车端人工智能 Claw 生态计划,将智能体 AI 引入智能座舱
6 月 5 日消息,在 2026 高通汽车技术与合作峰会上,高通技术公司与诚迈科技、车联天下、斑马智能、德赛西威、镁佳科技、中科创达等生态企业,宣布车端人工智能 Claw 生态计划。
官方表示,此项生态计划将骁龙数字底盘解决方案与高通智能体 AI 运行环境结合,并发挥各家生态企业在座舱、车载操作系统、智能体中间件、AI 应用和量产交付方面的能力。这一计划旨在消除长期以来阻碍下一代汽车智能开发的碎片化问题,为车企提供一条从概念验证到量产落地更快速、更集成化的路径。
通过车端人工智能 Claw 生态计划,高通技术公司与生态企业致力于将 AI 智能体和多模态大模型直接部署到车端,推动汽车从「移动工具」进化为「智能伙伴」。
我们获悉,车端人工智能 Claw 生态计划和智能体 AI 运行环境聚焦全天候多模态感知、支持复杂决策的百亿参数大模型、车规级安全架构、持续演进的 AI 生态系统等核心能力。(IT 之家)
![]()
MiniMax 就改用 Token 计费致歉,公布订阅权益保护与档位迁移方案
6 月 5 日消息,MiniMax 发布 Token Plan 升级与权益调整说明,就 M3 模型上线后的 Token Plan 计费切换、订阅权益保护与档位迁移方案进行说明。
MiniMax 官方表示,为了回馈订阅用户,现推出以下方案:
3.22 前购买、没有周限额的老用户,本次升级后 M2.7 和 M3 都将继续保持无周限额
3.22 - 本周五上午 10:00 前购买 Token Plan 的用户,在有效订阅周期内,M3 周限额永久加赠 50%
为了让大家更加畅快地体验 M3 在长程复杂任务上的提升,我们于6 月 2 日统一重置额度,并且在 M3 上线后的前 7 天内(6.1 - 6.7),所有订阅用户的 5 小时 / 周使用额度翻倍,详情可在控制台中查看
关于此前迁移方案中发放的补偿积分,有效期将从一个月自动修正为 1 年(自发放日起),本周陆续订正中,自动生效。(IT 之家)
互联网史上首次:Cloudflare 称机器人请求流量已超人类
6 月 5 日消息,科技媒体 Tom's Hardware 发布博文,报道称 Cloudflare 首席执行官马修 · 普林斯(Matthew Prince)称,互联网机器人请求流量已首次超过真人流量。
按当前统计口径,网站 HTTP 请求中,机器人占 57.5%,人类占 42.5%,而且这一变化比他此前预期更早到来。
普林斯此前预测这一交叉点可能出现在 2027 年末,后来又调整到 2027 年初。而伴随着 AI 智能体的快速崛起,流量增长速度明显超出预估。
这里的机器人流量不仅包含传统意义上的网站爬虫、搜索索引程序,或欺诈、滥用脚本,而且还涵盖 AI 智能体、AI 聊天等。
这些 AI 智能体会像真人一样访问网页,典型任务包括读取商品页面、检查价格、比对航班、抓取和索引网页内容,以及充当个人助手完成点餐、购物比较和客服交互。
Cloudflare 也特别提醒,这组数据统计的是请求次数,而非用户参与度。真人用户依旧主导应用使用时长、视频流媒体观看和信息流浏览。(IT 之家)
消息称小鹏机器人核心产品一号位施晓鑫 6 月初主动离职
6 月 5 日消息,据职场 Bonus 报道,小鹏机器人产品规划高级总监施晓鑫已于 6 月初正式离职。
报道称,从入职到离场,施晓鑫在小鹏机器人完整履职 1675 天,横跨鹏行智能整合、团队并入小鹏集团、IRON 人形机器人从原型迭代至量产筹备全周期,是小鹏人形产品体系从 0 到 1 搭建的标杆元老。
据悉,施晓鑫为南京大学计算机本科、悉尼科技大学 IT 硕士,早年深耕海外商用服务机器人赛道,曾任法国 NAO 机器人亚太区技术负责人,主导多场国际顶级科技展机器人落地项目,是国内最早一批钻研人形交互与产品落地的行业老兵。
文中提到,2021 年前后,他入局小鹏系机器人业务,2023 年小鹏刚完成鹏行智能并购、正式锚定 IRON 人形机器人研发路线,施晓鑫作为产品一号位,全权执掌 IRON 全系列产品定义、落地 IRON 门店导购。(IT 之家)
腾讯首发效率智能体工具集,覆盖 20 多个垂直场景 Agent
6 月 5 日上午消息,2026 腾讯云 AI 产业应用大会在北京举办。面对个人和企业日益增长的 AI 提效需求,腾讯在大会上首次系统发布「效率智能体工具集」,面向个人提效、办公提效、企业提效三类需求,针对 20 多个垂直场景提供差异化的智能体解决方案。
针对个人用户,本地 AI 助手 QClaw 首创「微信直连」模式,并打通腾讯文档、腾讯会议、ima、QQ 邮箱等工具;个人知识智能体 ima 可以支持创建专属 Agent,并通过记忆系统,持续理解用户;个人 AI 助理元宝则支持「元宝派」一键接入「龙虾」;QQ 浏览器也上线了伴随式 Agent 服务,并与元宝联合推出行业首个高考咨询师 Agent「元宝高考通」。
面向白领、开发者、OPC、设计师等职场人群,腾讯推出了「Buddy」家族系列产品,应对代码研发、文档处理、创意设计等高频生产力场景需求。其中,AI 智能体桌面工作台 WorkBuddy 个人版,发布 3 个月以来,累计迭代 43 个版本,按 DAU 计,已是国内最受欢迎的效率智能体工具;编码智能体 CodeBuddy,覆盖编码、评审、测试、运维等研发流程;腾讯妙境 Miora、Ardot 面向创意生成和交互设计场景,提升专业工作效率。
针对企业用户,腾讯还正式发布 WorkBuddy 企业版(WorkBuddy Enterprise)及办公智能体套件 Agent Suite,升级企业智能体管控平台 ClawPro 和智能体开发平台 ADP 4.0,形成完整覆盖 Agent 构建、连接、分发与治理全生命周期的产品矩阵。(新浪科技)
黄仁勋在网吧与 Faker 见面,现场抽了「全球仅此一张」英伟达 RTX 5090 签名显卡
6 月 5 日消息,英伟达创始人兼 CEO 黄仁勋抵达韩国,在机场接受媒体采访后,直接前往首尔西部麻浦区东桥洞的 T1 基地网吧,与电竞选手 Faker(李相赫)会面。
现场视频显示,黄仁勋在网吧现场抽了一张 RTX 5090 签名显卡送给粉丝,该显卡上面有黄仁勋和 Faker 的签名,黄仁勋表示全球仅此一张,价值百万美元。
黄仁勋在抵达聚会地点后接受媒体采访时表示,他为韩国带来了英伟达的四项新业务,作为一份「惊喜」。
据黄仁勋介绍,「四大业务」包括英伟达下一代人工智能(AI)超级芯片平台「Vera Rubin」、「Vera」中央处理器(CPU)、英伟达首款 AI 笔记本电脑系列「RTX Spark」,以及专为下一代人形机器人和物理 AI 而设计的边缘 AI 计算平台「Jetson Thor」。
黄仁勋还表示,英伟达已着手在韩新建 AI 技术中心项目,正在录用韩国 AI 技术研究工程师、机器人工程技术人员。(IT 之家)
![]()
全球限 499 辆:奥迪最强超混超跑 Nuvolari 登场,零百加速 2.6 秒
6 月 5 日消息,汽车媒体 gazzetta 发布博文,报道称奥迪在法国发布 Nuvolari 超级跑车,搭载插电混动系统,0 到 100 km/h 加速 2.6 秒,极速超过 350 km/h。
外观方面,Nuvolari 首次在 Audi 公路车上采用完整 CFRP 碳纤维车身,并搭配铝制 Audi Space Frame。
64 个可动金属件组成的新 Singleframe 格栅,加上 3 段式主动尾翼,最高可带来 400 公斤下压力。内饰方面,奥迪重点放在材料质感和驾驶专注度。深色前舱区域减少视觉干扰,显示区和控制区集中在驾驶者视野内。
![]()
动力系统采用插电混动设计,4.0 升 V8 双涡轮发动机可输出 800 马力,转速可达 10,000 转。车上还有 3 台轴向磁通电机,每台 150 马力,综合功率升至 1001 马力。
输出方面,Nuvolari 从 0 到 100 公里每小时只需 2.6 秒,0 到 200 公里每小时为 6.8 秒,最高车速超过 350 公里每小时。前轴 2 台电机负责四驱和扭矩矢量分配,另 1 台电机集成在双离合变速箱中。
新车全球限量 499 辆,官方价格未公布,预计超过 50 万欧元(注:现汇率约合 394.1 万元人民币)。(IT 之家)
赛豆科技与字节合作的全新汽车品牌 6 月 9 日将发布
由赛力斯集团参股的重庆赛豆科技有限公司(简称「赛豆科技」)将于 6 月 9 日晚发布全新汽车品牌。新京报贝壳财经记者了解到,这是赛豆科技和字节跳动旗下火山引擎深度合作的汽车品牌,将探索 AI 定义汽车的无限可能。
据知情人士透露,赛豆科技新品牌将按照 LOGO、英文名、中文名逐步释放消息。
此前媒体报道称,赛豆科技与字节跳动旗下的火山引擎深度合作,首款车型预计今年内推出,或为介于 SUV 和轿车之间的跨界车,推纯电和增程双动力。相关车型主要与火山引擎合作车机交互大模型,智驾方案或与元戎启行合作。(msn)
腾讯混元提出 Stem 稀疏注意力算法,首字延迟降低 3.6 倍
6 月 5 日消息,腾讯混元宣布提出 Stem 稀疏注意力算法,已被机器学习顶会 ICML-26 收录。
官方表示,Stem 稀疏注意力算法从「因果信息流」重新审视块级稀疏,用 Token 位置衰减(TPD)和输出感知度量(OAM)两大创新,仅用 25% 算力就逼近稠密注意力的精度。配套的 HPC 算子库则将这份理论加速比真正转化为端到端的实测性能。
![]()
▲ Stem 在 Hy3 preview(W8A8-FP8)上更贴近生产环境的真实落地数据
根据 Stem 算法 × HPC 算子的全栈加速方案,算法层面,Stem 通过 Token 位置衰减(TPD)和输出感知度量(OAM)实现25% 预算下的近无损精度;算子层面,HPC 开源的 Stem+BSA 算子将稀疏收益转化为真实硬件加速,128K 上下文下首字延迟降低 3.6 倍。(IT 之家)
![]()
▲ 模型精度
![]()
剑桥大学团队 AI 设计通用疫苗完成首次人类临床试验,未来有望提前「拦截」大流行病
剑桥大学 6 月 5 日宣布,研究团队利用 AI 技术研发出一种「通用疫苗」,目标是在未来大流行真正暴发前提前拦截风险。这也是人类临床试验首次使用活性成分完全由计算机设计的疫苗,试验结果未发现明显副作用。
研究人员在英国南安普敦和剑桥两家医疗机构,为 39 名 18 岁至 50 岁的健康志愿者接种了这款疫苗。据悉,疫苗主要针对 Sarbeco 冠状病毒,关键活性成分是一种突破性抗原。
试验显示,志愿者接种后,产生了针对 SARS-CoV-2、SARS 及未来可能引发大流行的相关蝙蝠病毒的保护性免疫反应。按照这种开发思路,疫苗甚至有望对尚未出现的新疾病提供保护。
传统疫苗通常是在疫情暴发后才开始研发,面对病毒不断变异时往往难以及时跟上。相比之下,这种新的「超级抗原」有望为流感、埃博拉等会在人群中传播的疾病提供一种一体化防护方案。
剑桥大学兽医学系病毒性人畜共患病实验室教授乔纳森 · 希尼表示:「我们已经把疫苗开发从被动应对变成面向未来。即使病毒变异成新毒株,我们的疫苗也会继续提供保护。传统疫苗保护范围有限,我们已经克服了这个问题。这意味着我们可以摆脱不断追赶人群中流行病毒变体、再更新疫苗试图补上的循环,就像狗追自己的尾巴一样。」
研发过程中,研究团队把全球已经记录的 Sarbeco 冠状病毒基因序列数据全部输入 AI 模型,再通过机器学习设计出一种抗原,让抗原具备整组病毒共有的特征。(IT 之家)
*
播客上新
有人说,这届 Google I/O 2026 遗憾太多:旗舰模型 Gemini 3.5 Pro 缺席,视频模型 Veo 没有更新,Android 17 提前一周「泄」了底,Antigravity 被全网说「抄别人家作业」……
但这些,真的是遗憾吗?
本期节目,我们请来了亲赴 Google I/O 现场的 Alumni Ventures 投资总监 Bryan Liu,和深钻硬件领域的极客公园作者 Alan,揭秘这场发布会背后谷歌藏着的更大野心。
长按下方「卡片二维码」即可收听~我们的播客「开始连接LinkStart」(小宇宙 App),一起用科技、商业和人文的视角描摹这个时代。





京公网安备 11011402013531号