一水 发自 凹非寺
量子位 | 公众号 QbitAI
Anthropic员工离职创业自进化AI,老黄黄仁勋又投了。
公司名为「Mirendil」,a16z和凯鹏华盈领投、NVIDIA跟投,出道便是独角兽:
0产品种子轮即拿下2亿美元融资(约合人民币13.6亿元),最新估值10个亿。
就这么说吧,虽然比不上AI圈最顶的一档(比如Mira的Thinking Machines Lab,种子轮20亿美元、估值100亿),但它已经是近年来AI领域最大的种子轮之一。

△图为Mirendil四位联合创始人
一家0产品公司为何能获得老黄和顶级风投青睐?
答案就藏在Mirendil这个名字里。
Mirendil来自《指环王》精灵语,意思是那些隐藏的、未被发现的珍宝的朋友,而这家公司要做的,就是把被锁在少数几家实验室里的前沿AI研发能力释放出来,让所有科学家都能用上。
看看Fable 5你就知道了,虽然最新传闻重新上线了,但这种顶尖模型能不能用都是Anthropic一句话的事。
所以,整件事的脉络就很清晰了:
当前沿AI研发能力正在变成一种特权,Mirendil站出来了。它要干的第一件事,就是拆掉老东家Anthropic的围墙。
这出戏,怎么不算精彩呢(doge)。
「AI最重要的应用,是AI本身」
Mirendil的核心信念,官网已经写得足够直白:
Democratizing frontier AI R&D to accelerate science and technology(普及前沿人工智能研发,加速科学技术发展)

CEO Behnam Neyshabur对此作了进一步阐释,归纳起来就是他提到的一个观点:
AI最重要的应用,是AI本身。

怎么理解这句话?
先看一个事实。截至2026年5月,Anthropic披露Claude已经写了公司80%以上的代码,OpenAI、Google DeepMind同样在大规模用AI加速自家研发。
也就是说,用AI做AI研发,在头部实验室内部早就是现实了。
但这种能力并没有真正对外开放,具体有两层限制:
第一层在「使用条款」上。
几乎所有头部模型提供商都禁止外部开发者使用其模型训练竞品。
你想借力打力?条款直接堵死了这条路。
第二层在「基础设施」上。
顶尖模型可以用于科研,代码生成、实验设计、论文分析都没问题,但这只是使用层的开放。
一旦进入模型训练、评估、对齐与迭代的完整闭环,就需要GPU集群、训练框架和长期积累的工程经验,而这些能力仍然高度集中在少数实验室手中。
科学家们不是不想用AI做研发,是根本迈不过这道门槛。
Mirendil要做的,就是拆掉它。

具体怎么做?核心思路是一个自加速循环:
训练擅长AI研发的前沿模型,围绕它们重新设计整个实验室流程。更好的模型产出更好的研究,更好的研究训出更好的模型。循环本身就是产品。
a16z给了一个很直观的类比,这就像一个为AI研究打造的coding agent,自己控制自己的GPU。
他们还给这种工作方式起了个名字:vibe research。

技术路线上,Mirendil押注的是业内最具争议的方向之一——递归自改进(recursive self-improvement),即让AI系统参与构建更强的后继系统。
Anthropic在6月初刚发了一篇专文讨论这个话题,标题就叫《When AI builds itself》,态度相当审慎。
多数头部实验室也对此持安全顾虑。很多AI安全研究人员认为,模型在无人监督的情况下重写自己代码的能力可能导致AI能力迅速增长到超出人类控制的局面。
但Mirendil团队的立场很明确:
自改进是加速科学研究的最短路径,安全问题是工程问题,在足够严格的监督下可以解决。
CEO在面对这个问题时更是表示:
当人们说这不可能时,我不买账,这只是一个难题。
目前Mirendil还处于0产品状态,官网上连技术细节都没有,但招聘JD透露了一些线索:
他们计划开发新型transformer注意力机制变体,用强化学习沙盒训练自改进AI(类似AlphaGo Zero的思路),并自动化数据准备、调试等超过六项研发任务。

凯鹏华盈的投资人Mamoon Hamid在博文中则透露了一个关键信号:
这支团队在短短几个月内,用自己的系统已经做出了令人难以置信的进展。
0产品,但不是0进展。
这或许就是2亿美元种子轮的真正底气。
四位联创、团队仅20人左右
而除了「要做的事」,「人」也是老黄他们押注Mirendil的一大关键因素。
Mirendil整个团队目前大约有20人,有四位联合创始人:
CEO Behnam Neyshabur
CTO Harsh Mehta
xAI大逃亡中的7年老兵Shayan Salehian
23岁的奥赛选手Tara Rezaei Kheirkhah

四个人来自Anthropic、Google DeepMind、xAI、OpenAI,几乎覆盖了所有头部实验室。
Behnam和Harsh是7年学术搭档,Shayan是谢里夫校友圈出身,Tara代表下一代。
一封冷邮件、一个校友网络、一次xAI大逃亡、一个23岁的奥赛选手。
这就是Mirendil 20人团队的起点。

CEO Behnam的「前半生」几乎就是标准的学术路线,从伊朗谢里夫理工硕士→芝加哥TTIC博士→普林斯顿高等研究院(与Sanjeev Arora合作)→NYU博后(导师是Yann LeCun),最终进入Google DeepMind。
外界最容易记住他的,是4.3万引用和SAM优化器、Minerva这些成果,但更关键的其实是另一件事——
他长期处在「训练AI如何学习」的那一侧,从优化到推理,从数学到代码,再到Gemini的预训练体系。
在DeepMind的最后几年,他已经不再只是做单点算法,而是开始负责整个Blueshift团队,直接参与Gemini的数学与代码推理训练。
这意味着他从研究者变成了训练系统的设计者。
后来在Anthropic,他又把这个方向推得更进一步,开始参与AI Scientist和Claude computer-use能力的构建。

而CTO Harsh Mehta,是那个让这条轨迹发生交叉的人。
Harsh和Behnam的结识,缘于一封冷邮件(类似直接给陌生人写信)。
7年前,在从印度最顶尖的工程与技术院校之一的IIT Guwahati毕业后,Harsh给Behnam发了一封邮件,邮件具体内容我们如今已无从获悉,但结果是两个人在Google真正走到了一起。
从Minerva到Gemini预训练,他们开始长期共事,一个偏理论结构,一个偏系统和训练执行,逐渐形成一种很典型的组合:
一个定义「应该学什么」,另一个让「它真的学得动」。
到了Anthropic,这种分工变得更明显。
Behnam进入Discovery团队,推动AI Scientist方向,而Harsh则更直接,启动了「让AI自己做AI研发」的内部系统——这正是Mirendil现在要做的事情。

然后是Shayan Salehian,四位联创中最具工程实战色彩的一位。
他本科毕业于谢里夫理工(和CEO Behnam是校友),硕士在UC Riverside。
他的职业轨迹完整经历了马斯克帝国的7年变迁:Twitter→X→xAI。
在xAI他是早期工程师,横跨后训练、推理、agent基础设施、Grok 2/3/4模型。
凯鹏华盈对他的评价很简单:什么最关键他就做什么。

2026年2月7日,Shayan宣布离开xAI,这个时间点很微妙。
因为就在同一个月,xAI经历了一轮大规模人员流失,两周内至少9名工程师离职,包括联合创始人Tony Wu和Jimmy Ba。当时马斯克不得不在全员会上回应,称公司进行了重组以提高执行效率。
Shayan在离职帖中说了一句话,既是致敬也是宣言:
跟Elon近距离工作,我学到了偏执的细节关注、疯狂的紧迫感,以及从第一性原理思考。
然后他补了一句:现在我要去做一件新事,专注于加速科学。
这句话在语气上很轻,但在选择上很重。

最后一位Tara Rezaei Kheirkhah,是四人中最年轻的。
MIT毕业生,OpenAI早期学生研究员,奥林匹克竞赛奖牌获得者。
凯鹏华盈的投资人称她是硅谷最有野心的年轻人之一。
Tara的个人网站上有一句话,简短但份量很重:
曾经有人给了我一次机会,从那以后我就下定决心不辜负它。

把这四个人放在一起,会发现一个很反常的结构:
他们不是从同一条路径走来的,但最终都走到了同一个问题上,即AI研发本身能不能被系统化。
一群从闭源实验室体系中走出来的人,却试图把这种能力重新开放给全球科学家。
这件事本身已经足够令人期待。
而如果再往后看一层,它的隐喻也就不那么偶然了——公司的Logo是一棵树。
由一点出发,不断生长、再生长。

One More Thing
说到公司起名这事儿,有个网友的评论挺有意思:
我们很快就要用完《指环王》里的名字了。

确实,硅谷科技公司从托尔金宇宙里薅名字已经快成传统了。
Palantir,彼得蒂尔创办的数据分析巨头,名字来自《指环王》中的真知晶球,能远程窥视的魔法石。
Anduril,Palmer Luckey创办的国防科技公司,取自阿拉贡的那把重铸之剑。
Mithril,蒂尔的另一家投资公司,精灵族的秘银,中土世界最珍贵的金属。
现在又来了个Mirendil,精灵语里珍宝之友。
这边建议想创业的朋友再去翻翻《指环王》(手动狗头)。





京公网安备 11011402013531号