机器之心报道
编辑:冷猫
先给各位读者看个视频:
提示:设计和创建一个类似 mac os 的 web 操作系统,具有从文本编辑器到文件管理器到绘画到视频编辑器以及所有重要的 mac os 预捆绑软件的全部功能,使用任何库来完成此操作,但确保我可以将其全部粘贴到单个 HTML 文件中并在 Chrome 中打开它。使其有趣且高度详细,显示没有人预料到的细节,在一个代码块中充分发挥创意和美感
这条视频在海外平台爆火,这条推文已经获得了140多万的浏览。
看上去没什么特别的,只是一个复刻Apple MacOS 的操作系统的演讲,甚至把操作系统说成有一些粗糙。
但这是以 HTML 构建的 WebOS,不仅具备流畅的动画,窗口管理,甚至连完全的工具栏、浏览器、画图、终端等系统中基础的应用程序并能正常使用。
这也没什么特别的,那如果说这些内容都是通过尚未发布的 Gemini 3.0 ,只需通过几行提示词 One Shot(一次尝试),并且在 2 分钟时间生成的呢?
这正如博主Chetaslua发表演讲时所说的那样「见鬼了」,现有的大模型从未有过如此稳定坚固的生成能力。
谷歌最新的模型 Gemini 3.0 已经出现在 AI studio 的 A/B 测试中,能够供部分用户进行尝试。在目前的情况下,该模型无法频繁触发和自由选择,所以这些测试都是在 One Shot 条件下进行的。
为了对比现有的模型的显示能力,有网友采用了具有经典的精密编程模型 Claude 4.5 Sonnet 也采用了类似的提示词进行了操作系统的生成,结果发现不仅图标不完整,而且无法和生成出的任何内容进行交互,一个完全不可用的状态。
但大多数模型都宣称自己拥有类似的生成能力,能够稳定的生成功能可用的原型的就已屈指可数,而要再One Shot情况下完成类似效果的模型加凤毛麟角。
当然,已经生成了MacOS,那Windows和Linux自然不能缺席。演示视频和提示词附上:
提示:设计和创建一个像 Windows 操作系统一样的 Web 操作系统,具有文本编辑器、带有 Python 和代码编辑器的终端以及可以播放的游戏、任务管理器、绘画、视频编辑器和所有重要的 Windows 操作系统预捆绑软件,使用任何库来完成此操作,但确保我可以将其全部粘贴到一个 HTML 文件中并在 Chrome 中打开它,使其变得有趣且高度详细,显示没有人预料到的细节,在一个代码块中充分发挥创意和美感
提示:在一个 HTML 文件中,嵌入 CSS 和 JavaScript,创建一个功能齐全的 Linux 桌面环境(Ubuntu/GNOME 风格),就像一个完整的 Web 操作系统。所有应用程序都必须功能齐全。使用任何库都可以完成此操作,但请确保我可以将其粘贴到单个 HTML 文件中,并在 Chrome 中打开。使其内容有趣且高度详细,展现出意想不到的细节。在一个代码块中充分发挥创意,展现出完美的美感。
以上这些作者生成的代码和演示成果,都已经在 CodePen 上公开,感兴趣的读者可以前往体验一下 Gemini 版的操作系统。
生成版MacOS链接:https://codepen.io/ChetasLua/pen/EaPvqVo生成版Windows链接:https://codepen.io/ChetasLua/pen/yyezLjN生成版Linux链接:https://codepen.io/ChetasLua/pen/LEGzZaQ
除了操作系统之外,我们还关注 Gemini 3.0 的前端设计案例:
提示:为一个关于模拟理论的神秘网站编写代码。让它感觉像是实时渲染的现实——在实体下方显示线框网格,逐步加载的纹理,以及元素瞬间浮动的物理故障。包括矩阵式的下落代码背景、在“渲染”和“源代码”视图之间闪烁的部分、环境计算机处理声音,以及网站确认正在被浏览的最终元时刻。把它设计成由游戏引擎开发人员编写的哲学教授的存在危机。确保我可以把所有内容粘贴到一个HTML文件中,并在Chrome中打开它。
从哲学提示词我们可以看出,新版双子座能够对一些抽象描述,比如「设计得像一位教授的主义存在危机」等类似哲学风格的文字有很好的理解,并且具备非常超的前置设计能力。另外,生成的网页中也能够包含符合场景信息的音乐和音效。
网友们对Gemini 3.0的能力表示了不同程度的惊叹,正在开启有创造力的大模型新篇章。
虽然说Gemini 3.0在Web框架的代码生成和接口设计方面远超现有模型的能力,但也并没有推文和讨论中描述的那么夸张。
我们研究了生成的 MacOS 演示中的功能和代码,要为 Gemini 3.0 激动人心的心情泼一盆冷水。要说它生成的 MacOS 只是功能和前置设计的演示,显然不能成为「操作系统」或者原帖作者声称的「WebOS」
就拿这些功能举例来说,Gemini只用了几个案例来模拟几个常用的终端功能,并没有功能逻辑和指令体系,也符合现有大模型在HTML中构建功能的预期。
大模型距离真正具备构建操作系统的能力还差很远。在构建原型方面,已经越来越稳定的基础。
文中视频链接:https://mp.weixin.qq.com/s/s0bT4aB8-PhaG-3_fDRAbQ