苹果论文又炸场！Qwen3-Coder 被“特调”后，UI 生成能力竟超越了 GPT-5？

IP属地中国·北京 编辑：苏婉清 Chinaz 时间：2026-02-06 16:26:55

谁说“小模型”不能打败“大巨人”？近日，苹果UICoder团队发布了一篇震撼 AI 界的最新研究论文，展示了他们如何通过“魔改”开源模型，在特定领域实现对顶尖大模型的逆袭。
这次，苹果瞄准的是所有开发者都头疼的 UI（界面）开发。
目前 AI 生成代码虽然厉害，但在 UI 设计上往往表现平平。原因很简单：传统的“人类反馈强化学习”（RLHF）太粗糙了。以往 AI 学习设计，就像是在听设计师说“这个界面不行”，但 AI 根本不知道哪里不行，也不知道怎么改。
为了调教出“审美在线”的 AI，苹果请来了 21 位资深外援。
这些拥有 2 到 30 年经验的设计大咖不再只是简单地打分，而是撸起袖子直接下场：写评论、画草图、改代码。苹果团队收集了 1460 条这种带有深度逻辑的专家注释，并据此构建了一个专门的奖励模型。
令人惊叹的结果出现了：微调后的 Qwen3-Coder 战胜了 GPT-5。
实验数据显示，仅仅依靠 181 个高质量的“草图反馈”进行微调，这个原本参数并不算巨量的模型，在生成 App 界面的能力上直接把GPT-5给超了。这再次印证了一个道理：在 AI 训练中，专家级的“少而精”反馈，远比海量的普通数据更具杀伤力。
研究还扎心地揭示了一个真相：审美真的主观。
研究发现，普通人和专业设计师在判断一个界面好不好看时，观点一致率竟然只有 49.2%，跟抛硬币没区别。但一旦设计师通过“画草图”表达了具体修改意图，一致率会瞬间飙升至 76.1%。这意味着，未来的 AI 设计工具不再是盲目猜测你的喜好，而是能真正听懂你的视觉语言。
如果苹果真的将这项技术植入 Xcode，或许“一句话生成精美 App”的时代真的不远了。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

携程：2026财年第一财季营收162亿元，同比增长17%

俞浩社交账户已被公司接管，网上发疯是做极限测试，全民自媒体已终止

携程暴跌14%

硅芯片真神归位 IBM首发0.7nm工艺：密度5倍于7nm

零跑首款旗舰MPV D99正式上市 24.98万元起售

尊界S800 Grand Design典藏大观上市：L3+架构、售价138.8万元

全站最新

携程：2026财年第一财季营收162亿元，同比增长17%

俞浩社交账户已被公司接管，网上发疯是做极限测试，全民自媒体已终止

携程暴跌14%

硅芯片真神归位 IBM首发0.7nm工艺：密度5倍于7nm

热门推荐

携程预期Q2业绩增速大幅放缓，高管回应市场竞争

“龙大转债”倒计时不足一月，ST龙大坦言“钱不够还”

携程：2026财年第一财季营收162亿元，同比增长17%

俞浩社交账户已被公司接管，网上发疯是做极限测试，全民自媒体已终止

携程暴跌14%

硅芯片真神归位 IBM首发0.7nm工艺：密度5倍于7nm

零跑首款旗舰MPV D99正式上市 24.98万元起售

尊界S800 Grand Design典藏大观上市：L3+架构、售价138.8万元

零跑朱江明：当初差点跟罗永浩一样去做手机评估后放弃了

全尺寸MPV尊界V800/V680亮相：搭载全主动悬架，预售价80万-120万/65万-90万元

苹果罕见承认成本失控：Mac、Pad全球涨价，iPhone暂未受影响

速速下单！苹果Mac系列电商渠道还没涨价：最后的原价上车机会

江汽董事长项兴初：积极对标华为、站在巨人的肩膀上，产品研发效率提升近四成

百度千帆Coding Plan停止续费：已购用户可正常使用至服务到期

哈弗旗舰方盒子SUV长城H10亮相：归元平台打造，提供5座和6座布局

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

苹果论文又炸场！Qwen3-Coder 被“特调”后，UI 生成能力竟超越了 GPT-5？