商汤科技正在悄然推进一项针对设计领域的创新项目——一款代号为“U1Pro”的多模态大模型。这款由商汤研究院主导研发的模型,被视为其“日日新”模型家族的重要成员,核心目标是对标OpenAI的GPT-Image 2,打造具备逻辑推理能力的图像生成工具。据内部人士透露,该模型由联合创始人兼首席科学家林达华亲自挂帅,预计将于今年7月开启内部邀请测试,并逐步向企业客户开放服务。
与传统图像生成工具不同,“U1Pro”被赋予了“设计师思维”的定位。在应对复杂设计需求时,模型能够自主完成从创意构思、内容生成到效果评估的完整闭环,并支持输出8K分辨率的高清图像。多位参与测试的研发人员表示,在多轮内部评测中,使用相同文本提示时,“U1Pro”生成的图像质量与GPT-Image 2高度接近,部分场景下甚至展现出更优的细节表现力。
设计领域的AI竞赛正呈现白热化趋势。此前在LMSYS Chatbot Arena的文生图评测中,GPT-Image 2凭借在图像质量、文字渲染精度和指令理解能力上的显著优势,已超越谷歌的Nano Banana 2模型,引发全球设计行业的广泛关注。有消息称,OpenAI正筹备推出新一代AI图像生成工具,明确将设计应用作为核心突破方向。
商汤此次布局设计赛道,标志着多模态大模型的应用边界正在从编程等工具型场景向创意领域延伸。随着Anthropic等企业持续深耕代码生成领域,设计能力正成为科技巨头争夺的下一个战略高地。行业观察人士指出,当AI开始具备理解设计逻辑的能力,或将重构传统设计工作流程,为建筑、广告、影视等行业带来颠覆性变革。





京公网安备 11011402013531号