欧洲知名人工智能初创公司 Multiverse Computing 近日推出两款极微型AI模型,分别命名为 “ChickBrain”和 “SuperFly”。公司称,这可能是目前全球最小且性能依然强劲的模型,能够在智能手机、平板、PC甚至物联网设备上离线运行。
创始人罗曼·奥鲁斯(Román Orús)表示,这些模型基于公司自研的 CompactifAI 压缩技术,可在不牺牲性能的情况下显著缩小AI模型体积。该技术受量子物理启发,与传统计算机科学或机器学习压缩方法不同,压缩精度更高。今年6月,Multiverse Computing 因此技术完成 1.89亿欧元(约2.15亿美元)融资,自2019年成立以来累计融资约2.5亿美元。
两款新品细节:
SuperFly:基于 Hugging Face SmolLM2-135压缩,参数量由1.35亿缩至 9400万,相当于苍蝇大脑大小,适合家电等低算力场景,可实现语音指令与简单对话,例如通过Arduino控制洗衣机的启动模式。
ChickBrain:由 Meta Llama3.18B 压缩而来,参数为 32亿,可在MacBook上本地运行,并在 MMLU-Pro、Math500、GSM8K、GPQA Diamond 等多个基准测试中略优于原版。
Multiverse 将这一系列统称为 “Model Zoo”,按动物大脑大小命名。公司称目标并非挑战顶级大型模型性能,而是在极小体积下保留高实用性功能。
目前,Multiverse 已与苹果、三星、索尼、惠普等厂商洽谈合作,惠普亦为投资方之一。除面向硬件厂商直供外,公司还在 AWS 上提供压缩模型 API,开发者可低于行业平均代币费用调用。此外,其压缩技术也服务于图像识别等领域,客户包括巴斯夫、Ally、穆迪、博世等。