欧洲知名AI初创公司Multiverse Computing近日发布了两款超小型AI模型,并以动物大脑尺寸命名——分别为"苍蝇脑"SuperFly和"鸡脑"ChickBrain。这家声称拥有全球最小高性能AI模型的公司,正试图将人工智能带入每一台物联网设备。
Multiverse Computing总部位于西班牙圣塞巴斯蒂安,拥有约100名员工,由欧洲顶级量子计算和物理学教授Román Orús、量子计算专家Samuel Mugel以及前Unnim银行副CEO Enrique Lizaso Olmos共同创立。该公司刚刚在6月完成了1.89亿欧元(约2.15亿美元)的融资,自2019年成立以来累计融资约2.5亿美元。
公司的核心技术是名为"CompactifAI"的模型压缩技术。Orús表示,这是一种基于量子物理原理的压缩算法,能够在不牺牲性能的前提下大幅缩减AI模型的尺寸。"我们拥有的压缩技术不同于传统的计算机科学或机器学习压缩方法,因为我们来自量子物理学领域,"他解释道,"这是一种更加精巧和细致的压缩算法。"
SuperFly模型是该公司"模型动物园"系列中最小的一款,基于Hugging Face开源模型SmolLM2-135压缩而成。原始模型拥有1.35亿个参数,而SuperFly压缩至9400万参数,Orús形象地将其比作苍蝇大脑的尺寸。
SuperFly专门针对资源受限的设备设计,能够在极小的处理能力下运行。该模型可以嵌入家用电器中,用户可以通过语音命令操作设备,比如对洗衣机说"开始快洗",或者询问故障排除问题。在现场演示中,该模型配合简单的Arduino处理器就能够处理语音交互界面。
更强大的ChickBrain模型拥有32亿参数,基于Meta的Llama3.18B模型压缩而成,具备推理能力。尽管参数量更大,但该模型仍然足够小巧,可以在MacBook上离线运行。
令人惊讶的是,ChickBrain在多个标准基准测试中的表现实际上略优于原始模型,包括语言技能基准MMLU-Pro、数学技能基准Math500和GSM8K,以及通用知识基准GPQA Diamond。这证明了该公司压缩技术的有效性——不仅缩小了模型尺寸,还能保持甚至提升性能。
Multiverse已经开始与各大设备制造商进行洽谈。Orús透露:"我们正在与苹果、三星、索尼和惠普等公司进行对话。惠普还参与了上一轮投资。"该轮融资由知名欧洲风投公司Bullhound Capital领投,惠普科技风险投资和东芝等多家机构参投。
除了直接向设备制造商销售模型外,Multiverse还通过托管在AWS上的API为开发者提供压缩模型服务,通常token费用比竞争对手更低。该公司已经为BASF、Ally、穆迪、博世等客户提供了包括图像识别在内的各种机器学习压缩技术服务。
这些超小型AI模型的推出标志着人工智能应用的一个重要趋势——从云端大模型向边缘设备小模型的转变。通过将AI能力直接嵌入到物联网设备中,用户可以享受更快的响应速度、更好的隐私保护以及无需网络连接的离线智能体验。
随着物联网设备的普及和边缘计算需求的增长,像Multiverse这样专注于模型压缩技术的公司可能会迎来巨大的市场机遇。其基于量子物理原理的独特压缩算法不仅展现了技术创新的可能性,也为AI技术的普及化应用开辟了新的道路。