无论是AI大模型,还是其他数字技术,关于开源好,还是闭源好的争论一直没有停歇。即便是DeepSeek问世之后,就AI大模型领域而言,开源更好的声音占据了主导,但仍有一些业内人士认为闭源的商业模式更利于生成式AI的发展。
通过使用SUSE Rancher容器管理平台,中国出口信用保险公司(以下简称中国信保)的容器运维从原先的分钟级响应,下降到秒级响应。此外,图形化、标准化的操作按键降低了容器运维工程师的工作难度——这是中国出口信用保险公司资深技术专家张涛在与笔者的对话中提到的最为直观的感受。
在交流中,张涛多次强调,如果从技术角度考虑,在降本增效的大环境下,企业若想在数字化转型方面,“花更少的钱,办更大的事”,拥抱开源、融入开源是最好的选择之一。
在张涛看来,无论是开源,还是闭源,对于用户而言,能否真正掌握这个技术,在于发生一些问题之后,能够快速修复,避免对生产环境造成影响,这样的技术才是真正适合企业数字化转型的技术。“相对而言,我认为开源是一种很好的生态,有很好的最佳实践,可以实现群策群力,从而在融入社区以后,能够让开发者根据自身的需求和理解,更好地掌控一项技术。”张涛如是说。
正如张涛所说,开源的模式,能让企业更好地掌控一项技术,并在此基础,结合自身需求,进行个性化的创新。与此同时,与闭源的“黑箱”特性致使企业受制于供应商更新节奏不同的是,开源的方式赋予企业自主定制与迭代权的同时,还能确保一些核心数据资产的安全。比如,富国银行在内部流程中部署Meta的Llama 2,结合自有数据微调,既满足金融合规要求,又避免核心业务逻辑暴露给第三方。
除此之外,开源技术也能帮助企业更好地平衡成本、效率、创新三者的关系,突破“不可能三角”,并且,通过开源社区的“群智协作”可以形成“技术普惠-知识共享-商业反哺”的正循环。
不过,开源特性本身带来的开放性挑战也同样不容忽视。
开源亦是AI的大趋势
在AI方面,IDC预测,到2028年,包括中国在内的亚太地区在AI和GenAI上的投资预计将达到1750亿美元,年复合增长率高达33.6%。显然,中国已经成为接下来AI商业化增长最快的国家和地区之一。
而AI的发展同样面临开源、闭源的分歧,不过这种分歧随着DeepSeek的问世,似乎有了明确的答案。闭源AI商业解决方案虽成熟,却伴随高昂授权费、技术黑箱和厂商锁定风险;自研AI系统需巨额投入,中小型企业望而却步。开源AI则凭借三大核心优势破解这一困局。
比如,德国FIS集团选择了开源的方式,实现AI应用。FIS使用了SUSE提供的开源AI平台,构建了SAP智能解决方案,实现发票处理与实时推荐的敏捷开发,并实现了从令牌使用,到模型性能,再到GPU利用率全链路可视化,还满足欧盟GDPR的合规要求。
再比如,皓康医疗采用SUSE AI作为其人工智能基础设施,用于运行医学影像分析和医学诊断生成。该方案采用与Deepseek LLM联合部署,旨在提升医院/诊所的患者就医体验,同时符合中国《个人信息的保护法》(PIPL)的要求。
具体来看,通过采用SUSE AI,皓康医疗推出了Endoseek内镜报告通智能平台。该平台运用自然语言处理技术,能够将专业的医学报告转化为通俗易懂的解读,同时智能提示关键诊疗信息。来自上海某三甲医院的临床数据显示,使用该平台后,医生的报告解读时间平均缩短了50%以上。
对与此,SUSE大中华区总裁陈毅威表示,在这场浪潮中,各种AI工具及组件(如大语言模型、库和框架)更新迭代很快,因此企业选择一款自由、开源的 AI 平台就显得格外重要。作为一款业内领先的安全、私有化、面向未来的企业级生成式AI (GenAI) 平台,SUSE AI 提供了开放的企业级 AI 基础架构,具备高度的可扩展性,无论是增加新的用例,还是在企业内部扩展 AI 应用,都能轻松满足需求,助力企业应对未来挑战。
除此之外,也有不少的国际巨头在布局开源AI。IBM的AskHR系统基于Llama 2开源模型构建,为28.5万名员工提供人力资源智能问答服务。其营销部门利用开源框架开发的AI内容生成工具,可自动适配全球不同市场的品牌规范,使跨国营销活动部署周期从月级缩短至72小时;日本广告巨头CyberAgent采用戴尔开源工具链开发OpenCALM日语大模型,为制造业企业提供定制化质量控制方案。某汽车零部件厂商基于此模型训练视觉检测系统,将缺陷识别准确率提升至99.2%,而开发成本仅为闭源方案的1/5。
陈毅威向笔者表达了他对于开源AI如此之火的一些看法,他认为,对于生成式AI而言,开源是一种更优的模式,“因为开源可以为创新提供非常好的平台。如果有了开源,创新就不再是说谁提出这个新点子,谁才能参与,而是全世界的任何一个人、每个人都可以参与到创新的过程当中来,这样就可以保证全世界有更高质量的、更安全的平台,以及创新的迭代速度也会更快。”陈毅威指出。
值得注意的是,开源大模型带来的不仅是技术迭代,更是一场生产关系的重构。以DeepSeek-R1为例,其推理成本仅为OpenAI o1模型的1/30,但数学推理和代码生成能力却达到同等水平。成本断崖式下降”的突破,使得中小企业和开发者能以极低成本调用顶尖AI能力。例如,欧洲开发者基于DeepSeek-R1仅用两周时间便开发出本地化的法律文书生成工具,成本较闭源方案降低90%。
开源也有挑战
开源的模式虽然能够平衡企业成本、效率、创新三者之间的关系,达到最具性价比的方式。但因为开源社区的模式,让几乎所有人都能对软件进行升级、改造,这也带来了一些安全风险。
比如,一套Kubernetes平台,依赖的第三方组件非常之多,难以全面掌控,对于一些运维团队人员并不是很充足或经验不是很丰富的企业来说,如何管理好这套开源容器平台本身就是一个难题,尤其是使用这套开源容器平台作为IT基座保障业务数字化转型的过程中,如何确保核心业务的安全稳定运行,自然成为了最大挑战。
在中国信保的张涛看来,面临安全稳定运行的挑战,企业单纯依靠供应商来确保是不够的,在面对如何应用好开源技术,赋能业务的提问时,张涛表示,从技术角度考虑,企业需要注意三个方面的问题。
首先,企业内部的IT团队,至少得有人熟悉开源技术,不能被厂商的思路带着走,“企业需要明白哪些技术能带给你切实的帮助,怎么用更好。”张涛如是说。
进而,企业拥抱开源之后,还需要找到技术真正落地的场景。在张涛看来,一个技术只有能真正解决企业存在的问题,才是值得做的,“这时候,企业需要以问题为导向,而不是盲目追风。”张涛强调。
最后,张涛与陈毅威都曾多次向笔者表示,开源公司与用户之间的合作,不仅是“一锤子买卖”的买产品模式,而是需要开源公司与用户更多的交流,“产品仅仅是开始,后续的服务才是当下一件软件公司最核心的竞争力。”在与陈毅威的交流之中,他曾多次向笔者强调。
另一方面,就当下开源AI的安全问题,据SUSE统计,隐私和数据安全(57%)以及人工智能驱动的网络攻击(55%)是生成式AI云安全的首要问题,只有 7% 的 IT 决策者认为不存在相关安全风险。而这个风险在开源方面更需要企业注意。
此外,据统计,2024年84%的代码库存在已知漏洞,48%含高风险漏洞;开源AI漏洞事件年增长超650%。显然,安全问题已经成为了当前开源AI面临的最大挑战之一。
企业如何应对开源AI带来的挑战呢?可观测是一个比较常见的应对手段。还是以FIS集团为例,其通过SUSE AI实现“令牌使用-模型性能-GPU利用率”全链路可视化的同时,风控响应还速度提升300%,而接下来,关于开源的市场的争夺,除了在性能与价钱的“卷”之外,安全、可控、可视化也是一个重要的方向。
除此之外,SUSE人工智能创新与孵化全球负责人Ian Quackenbos还与笔者分享了SUSE的“AI护栏”技术。lan表示,AI护栏技术主要有三个方面的作用。首先就是帮助企业满足在各个国家及地区的合规的要求;第二是“监督”大模型本身,确保其不会出现原则性的问题,并对提示词进行规范化管理;第三是实时监控,确保企业级大模型不会被数据“投毒”,并确保各个层级的用户获取信息的权限,避免出现信息泄露与恶意攻击。
开源技术既是数字文明的基石,也是安全攻防的主战场。从Log4j2漏洞的全球震荡,到DeepSeek的数据泄露;从社区维护者的孤军奋战,到FraudGPT的恶意狂欢,企业在利用开源技术的同时,也需想好如何应对其带来的挑战。(本文首发于钛媒体APP,作者|张申宇,编辑丨盖虹达)