当前位置: 首页 » 资讯 » 科技头条 » 正文

揭秘最强春招里的超级个体:烁谷科技凭啥霸榜全球AI语音

IP属地 中国·北京 南方都市报 时间:2026-03-17 12:13:03

汇聚近2000家单位、提供超8.5万个岗位,入场人数创历史新高……为期两天的“百万英才汇南粤”2026年春季大型综合招聘会火爆收官。此次首设“超级个体 创就未来”OPC专区,集中呈现‌10个优秀AI+OPC项目‌,圈粉无数。其中,烁谷科技展示其专门面向情感表达、追求自然度、拟真度的语音合成技术以及广泛应用场景‌‌,已获得数亿估值、头部风投争相抛出橄榄枝。

3月16日,烁谷科技创始人、00后科创新星谢伟铎接受南方都市报专访,揭秘他们自研语音合成技术如何实现3秒克隆音色、99.5%还原度,悟声大模型又凭什么力压国际独角兽,登顶全球AI权威平台HuggingFace TTS Arena榜单,至今连续霸榜3个多月。值得一提的是,烁谷科技自研的“元语文字”大模型已通过生成式人工智能服务备案,而鉴伪等其他大模型也在申请或推进中,通过备案赋能,为公司AI技术合规落地、场景化商用与产业生态拓展筑牢坚实基础。


烁谷科技创始人谢伟铎向嘉宾介绍公司的AI语音产品。

仅需3秒有效样本即可瞬时克隆

南都:作为广州仅有的两家亮相“百万英才汇南粤”2026春季大型综合招聘会OPC专区的企业之一,此次展示对烁谷科技的品牌传播、人才吸引、产业对接有哪些长远影响,企业脱颖而出的核心竞争力是什么?

谢伟铎:此次展示是技术成果集中呈现,也是与各方深度对话的契机,更向年轻人证明AI时代个体创业门槛已被打破。两天时间我们展位有数百人前来咨询交流,包括相关部门、企业以及就业学生,还有数十家媒体采访。长远影响体现在三方面:品牌传播上,跳出音频AI垂直圈层,让广州00后科创实力被看见,打破大众对AI的刻板印象;青年生态链接上,搭建与青年创业者、大学生的沟通桥梁,为OPC生态培育和创业扶持打下基础;产业对接上,对接广州本土多行业需求,拓宽技术落地场景,融入大湾区数字经济生态。

烁谷科技的核心竞争力主要有四点:一是全球领先的技术壁垒,我们自研的悟声大模型超越国际知名独角兽企业,登顶 HuggingFace TTS Arena 全球榜单,我们的技术把传统配音数千元每分钟成本降到不足千分之一,真正实现行业的降本增效;二是0到1的OPC生态赋能能力,我是首届胡润U25创业先锋榜唯三上榜的广东创业者,而我们也是从大学时期的个人兴趣项目起步的 OPC 创业团队,深谙年轻人痛点,能让零资源个体实现AI音频创业;三是“创造—应用—守护”全链路技术闭环,既做语音合成技术,也打造音频鉴伪、溯源的安全技术;四是扎根广州的本土化落地能力,依托海珠完善的产业生态,为区域提供新质生产力。

南都:悟声大模型长期霸榜HuggingFace TTS Arena,其核心技术壁垒体现在哪里?相较于同类产品,在落地场景、用户体验上有哪些差异化优势?

谢伟铎:我们的创业起点是大学时的AI虚拟主播项目,因现有语音合成方案无法满足情感表达需求,才决定自研技术。Vocu V3的核心技术壁垒有四方面:一是自主理解文本与情感的表达能力,能结合上下文呈现不同情绪,还原哭、笑等真人情感细节,打破机械感;二是极致的音色克隆效率与保真度,仅需3秒有效样本即可瞬时克隆,99.5%以上相似度复刻声线细节;三是全链路自研的底层算法与数据体系,搭建全球化智能数据采集管道,底层算法100%自主研发,能挖掘声音与语义的深层关联;四是全语种覆盖与低延迟实时交互能力,支持30余种主流语言和方言,粤语拟真度行业顶尖,实现低延迟实时情感语音对话。

这套技术让海外版产品靠自然流量跻身Google搜索“AI语音”全球前三,在落地中能满足全球化、本土化的多元需求,为各类音频创作、人机交互场景提供更自然、高效的体验,大幅降低音色克隆和内容制作的门槛。


在“百万英才汇南粤”2026春季大型综合招聘会上,OPC项目展示区的烁谷科技引发众多媒体聚焦报道。

让AI音频能力融入消费电子产品

南都:广东提出推动制造业与服务业协同发展,烁谷科技在践行“两业融合”上有哪些具体布局,如何通过技术实现双向赋能?

谢伟铎:“两业融合”的核心是用数字技术打破产业边界,与我们的技术理念和发展高度契合,AI技术唯有落地产业才能释放价值。在赋能现代服务业上,聚焦内容文创、直播电商、文旅消费领域,超拟真语音技术将有声书、短视频等配音成本压至传统千分之一,周期从数月缩至即时生成,助力内容行业数字化升级;文旅方面,方言复刻技术为景区导览、数字讲解提供新可能。

在赋能制造业上,围绕语音交互、实时对话发力,推动制造业向“服务型制造”转型,目前正研发适配端侧设备的AI硬件模块,将语音交互能力融入智能硬件、消费电子,推动人机交互智能化,助力广州制造业高端化、智能化、绿色化转型,最终实现“技术赋能产业,产业成就技术”的双向共赢。

南都:斩获第四届琶洲算法大赛“AI软件应用赛”优胜奖,对企业技术迭代、人才培养有哪些启发?未来在算法研发和AI软件应用上会重点聚焦哪些方面?

谢伟铎:琶洲算法大赛是顶尖的技术实战平台,此次获奖不仅是对技术的认可,更让我们的技术得到打磨,坚定了扎根广州的决心。启发主要有两点:一是技术研发必须扎根真实场景,大赛考核的是算法落地能力和实用价值,只有适配行业场景、解决真实痛点,技术才有价值;二是以赛代练、实战育人,实干比单纯的理论培训更能让团队快速成长。

未来研发将聚焦三方面:持续迭代下一代超拟真语音大模型,提升情感表达和多语言能力;深耕VocaMark和VocaAntiFake等音频安全技术,为“数字广州”筑牢安全屏障;攻克低延迟低功耗实时交互技术,让AI音频能力融入消费电子产品。应用层面,继续赋能“超级个体”,推出轻量化创作工具,深化企业服务合作,打造定制化解决方案,助力广州千行百业数字化升级。


“百万英才汇南粤”2026年春季大型综合招聘会首次开设“超级个体·创就未来”专区,为以烁谷科技为代表的“一人公司”等新兴创业主体量身打造全流程支持体系。

深度参与区域AI产业生态建设

南都:烁谷科技是否有融资计划,在技术研发、场景落地、市场拓展上有哪些新规划?

谢伟铎:烁谷科技已获数亿估值,正稳步推进融资事宜,本轮融资是巩固技术壁垒、深化场景落地的工具,我们坚持“技术为本、场景为核”,不盲目扩张,核心用途聚焦核心能力建设和扎根广州的长远布局。技术研发上,加大投入巩固全球优势,持续迭代模型,在情感表达、多模态融合、实时交互等维度实现新突破,AI语音模型的竞争力源于长期技术深耕和场景打磨。

场景落地方面,深耕智能硬件、数字人直播等垂直领域,打造全场景标杆案例,推动技术从“可用”向“好用”升级,同时融入广州“制造业立市”战略,以软硬结合带动本地消费电子产业链升级。市场拓展上,坚持“国内深耕、全球突破”,完善海外多语种、本土化适配,探索亚洲和欧美市场,做到赚“世界的钱”,留“广州的根”,让全球创作者看到最好的AI声音来自广州。

南都:烁谷科技下阶段的发展目标是什么?如何助力区域数字经济与实体经济深度融合?

谢伟铎:烁谷科技受邀参加2026年海珠区高质量发展大会并完成项目落地签约,此次参会签约是认可更是责任,广州是懂技术、懂产业、懂年轻人的科创热土,企业发展离不开海珠的政策和生态支持,未来将始终融入区域发展大局。下阶段目标是持续巩固音频技术壁垒,顺利推进融资,全面深化技术场景化落地,打造更多标杆案例;同时扎根海珠完成签约项目落地,打造完善的产业赋能平台,以技术赋能千行百业,助力广州打造全球数字经济标杆城市。

助力区域融合主要有两方面:一是发挥技术优势,为企业提供轻量化、低成本的AI数字化解决方案,降低转型门槛,提升生产效率,推动实体经济数字化升级;二是深度参与区域AI产业生态建设,作为海珠人工智能百人会创始成员,联动区域内企业和科研机构开展技术交流、场景共建,参与制定全国AI内容标识管理标准,融入区域产业规范化发展,完善AI产业合规体系,营造良好的产业发展环境。

让每一款大模型都具备合规性实用性

南都:烁谷科技自研的元语文字大模型已经通过生成式人工智能服务备案,后续其他自研大模型有什么计划?

谢伟铎:非常感谢大家对烁谷科技的关注与支持,尤其是广东省委网信办的精心指导。元语文字大模型通过生成式人工智能服务备案,是我们技术研发的重要里程碑,也是合规发展的坚实一步。后续,我们将以元语文字大模型为基础,持续深耕音频AI领域,推进多款自研大模型的迭代与备案工作。

目前,我们也在推进其他语音大模型备案进程,进一步优化情感表达与多语种适配能力,深化与文本大模型的协同联动,推进音频鉴伪、隐形水印相关安全大模型的备案申请,完善“创造—应用—守护”的技术闭环。此外,聚焦垂直场景研发适配影视、有声书、政务监管等领域的专用大模型,推动技术与产业深度融合。我们始终坚守科技向善,在迭代技术、拓展场景的同时严格遵循备案要求,让每一款大模型都具备合规性与实用性,用有温度的AI技术赋能千行百业。

南都:音频深度合成技术滥用风险日益凸显,烁谷科技构建的“创造—应用—守护”安全闭环具体如何实现?自研的VocaMark和VocaAntiFake技术分别发挥了什么作用?

谢伟铎:技术是双刃剑,作为科创企业,我们既要打造超拟真合成技术的“矛”,更要炼就防范滥用的“盾”,这是社会责任也是发展初心。“创造—应用—守护”闭环核心通过VocaMark和VocaAntiFake实现AI音频全生命周期管理,从源头防范风险,证明技术能带来效率更能带来秩序。

VocaMark是音频隐形水印技术,能在人耳无感知的情况下嵌入不可篡改的水印,包含完整生成信息,且抵御剪辑、翻录等修改,实现“生成即留痕、传播可溯源”,为创作者提供版权保护,为监管部门提供执法依据。VocaAntiFake是音频鉴伪大模型,能精准识别AI合成音频,解决高逼真度AI语音难以辨别的问题。我们还是全国首个AI内容标识管理标准的核心起草单位,也是唯一的初创企业,正推动行业规范发展,希望这套反诈鉴伪系统能融入国家信息安全基础设施,为“平安广州”“法治广州”贡献技术方案,坚守技术向善的初心。

采写/摄影:南都N视频记者 袁炯贤(部分图片由受访者提供)

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新