在 AI 圈,马斯克的速度总是让人猝不及防。当地时间3月16日,马斯克旗下人工智能初创公司 xAI 在社交平台官宣:其大模型 Grok 的文本转语音(TTS)API 现已正式上线。
这意味着,开发者们现在可以将 Grok 那种带有强烈个人色彩、甚至带点“毒舌”和幽默的语调,集成到各种应用程序中。从智能助理到沉浸式播客生成,Grok 终于不再仅仅停留在屏幕的文字行间,而是拥有了真正的“嗓音”。
作为xAI生态布局的关键一环,语音功能的补齐标志着Grok正从一个单一的文本交互引擎,进化为更具拟人感的多模态助手。此前,OpenAI 的 GPT-4o 凭借极度丝滑的语音交互惊艳全球,而马斯克显然不打算在这场“听觉竞赛”中掉队。
除了 API 的密集更新,大模型行业的竞争态势也愈发焦灼。在36氪 的24小时热榜中,315曝光的大模型“投毒”黑产 与 DeepSeek V4迟迟未发的悬念 依然占据高位。当行业还在为数据真实性和模型迭代速度头疼时,xAI却选择在交互体验上暴力加速。
当你的 App 里也开始回响Grok标志性的犀利发言,这或许会成为 AI 时代最独特的个性化标签。随着语音 API 的开放,一场关于“谁的 AI 更好听、更懂交流”的较量,已经全面拉开帷幕。





京公网安备 11011402013531号