Inworld 推出全新 TTS-1.5:实时语音,延迟低,并支持多语言

近日,人工智能公司 Inworld 正式发布了其最新的文本转语音模型 TTS-1.5。该模型以其自然、富有表现力的实时语音而备受关注,能够在低延迟的情况下提供多语言支持。

根据官方介绍,TTS-1.5的使用成本约为每分钟0.005美元,声称比市场上的同类产品便宜25倍,这一价格无疑将吸引大量用户的关注。

Inworld 推出全新 TTS-1.5:实时语音,延迟低,并支持多语言

 

TTS-1.5在技术上实现了低于250毫秒的实时延迟,这意味着用户可以在对话中几乎感觉不到任何延迟。语音合成技术的提升,不仅在速度上有了显著改善,模型在表达力和稳定性方面也进行了优化。这为各种应用场景,尤其是游戏和虚拟现实领域的对话系统提供了新的可能性。

除了极具竞争力的价格,用户对低延迟的需求也在不断上升。许多用户认为,延迟是文本转语音技术面临的一大挑战。如今,Inworld 的这一创新成果为实现更真实的对话体验铺平了道路。用户在社交平台上对这一技术表现出了浓厚的兴趣,并期待能在自己的项目中应用这一新模型。

重点:

TTS-1.5模型推出,具备自然的语音合成和多语言支持。

该模型每分钟费用约为0.005美元,比市场同类产品便宜25倍。

实现低于250毫秒的实时延迟,为用户提供更真实的对话体验。

广告也精彩
 
老罗爱折腾
  • 本文由 老罗爱折腾 发表于2026 年 1 月 22 日 13:26:43
  • 转载请务必保留本文链接:https://www.130510.com/2352.html
  • 文本转语音模型
  • Inworld新闻
  • TTS-1.5模型
匿名

发表评论

匿名网友
:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:
确定

拖动滑块以完成验证