最近网上冲浪的时候又发现阿里推出了一个新的语音生成模型Qwen3-TTS,第一反应是有点奇怪,因为阿里巴巴之前已经推出了CosyVoice这个语音模型,为什么要推出两个在我看来功能都一样的模型呢?同时这个新推出的Qwen3-TTS效果如何呢?有什么区别呢?待着疑问来体验和了解一下
环境:windows10
显卡:N卡3060TI
环境:conda python3.12