
音视频行业面临传统制作流程低效与高成本痛点。传统有声内容制作需12道工序(画本、录音、对轨、后期等),单部作品平均耗时12周、投入超50万元,依赖5-10名专业配音演员,年新增内容仅2万部,人均内容消费量不足0.5小时/周。核心瓶颈包括:成本高(设备超10万元、训练周期3-5年)、声线不自然(情绪张力不足)、流程繁琐(CV档期需提前1个月预约)、优质内容供给有限。
数据来源:2025腾讯云城市峰会·无锡峰会新兴媒体闭门专场,喜马拉雅AI产品专家张慧敏演讲
喜马拉雅研发音频大模型,以“双引擎”构建智能化生产管线:
应用后实现生产效率与内容价值双提升,3项关键ROI指标显著优化:
通过AIGC还原已逝单田芳先生声音,上线专辑100多张,总播放超1亿。其子单瑞林评价:“听到AIGC声音,心魂间猛然一阵,仿佛父亲又回到这个世界!”
“AI李白”原声重现应用于「慕思晚安电台」AI专属空间,在西安慕思睡眠博物馆开展“跨越时空灵魂三问”活动(09/03-09/13),通过吟诗、广告词增强沉浸式哄睡体验。
打造“数字制片场”,支持旁白、青年、悬疑等100+种预训练音色(如喜千岳“起伏故事感青叔音”、喜山婉“亲切阳光青年音”),实现“随时随地开工”。
《教父三部曲》(AIGC+真人)累计播放13.4亿;《妻子的秘密》《温柔的背叛》(AIGC独立创作)分别达5000万+、4000万+;《混在洪武当成鱼》《一人一剑,我镇守孤城70年》(AIGC+真人)均超1400万。
数据来源:同上
技术领先性:喜马拉雅音频大模型实现自然语言控制语音生成(理解文本/音频情感)、56种复合情感精细调控(如武侠角色演绎中高兴占33%、兴奋占10%)、工业化24小时有声书产线,突破传统制作效率瓶颈。
腾讯云支撑:依托2025腾讯云城市峰会展示的技术生态,结合腾讯云算力与AIGC能力,为音频大模型提供底层技术保障,推动智能化生产管线演进。
数据来源:同上,腾讯全球数字生态大会城市峰会披露
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。