设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

2024-04-01 14:24:20 来源: 量子位

还帮助病患恢复了声音aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

克雷西 发自 凹非寺aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

量子位 | 公众号 QbitAIaMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

OpenAI雪藏的新产品——语音合成引擎Voice Engine,终于被正式揭幕。aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

有了它,只需15秒的语音样本,就能克隆出一个人的声音,而且还能跨越语言!aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

APP版ChatGPT中的语音对话功能,也正是由这项技术所驱动aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

效果如何?先来听段DEMO:aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

Salt also makes sure we stay hydrated which means there is enough water in our body for it to properly function.
盐分也可以保持人体内的水分,确保其满足正常功能的需要。aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

【音频效果请移步公众号】aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

而OpenAI通告显示,他们在2022年底就已经开发出了这项技术,但出于安全考虑一直没有正式发布。aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

这次,OpenAI终于官宣了Voice Engine,并展示了小规模测试中的几个应用案例。aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

比如,一家非营利医疗机构就利用这项技术,为一名年轻的病人恢复了她的声音。aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

另外值得一提的是,去年爆火的视频翻译软件HeyGen,采用的语音引擎也正是Voice Engine。aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

那么,这次OpenAI还展现了哪些效果,下面就来一睹为快。aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

用AI帮助病患恢复声音

首先是利用基础的语音合成能力,为儿童等不具备文字阅读能力的群体提供阅读辅助aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

比如一家儿童教育技术公司,就一直在使用Voice Engine来给编写好的画外音内容配音。aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

DEMO中生成的大段内容,都是基于这样一段15秒的样本:aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

【音频效果请移步公众号】aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

然后,就可以合成相同音色的长段语音:aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

【音频效果请移步公众号】aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

再来看看HeyGen中用到的的语音翻译技术,原始素材是一段英语的音频:aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

【音频效果请移步公众号】aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

它被用原始的音色,翻译成了普通话、法语、德语等多种语言。aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

忽略译文的质量,只听声音,中文的效果是这样的:aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

【音频效果请移步公众号】aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

音色保持的还算不错,不过腔调很明显一听就是外国人在说中文。aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

至于这到底是个bug还是个feature,就见仁见智了(手动狗头)。aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

此外,一款名为Livox的残障人士辅助应用,也利用Voice Engine为不能说话的残障人士“发出声音”——aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

在有了Voice Engine之后,TA们可以选择专属的真人音色,而不再是机械感明显的合成音,并且在各种语言之间都能保持音色的一致性。aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

不只是帮助残障人士拥有自己的声音,Voice Engine还可以为因疾病导致声音发生在重大改变的人群,恢复患病之前声音,只要有以前的声音样本就能实现。aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

一名年轻的患者因罹患血管性脑肿瘤,失去了流利讲话的能力,说话变成了这样:aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

【音频效果请移步公众号】aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

医生从她所在学校录制的视频中提取到了她患病前的声音作为样本,在Voice Engine的帮助下为她恢复了此前的音色。aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

【音频效果请移步公众号】aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

此次发布的案例,特别是为不便人士提供帮助的场景受到了不少好评,但也有网友对这项技术的滥用表达了担忧。aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

安全问题需要全社会共同关注

实际上,安全问题也是OpenAI迟迟未将这项技术公之于众的主要考量。aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

出于安全考虑,前面案例的开发者都经过了OpenAI的严格筛选,并且需要承诺遵守使用协议。aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

这些开发者被要求必须明确说明声音是合成的,并且设定了黑名单以防止克隆公众人物声音。aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

此外,OpenAI还向合成的声音中添加了水印,以便出现问题时可以进行检测监控,同时呼吁人们采取措施共同应对这一问题:aMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  • 在银行等敏感信息的安全验证措施中逐步淘汰语音验证方式
  • 探索AI时代下个人声音的保护措施
  • 教育公众理解AI的局限性,并了解其被用于欺诈的可能
  • 加速开发跟踪溯源技术,让人们能够清晰辨别出真人和AI
OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

参考链接:
https://openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voicesaMx流量资讯——探索最新科技、每天知道多一点LLSUM.COM

本文链接:OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用http://www.llsum.com/show-2-4435-0.html

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: GPT4单项仅7.1分,揭露大模型写代码三大短板,最新基准测试来了

下一篇: 我的领导马斯克:痛恨开会,不要非技术中层,推崇裁员

热门资讯

  • 全国爱肝日丨专家提醒注意“小心肝”

    3月18日是第24个“全国爱肝日”。今年活动的主题是,“早防早筛,远离肝硬化”。重庆多所医院开展义诊咨询活动,通过普及肝病的防治知识,让民众主动筛查

  • 新AI系统可提供足球制胜战术

    未来的足球场,人工智能(AI)当“大脑”?《自然·通讯》19日发表一项来自谷歌深度思维的最新成果,研究团队报告了一个名为“TacticAI”的系统,能在足

  • 我科学家发现的两种新矿物获国际认定

    记者19日从西北大学获悉,该校地质学系、大陆动力学国家重点实验室刘鹏副教授与中国地质大学(北京)李国武教授团队申请的两种新矿物,近日经国际矿物学学

  • 培育一批专利产业化样板企业

    近日,国家知识产权局等五部门联合印发了《专利产业化促进中小企业成长计划实施方案》(以下简称《实施方案》)。《实施方案》提出,到2025年底,中小企业知

  • 英伟达AI风暴席卷医疗行业 “AI制药”是风口还是泡沫?

      英伟达AI风暴席卷医疗行业 “AI制药”是风口还是泡沫?  季媛媛  全球医疗健康行业正刮起最强AI风暴。  当地时间3月18日,全球瞩目的顶级AI盛会――英伟达2024年GPU

  • 植物避盐性的关键基因被发现

    记者3月21日从安徽农业大学获悉,该校生命科学学院韩毅教授课题组与国内外专家合作,发现了植物避盐性的关键基因。该研究对于提高植物耐盐性,帮助盐碱

  • Sora带来的深层次影响值得关注

    2024年2月,OpenAI公司推出了文生视频人工智能(AI)模型Sora。OpenAI展示了Sora利用少量简短文字提示即可创建逼真视频的能力,并提供了包括一位女士在闪

  • “AI钢铁侠”黄仁勋,又进化了英伟达

      “AI钢铁侠”黄仁勋,又进化了英伟达  作 者丨倪雨晴  2024年,英伟达一年一度的GTC大会已然成为AI界春晚,现场座无虚席,全球AI爱好者翘首以待黄仁勋的独家SOLO。  北京

  • 首款骁龙8 Gen3折叠屏!vivo X Fold3图赏

    3月23日消息,vivo X Fold3系列将于3月26日正式发布,成为全球首款骁龙8 Gen3折叠屏电话。现在这款新机外观已经解禁,下面为大家带来图赏。vivo X Fold3提供

  • iPhone迈入AI时代!曝国行版苹果 16 AI效果由百度提供

    3月23日消息,据媒体报道,iPhone与百度公司已达成合作协议,百度将为苹果内置的生成式人工智能大模型提供技术支持。报道指出,iPhone生成式人工智能大模型的

  • 荣耀Magic6 RSR 保时捷设计首销卖光:9999元供不应求

    3月23日消息,荣耀Magic6 RSR 保时捷设计于3月22日正式开售,售价为9999元。该款电话首销当天即被抢购一空,荣耀商城显示,下一轮销售时间将是3月29日上午10:0

  • 尚德机构2023年净收入21.6亿元 详细披露老年教育进展

    21世纪经济报道记者王峰北京报道 近日,成人职业在线教育企业尚德机构(NYSE:STG)公布了其2023年第四季度及全年未经审计的财务报告。2023年

推荐资讯

  • 日榜
  • 周榜
  • 月榜