社会焦点

只需极少数据,训练一分钟,这个 AI 就能复制任何人的声音

字号+ 作者: 来源: 2017-05-01

只需极少数据,训练一分钟,这个 AI 就能复制任何人的声音,微信语音没声音,ai怎么复制图形,合唱队的声音训练,ai等距离复制,ai沿路径复制

新智元编译

来源:digitaltrends.com

作者:Luke Dormehl

译者:文强

  新智元启动 2017 最新一轮大招聘:COO、总编、主笔、运营总监、视觉总监等8大职位全面开放。

  新智元为COO和执行总编提供最高超百万的年薪激励;为骨干员工提供最完整的培训体系、高于业界平均水平的工资和奖金。加盟新智元,与人工智能业界领袖携手改变世界。

  简历投递:jobs@aiera.com.cn HR 微信:13552313024

  【新智元导读】蒙特利尔初创公司 Lyrebird 开发了一种语音合成技术,用很少的数据,训练一分钟,就能复制任何人的声音。初版展示后,已经有 10,000 人签约后续版本试用。结合某些技术,比如对视频中一个人说话的口型进行编辑的软件,“假消息”、“假新闻”或许会在 2025 年成为一个有趣但也危险的情况。

  还记得《碟中谍》中汤姆·克鲁斯扮演的伊森·亨特使用当时还不可能的技术——语音合成——模仿其他人物的声音吗?

  本周,蒙特利尔一家名叫 Lyrebird(注释:琴鸟,一种擅长模仿周围声音的鸟)创业公司将这转为了现实。

  “我们正在开发新的语音合成技术,除了其他功能,我们可以用非常少的数据复制(copy)某个人的声音,”参与开发该项目的其中一位深度学习研究员博士 Alexandre de Brebisson 说:“我们的实验表明,一分钟的音频已经包含了很多人类声音的 DNA。我们之所以能够用极少量的数据学习新的声音,是因为我们的模型能够捕捉新声音和它已经知道的所有声音之间的相似之处。我们的模型理解(understand)使一个语音与另一个语音不同的基本变量(underlying variables)。”

  只需极少数据,训练一分钟,这个 AI 就能复制任何人的声音

Lyrebird 官网宣传:1分钟的语音录音,他们就能复制任何人的声音

  说到语音合成,当然不能不提此前 DeepMind 推出的 WaveNet,新智元也对 WaveNet 做过详细报道。不过,尽管 WaveNet 效果十分强大,这种技术还是依赖了大量的语音数据。同时,根据 HackNews、Reddit 和 Twitter 等讨论,能够完全复现 WaveNet 的案例并不多,实际上是相当少——尽管 DeepMind 在论文中给出了具体细节。因此,也有人评论称,WaveNet 还是依赖大数据和大计算力的平台。

  Lyrebird 由于成功实现了这种技术,de Brebisson 表示,他的团队已经通过电子邮件收到了几十种不同的应用建议,其中包括他们想到的,还有一些则是他们没有想到的应用程序。

  例如,一些公司有兴趣让他们的用户选择以名人或家人的声音朗读有声读物。还有医疗公司的建议,希望使用有语音障碍人士的语音样本,让系统合成他们自己的声音。另一个有趣的想法是视频游戏公司提出的,让游戏角色用人类的声音与人类玩家对话。

  潜在应用机会太多,目前已经有 10,000 人注册预定试用即将推出的测试版本。de Brebisson 继续说道:“以后我们还将增加功能,例如让公司根据自己的需求设计独特的声音,并控制这些生成的声音的情感。”

  根据 Google+ 的讨论,Lyrebird 之所以能做到小数据语音实时合成,或许是将风格迁移应用到了语音数据上。当然,实际情况如何,Lyrebird 还没有公布。

  虽然目前有待完善的地方还有很多,但不难想象几年后这将会如何。

  结合现有的某些技术,比如对视频中一个人说话的口型进行效果逼真的编辑软件,“假消息”、“假新闻”或许会在 2025 年成为一个十分有趣但也危险重重的情况。

  感兴趣可以看 Demo,模仿了包括特朗普在内很多人的声音:https://lyrebird.ai/demo

  原文地址:http://www.digitaltrends.com/cool-tech/ai-lyrebird-duplicate-anyones-voice/#ixzz4fmxynOJa

新智元招聘

  新智元日前宣布,获6家顶级机构总额达数千万元的PreA轮融资,蓝驰创投领投,红杉资本中国基金、高瓴智成、蓝湖资本 、蓝象资本跟投。本轮融资将用于新智元团队规模扩充并增加新产品服务线,目标打造 To B 的人工智能全产业链服务平台。

职位:客户总监

  职位年薪:30 - 60万(工资+奖金)

  工作地点:北京-海淀区

  所属部门:客户部

  汇报对象:COO

  下属人数:8 人

  工作年限:5 年

  语 言:英语 + 普通话

  学历要求:全日制统招本科

  职位描述:

  1. 热爱人工智能,在行业内有一定的人脉资源和影响力;

  2. 为客户制定媒体关系策略和公关活动策划,达成客户的市场或传播目标;

  3. 负责监督公关项目的计划和实施,使项目能按期在预算内完成;

  4. 积极拓展客户资源,开发公司业务,与既有客户保持紧密的业务联络和沟通;

  5. 监督、管理及考核客户服务团队,全面提升公司客户服务质量;

  6. 有4A、公关公司工作经历优先,有知名企业或知名媒体机构工作经验者加分。

  岗位职责:

  精准把握客户需求,了解新智元定位,负责制定、执行公司年度会展活动及其他客户经营服务计划,监督实施全过程,完成业绩指标。掌握 AI 产业动态,熟悉市场状况,定期提出客户服务计划和建议。积极开拓新客户,提升与既有客户、同行业间良好的合作关系;组织部门开发多种服务计划,完成客户服务目标及确保回款任务。负责管理和培训客户部业务人员,安排并指导客户部日常工作,与其他部门良好协作。

  应聘邮箱:jobs@aiera.com.cn

  HR微信:13552313024

  新智元欢迎有志之士前来面试,更多招聘岗位请点击【新智元招聘】查看。

相关阅读:

  • ai怎么复制图形
  • 微信语音没声音
  • ai复制画板和内容
  • ai复制快捷键
  • ai等距离复制
  • ai沿路径复制
  • 黄渤中国好声音
  • 合唱队的声音训练
  • ai如何复制图层
  • 如何只复制筛选出来的数据
  • 那声音常在我心田
  • excel公式数据复制
  • 相关推荐:

  • 华为史上最美操作系统,你绝对不能错过的EMUI5.0
  • 国产操作系统典范:deepin操作系统
  • 娱乐办公两不误!这个笔记本能把屏幕拔下来写字
  • 斗鱼响应新规加强监管,坚持打造优质精品直播
  • SpaceX 火箭爆炸原因确定:液态氧过冷成了固态
  • 华为Mate9中国版真机秀 你绝对没发现它有两种版本
  • 99%的人都不知道的微信高效使用术?
  • 乐视网一周蒸发88亿元 贾跃亭反思节奏发展过快
  • 似乎已经战胜传统渠道的小米 今年为什么被OPPO、vivo 打败?
  • 优雅商务风,性能一鸣惊人—TCL 950体验评测
  • 转载请注明出处。


    1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

    相关文章