社会焦点

谷歌 Allo 新功能:神经网络自动生成自拍卡通头像

字号+ 作者: 来源: 2017-05-15

谷歌 Allo 新功能:神经网络自动生成自拍卡通头像,自拍前记得看背景,迪士尼为什么禁自拍杆,为什么自拍的自己好丑,自拍照片当头像女生,男女捕杀狮子后自拍被雄狮

新智元编译

来源:research.googleblog

编译:刘小芹 张易 零夏

  新智元启动 2017 最新一轮大招聘:COO、总编、主笔、运营总监、视觉总监等8大职位全面开放。

  新智元为COO和执行总编提供最高超百万的年薪激励;为骨干员工提供最完整的培训体系、高于业界平均水平的工资和奖金。加盟新智元,与人工智能业界领袖携手改变世界。

  简历投递:jobs@aiera.com.cn HR 微信:13552313024

  【新智元导读】 谷歌研究院的官方博客最新介绍了一种基于神经网络的自拍卡通头像生成技术,可直接在谷歌的应用程序Allo上使用,目前只支持安卓。

  自拍、欣赏自拍和分享自拍,已经成了许多人的日常习惯——在车上自拍,穿衣自拍,旅行自拍,起床也自拍。除了社交功能,给自我一个肖像长期以来一直是人类探索自我身份的重要手段。对于一些人来说,这是要弄清楚自己是谁的问题。对于另一些人来说,则是要如何塑造自我形象的问题。当然,有时二者兼而有之。

  自拍是非常直接的表达形式。它附带了一套由现实界定的规则。另一方面,它有助于人们界定自己——它比现实更温暖更无忧无虑。

  今天,谷歌正在推出 Allo 的一项新功能,它结合了神经网络和艺术家的作品,可以将你的自拍转化成个性化的头像。你只需自拍一张照片,它就会即时自动生成头像的卡通版本,并带有自定义选项,可帮助你进一步个性化头像。

  谷歌 Allo 新功能:神经网络自动生成自拍卡通头像

  传统的将自拍像艺术化的计算机视觉方法是分析图像的像素,并通过查看像素值来凭借算法确定属性值,以决定颜色、形状或纹理。 然而,今天的人们无时无刻不在自拍,在各种照明条件下,摆着各种各样的姿势。虽然人类可以在各种照明条件下轻松地挑选和识别定性特征,比如眼睛颜色等等,但这对计算机来说是一项非常复杂的任务。 当人们看到眼睛的颜色时,它并不仅反映了蓝色或绿色的像素值,还要考虑周围的视觉环境。

  为了解决这个问题,我们探索了如何使算法能够以类似于人类的方法那样挑选出定性特征,而不用传统的手工编码的方式来解释照明条件等等。虽然我们可以从头开始训练一个大规模的卷积神经网络来尝试做这件事,但是我们想知道是否有更有效的方法来获得结果,因为我们预计,学习将面部阐释为图像将是一个非常迭代的进程。

  这让我们在Google现有的更通用的计算机视觉神经网络上进行了类似DeepDream的一些实验。我们发现,在这些网络数百万的神经元中,有几个非常容易专注于没有明确训练用来观察的东西,这些似乎对创造个性化贴纸有所帮助的东西。此外,由于是大型通用神经网络,他们已经弄清楚如何抽象出他们不需要的东西。所有要做的就是提供一个更少数量的人类标签的例子训练分类器来隔离神经网络已经知道的图像内容。

  为了创造出一个有吸引力有识别度的图,我们与艺术团队一起创作了各种各样特色的插图。艺术家最初设计了一套发型,例如,他们认为是有代表性的,在人类的评价者的帮助下,我们使用这些发型来训练网络,将正确的图与正确的自拍相匹配。然后,我们让人类评估者根据输入图像判断贴纸输出,看看它的效果如何。在某些情况下,他们认为某些风格没有很好的表现出来,那么艺术家们创造了出更多的神经网络可以学会识别的图。

  谷歌 Allo 新功能:神经网络自动生成自拍卡通头像

  避免诡异之谷

  在美学研究中有一个著名的问题叫“诡异之谷”(Uncanny Valley,或译“恐怖谷理论”),是说假如人类的复制品与真实的人类非常相似,但又不是完全一样,会令人反感。在机器学习中,假如计算机重现的你,和你自己以为的你对比起来,也会出现不相称的感觉。

  我们的目的不是精确地复制一个人的外表,而是使用更低的分辨率的模式,例如表情符号或贴纸,这样返回的是一个不那么重现真实外表的形象,更多是打破表现规则的。

  谷歌 Allo 新功能:神经网络自动生成自拍卡通头像

  图:该团队与艺术家Lamar Abrams合作,设计出利用了超过563万亿种组合的表情头像。

  将像素转变成艺术插图

  计算机如何表现的你,以及你自己想表现的你,二者的协调实际上是一种艺术练习。因此,包含不同发型,肤色,鼻子的形状等的定制功能至关重要。毕竟,只从本体来描绘会是十分主观的。美学是由种族、文化和阶级界定的,可能导致创造出排斥的区域。因此,我们试图创造一个包括种族,年龄,男性气质,女性气质和/或双性气质的空间。我们的团队将继续评估研究结果,以防止在训练系统时引入偏见。

谷歌 Allo 新功能:神经网络自动生成自拍卡通头像

  创造一个关于身份和情绪的调色板

  并不存在一个所谓“通用美学”或“奇特的你”这样的概念。人们和父母交谈的方式,比起他们和朋友和同事交谈方式的差异还要大。当你有很多个面的时候,做一个关于你的文字画像是不够的。 为了解决这个问题,Allo团队正在开展一系列艺术声音,以帮助他人加强自己的音色。今天推出的第一款风格与您犀利的一面搭配,但下一个包可能会更加可爱,因为那些真诚的时刻。 那么之后,也许他们会把你变成一只狗。 如果表情符号扩大了沟通的世界,那么这种技术和语言如何演变就不难想象这种声音和语言的技术有多么令人兴奋。

  原文地址:https://research.googleblog.com/2017/05/neural-network-generated-illustrations.html

新智元招聘

  新智元日前宣布,获6家顶级机构总额达数千万元的PreA轮融资,蓝驰创投领投,红杉资本中国基金、高瓴智成、蓝湖资本 、蓝象资本跟投。本轮融资将用于新智元团队规模扩充并增加新产品服务线,目标打造 To B 的人工智能全产业链服务平台。

职位:客户经理

  职位年薪:12 - 25万(工资+奖金)

  工作地点:北京-海淀区

  所属部门:客户部

  汇报对象:客户总监

  工作年限:3 年

  语 言:英语 + 普通话

  学历要求:全日制统招本科

  职位描述:

  1. 精准把握客户需求和公司品牌定位,策划撰写合作方案;

  2. 思维活跃、富有创意,文字驾驭能力强,熟练使用PPT,具有良好的视觉欣赏及表现能力,PS 能力优秀者最佳;

  3. 热情开朗,擅长人际交往,良好的沟通和协作能力,具有团队精神;

  4. 优秀的活动筹备与执行能力,较强的抗压能力和应变能力,适应高强度工作;

  5. 有4A、公关公司工作经历优先;

  6. 对高科技尤其是人工智能领域有强烈兴趣者加分。

  岗位职责:

转载请注明出处。


1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

相关文章
  • 苹果将发布AI芯片,欲正面与谷歌亚马逊对决 | 钛快讯

    苹果将发布AI芯片,欲正面与谷歌亚马逊对决 | 钛快讯

  • 谷歌联合创始人布林的飞艇或长达200米,将成全球最大飞行器 | 潮科技

    谷歌联合创始人布林的飞艇或长达200米,将成全球最大飞行器 | 潮科技

  • 小心,Android 系统现一高危病毒,但谷歌并不打算修复

    小心,Android 系统现一高危病毒,但谷歌并不打算修复

  • 谷歌、IBM 和 Lyft 联合推出开放源代码项目 Istio

    谷歌、IBM 和 Lyft 联合推出开放源代码项目 Istio