数据库越大,结果的准确性就越高。谷歌的研发人员表示,为了让它成为可能AI能猜出大家的画,已经提前给模型喂了很多数据。
全文2670字,阅读5分钟左右
谷歌一定是世界上最好的人工智能公司之一。
2016年,谷歌阿尔法狗与顶级人类棋手竞争,让全人类意识到人工智能时代的到来;2018年 Google I/O在开发者大会上,Google Assistant像真人助理一样,通过电话完成预约理发服务,宣布人工智能离精炼又近了一步;今天,谷歌你画我猜小程序猜小歌刷新朋友圈,让大众有机会调戏人工智能。
“AI没有你想象的那么神奇,你可以杀死人类;没有你想象的那么弱智,你仍然可以做一些传统代码做不到的事情。谷歌的猜测小歌曲研发团队解释了推出这个小程序的目的。
猜画小歌在朋友圈里炸了一票灵魂画家。它不按常规打牌的识别能力让人又爱又恨:猜画小歌有时候很了解你,画一笔就知道你想画什么;有时候我真的很弱智。我显然画得很具体,但它用机械声嘲笑你:你画什么?有绘画技巧的画家往往很难通关,但抽象的灵魂画家可以被识别。网友们不禁质疑:这 AI 怕不是傻子吧?
猜画小歌背后用了哪些技术?未来该技术可应用于哪些领域?AI该团队接受了《新京报》记者对这些问题的采访。
━━━━━
猜画原理
数据库技术并不难。
先简单介绍一下这个小程序游戏的玩法:系统给出一个需要画的词,通常是名词,用户在20秒内画出来AI猜猜,猜猜就可以进入下一轮了。AI从你画第一笔开始,你经常在画出某些特征后给出答案。如果你猜不到,AI还会用机械音嘲笑:你画什么?
据开发人员介绍,这个小程序最初只是一个团队hackathon小想法,因为大家都觉得有趣,才发展成一个完整的项目。
所谓hackathon,中文通常被称为黑客马拉松或编程马拉松,是科技公司激发创造力的一个小竞争。常见的方法是组成一个团队,在一到两天内密切合作,完成一个主题下的产品或解决方案。
自2016年以来,微信小程序已成为许多互联网公司的首选,因为它包装了许多组件并提供了许多接口。hackathon主题。猜画小歌诞生在这样的环境中。
Google AI工作人员告诉记者,猜画小歌来自Google AI神经网络驱动。该网络来自世界上最大的数据群,包括5000多万个手绘素描。
2016年,谷歌推出了你画的网页版。——quick,draw!它一上线就风靡全球,谷歌也开源了手绘数据集,为需要神经网络培训的研发人员提供样本。quick,draw!使用了David Ha与Douglas Eck研究名称为sketch-rnn”的生成式RNN,抽象概念旨在训练机器如何像人类一样提炼事物。
至于这首猜测歌曲,它具体使用了神经网络技术中的卷积神经网络技术(CNN)还是神经网络技术(RNN),谷歌表示:无法分享关于神经网络架构的信息。
“其实用CNN或RNN这只是一个选择题。这两种神经网络各有优势,但归根结底都是DeepLearning(深度学习)的事情。 旷视科技研究人员告诉记者,人工智能独角兽企业。
为了模拟生物神经系统,神经网络是深度学习的基础,最初受生物神经系统的启发。一般来说,AI 通过神经网络认知世界的过程与婴儿最初认知世界的过程相似。
人工智能公司研究的人脸识别、视频结构化等技术,包括旷视研究院,无法绕过CNN或RNN。
但抛开这些顽固的技术术语不谈,这款手绘识别游戏的技术并不难。早在去年,一名学生就帮助一家公司制作了一个几乎相同的手绘识别模型,只收取了1万元的报酬。数据集显然比算法更有价值。
回想起来,我们人类会通过识别卡片和绘画来培养孩子识别周围事物的能力。这些图片不一定像照片一样逼真,但它们包含了事物的显性特征,传达了人们如何重现和重建周围事物的方法。例如,猫有三根胡子,汽车有四个轮子,脸有两只眼睛,一只鼻子和一张嘴,金色的头发是一只有金色头发的温顺狗。“AI 对简笔画的理解也是基于数据库的训练。旷视科技研究人员告诉记者。
利用神经网络技术,通过学习大量涂鸦样本,总结不同事物的特点。除了特征点,还可以进行数据培训AI动态绘图过程,让AI理解人类通常会选择先画什么,如何写作,并在画东西时适当地停止写作。这也解释了为什么小歌有时会在你画第一笔时给出答案。
数据库越大,结果的准确性就越高。谷歌的研发人员表示,为了让它成为可能AI能猜出大家的画,已经提前给模型喂了很多数据。
━━━━━
答阴谋论
不会收集用户隐私数据
虽然朋友圈的灵魂画家们玩得很开心,但很多网友对人工智能仍然保持高度警惕:我觉得这个小程序有一个大阴谋。如果所有这些都被识别,谷歌将收集数据。机器人可以识别一切。
也有人担心自己会在不知不觉中成为谷歌的免费教练,用自己的画来丰富谷歌的涂鸦数据集。
R&D人员回应说:其实大家都想多了。除非每个人的画都能达到一定的量级,否则就不会对了AI本身就有很大的影响。
谷歌还向记者强调,不会在这个小程序中收集任何与用户隐私相关的数据。
但事实上,谷歌并没有积极回应用户涂鸦是否会用于丰富手绘数据库。科技研究人员认为,使用小程序上的涂鸦来丰富数据库是不可避免的。
旷视研究人员认为,用小程序上的涂鸦来丰富数据库是不可避免的。
在应用前景方面,鉴于数据集可以训练抽象概念和学习动态绘画过程,这为该技术创造了一个有前途的应用方向:帮助艺术家爆发艺术灵感,教授学生绘画的基本技能。
除了锻炼AI能力,猜画小歌收集的数据可能还有其他用处,比如分析为什么大多数人在3点画钟。
业内有人认为,谷歌这次用小程序试水,可以算是回归中国市场的投石问路。
谷歌于2017年12月宣布成立谷歌AI由斯坦福大学计算机系终身教授、斯坦福大学人工智能实验室主任、中国中心整合谷歌云和谷歌中国研发团队"AI 女神"李飞飞与Google Cloud研发负责人李佳领导。
谷歌AI目前,中国中心介绍Google极客翻译和文件App可在中国使用,搭载Android Wear该系统的可穿戴产品在中国也很受欢迎。
━━━━━
登顶攻略
注意突出特征和轮廓形状
有一定绘画基础的汤包同学在朋友圈里愤愤不平:既然喂了这么多数据,为什么我的小歌还是像个智障?
汤包画的鱼是这样的:
系统认可的鱼是这样的:
汤包笔下的眼镜是这样的:
实际上想被人AI只需要画两个圆:
小S(化名)为了画动物迁徙,巴拉在行驶中画了两只斑马,但其实她只需要画两只鹅——也就是两条折线。
这可能是因为它之前训练的数据集主要是简笔画,但它不知道复杂性。旷视科技研究人员认为,这首歌出现了bug 还是和数据集有关,还不够聪明。
那怎样才能让小歌更容易识别出你的涂鸦呢?
把握特征是一个诀窍。
比如画猪突出大鼻孔,画蚊子突出尖嘴,画蒙娜丽莎的笑容,先画画框。
。
第二个诀窍是先勾勒形状,先画脸,先画圆圈,先画微波炉,再猜几次小歌。
当然,如果你想让小歌难堪,你可以颠倒以前的写作顺序。画画的时候先画细节,这样不管,小歌都很有可能无法识别。
新京报记者 蔡浩爽 编辑 魏佳
值班编辑 李二号 花木南