加入收藏 | 设为首页 | 会员中心 | 我要投稿 济南站长网 (https://www.0531zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 创业 > 经验 > 正文

中国版 Prisma 来了,我们今天再聊聊深度学习

发布时间:2016-08-27 07:36:26 所属栏目:经验 来源:深蓝DeeperBlue
导读:“为艺术爱好者打造的神奇手机 APP,让你的照片瞬间变换成艺术风格作品。不同于传统滤镜,深黑基于人工智能,每个风格都是由真正的艺术家训练、创作而成。只需轻轻点击,就

截至到 2016 年 8 月 2 日,在俄罗斯 APP Store 免费榜上,Artisto 高居榜首,Vinci 位居第二,而 Prisma 则落到了第五的位置。

中国版 Prisma 来了,我们今天再聊聊深度学习

▲图片制作软件 Vinci 的界面展示。图片来源:http://mspoweruser.com/vinci-great-alternative-prisma-now-available-windows-mobile-devices/

不仅仅是俄国人在想视频这件事,Deep Art 那三个德国人也瞄准了视频市场。前不久,Deep Art 官方网站放出了一段 demo,开始制作付费短视频。一段 720p的视频(最长五分钟)售价 249 欧元。

Deep Art 的产品高价位和慢速度,定位的是中高级市场。而在大众消费端,免费产品 Prisma,Vinci,Artisto 不论谁赢,都是俄罗斯互联网巨头公司 Mail.Ru 的胜利。与其说几款产品是在技术上较量,不如说这是互联网资本大鳄的强势布局。

然而,事实上深度学习在视频上还处于起步阶段,主要面临如下三个挑战:

第一,视频的数据处理量比图片更大,对计算能力的要求指数级增加;

第二,如何保持帧图像在时间轴上的信息一致性,而不是单独处理每一帧图像,也是难题;

第三,视频中的物体时刻在运动,如何追踪其在空间中的动态变化,研究员们还没找到好的方法。

除了我们盘点过的这些 “滤镜类应用”,深度学习在图像处理上应用还有很多。总的说来,深度学习图像应用按照过程可以分为两部分:输入与输出。

中国版 Prisma 来了,我们今天再聊聊深度学习

  • 输入可以视作是 “机器视觉”,即机器内部建立起对图像的理解与认知——比如去判断图片中人像是不是本人,对图中物品进行分类等;

  • 输出是进一步做出判断、决策,并触发行动,比如自动驾驶中通过分析摄像头采集到的道路信息,对控制系统下达加速、停车等指令。

在图像识别的高准确度的基础上,深度学习能够完成更为复杂的任务。举个例子,如果说百度图片搜索、微博自动检测图片中的敏感词属于计算机理性认知层面应用的代表,那么像 Prisma 这样的应用就是在深度学习的帮助下,让计算机不仅可以理性识别,还能感性认知图片,理解图像的风格与内容关系。

这才是人工智能的意义所在。计算机感知能力的发展决定了机器世界能否真正建立自洽、完整的知识体系,最终实现对人类能力的替代、延伸和增强。

按领域内容,深度学习在图像中的应用分为:图像识别、分类、检测、搜索、特征提取和视频处理这几大类别。其中,人脸识别是突破最快的深度学习图像应用。早在 2014 年便有多个初创科技团队达到了逼近或者超越肉眼的识别率,如下图展示:

中国版 Prisma 来了,我们今天再聊聊深度学习

▲各公司利用自己的公开样本集测试,提交测试结果。结果显示,汤晓鸥教授团队研发的人脸识别产品 Deep ID 已经超越肉眼的识别率。其中,小横线上面是技术产品名,下面是团队名称。(深蓝制图)

这几家公司中,Facebook 已经将 Deepface 的成果整合到自家产品中了。如今,用户上传照片到 Facebook 账号,系统就能自动标注图中的每一个人。而旷视科技和以汤晓鸥教授为技术核心的 “商汤科技”,则主要为金融、安防等部门提供成熟的身份认证产品,客户包括支付宝、招商银行、反恐部队等。

中国版 Prisma 来了,我们今天再聊聊深度学习

▲商汤科技与旷视科技主要客户对比图(深蓝制图)

Facebook 可能是这三家巨头中对深度学习图像应用最具有野心的大公司。据内部可靠消息,Facebook 或将在下周末(2016年8月底)将他们最新的研究成果代码开源。如果用一句最简单的话来形容 Facebook的新突破,叫做 “采用无监督学习让计算机无中生有,自己生成图片”。

中国版 Prisma 来了,我们今天再聊聊深度学习

▲三大互联网公司在深度学习上的布局一览。(深蓝制图)

在以往,人们让计算机去做图像生成采用的是监督式学习,即需要利用大量带标签的数据去训练人工神经网络,后者才能逐渐学会识别东西。比方说,给计算机看 1000 张猫的图片,看多了之后神经网络会逐步对猫建立模型并识别其他猫的图像。

但在今天,Facebook 采用的是无监督学习,让计算机自主生成一些含有飞机、汽车、小鸟等东西在内的场景图像样本,并令观众信以为真。

Google 的 Deep Dream 是一个会画画的计算机。它自动识别图像,筛选出某些部分,进行夸张,以创造出一种迷幻效果。半年前,Deep Dream 于湾区举办了成功的画展。Deep Dream 模仿 500 年前文艺复兴时期的德国画家汉斯·荷尔拜(Hans Holbein)的笔触与绘画技巧,画出了一系列硅谷名人。每张画作足以让人们掏出几千美金来收藏。

(编辑:济南站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读