www.8455com / Blog / 澳门新葡8455 / 前途光明的机器学习将走向何方?这里有 5 个关于它的未来预测
www.8455com 6

前途光明的机器学习将走向何方?这里有 5 个关于它的未来预测

欧盟“地平线2020”框架研究计划于2016年至2020年资助“GOAL-ROBOTS”项目350万欧元,由意大利、法国和德国的研究人员共同开发自主机器人(autonomous
robots)。

摘要: NLP
与情感分析、增强学习、深度学习的交叉领域,全年干货大合集。

www.8455com 1

GOAL-ROBOTS的主要目标是实现自主学习机器人研发的范式转变,开发支持两种功能的计算架构和算法:在没有人类帮助的情况下基于好奇心自我生成目标,以及通过使用目标自主学习大规模技能。第二个目的是进一步研究人类如何形成目标,以及目标如何支撑儿童的学习。项目对50名3-18个月婴儿进行了实验,重点研究儿童行为产生的对事件的加工处理如何驱使儿童习得技能。这些研究成果被纳入该项目的计算架构,并运用到机器人研究中去。

2018年对于自然语言处理是很有意义的一年,见证了许多新的研究方向和尖端成果。Elvis
Saravia 是计算语言学专家,也是2019
计算语言学会年度大会北美分部的项目委员之一。他总结了2018年 NLP
的重要进展,包括增强学习、情感分析和深度学习等领域。点击文章中的链接,可获得每一项研究的详细信息、论文或者代码。

机器学习目前是 IT
领域最热门的话题之一,这是因为它在看似无限的应用场景中都能发挥自身的作用。从检测欺诈网站到自动驾驶汽车,再到识别你的“金牌会员”身份以进行价格预测等等。

GOAL-ROBOTS开发出了四种机器人的复杂功能,分别包括基本的开放式学习过程;在自我生成目标的基础上获得多种技能;在不同条件下获得技能;在前三种功能基础上允许机器人解决用户定义的任务。这些成果集中展示出算法和架构如何允许自我生成目标和技能的自主开发,以及之后如何用于解决潜在机器人用户制定的任务。

  • Facebook
    研究员们发明了一种机器翻译的新方法,只需要使用单一语言语料库,这对于缺乏资料的语言非常有用。
  • Young
    和同事更新了他们近期发表的论文《基于深度学习的自然语言处理的最新趋势》,增加了
    NLP 文献中最新的 SQuAD 结果。
  • Bloomberg 研究员 Yi Yang 发表了 RNN
    卷积筛选建模的最新论文及代码,称体现了语言中的长期依存性和组合性。
  • 百度发布了 Deep Voice
    3,是一项基于注意、完全卷积的文字语音转换神经系统,比目前的循环系统在神经语音合成方面快几个量级。
  • Pair2vec 是一种学习文字嵌入对的新方法,能体现隐含关系的背景知识。
  • 百度发布了名为同声翻译与预测及可控延迟的机器翻译算法,能够同时进行多个翻译。在同声传译时,这项技术不需要等发言者暂停发言,而可以预测发言者的下一个词语。
  • Deep INFOMAX
    是一种学习无监督表征的方法,将输入和高层特征矢量之间的共同信息最大化。

但这个如此有吸引力的领域未来将如何发展?会走向何处?下一个最好的东西又将是什么?未来十年我们将处于什么样的位置?无论下一个巨大的改变是否会给我们所有人带来惊喜,本文将对机器学习将发挥作用的领域和用例做出五个预测。

www.8455com 2

1. 量子计算(Quantum Computing)

机器学习任务涉及到诸如在高维空间中对大量向量进行处理和分类的问题。我们目前用来解决这些问题的经典算法都需要耗费相当的时间。而量子计算机在处理巨大张量积(tensor
product)空间中的高维向量时,可能会处理得更好。无论是有监督还是无监督的量子机器学习算法发展,都能比经典算法更快速地以指数方式增加向量数和维数,这将使得机器学习算法运行速度的大幅增加。

相关开源项目推荐:

前途光明的机器学习将走向何方?这里有 5 个关于它的未来预测。OpenFermion — 谷歌与量子计算机创企 Rigetti
合作开发的开源量子软件

这是一个用于编译和分析量子算法来模拟费米子系统,包括量子化学,其他功能方面,当前版本的特征是用数据结构和工具获取和操纵费米子和量子位哈密顿算子的表示。

这款软件内包含了一个算法库,可以在量子计算机上模拟电子相互作用,非常适于化学、材料学方面的研究。
有关更多信息,请参阅论文连接。

  • 蒙特利尔大学的 AI 研究团队 MILA
    发表了多个超赞的研究成果,记录了自然语言生成任务中 GAN 的限制。
  • 聊天机器人是 NLP 的一个重要研究领域,创业公司 lang.ai 如何使用无监督
    AI 来解决打造聊天机器人的重要挑战之一:理解用户到底想要什么。
  • 这个模型提供了一种新方法进行文字生成,可以实现更强的解读性和控制性。
  • 谷歌 AI 发表了论文,探索语言建模的极限。
  • 亚马逊研究员提出了一种语言建模方法,这种新的训练策略的重要性在于,在现实中,要获得大量的训练数据来建立一种新能力经常是不现实的。

2. 更好的无监督学习算法(Unsupervised Algorithms)

当给学习算法输入的数据没有赋予标签时,就可以认为是无监督学习,它自己会在输入的数据中找到结构。事实上,无监督学习本身就是一个目标,比如发现数据中隐藏的模式,或者实现目的的手段,通常也会把无监督学习称为特征学习。构建更智能的无监督学习算法的进步,将会带来更快、更准确的结果。

相关开源项目推荐:

CycleGAN
— 生成对抗网络图像处理工具

生成对抗网络(GAN)可以实现能解决无监督学习问题的模型,GAN
的网络结构是具有颠覆性的,Yann LeCun
在一次关于这个研究的演讲中如此评论:「GAN 是机器学习过去的 20
年里最重要的思想之一。」

CycleGAN 这个项目与其它人工智能绘画不同,CycleGAN
的研究团队试图建立一个可双向转化不丢失信息的双向算法。研究团队必须以机器可以理解的方式去描述每种风格之间的关系,并给机器
“吃下” 大量来自 Flicker 的照片进行训练。

许多研究员认为增强学习是机器学习的最前端。
我们来看看这个领域内,2018年都有哪些重大进展。

3. 协同学习(Collaborative Learning)

协同学习简单来说就是利用不同的计算实体,使它们共同协作,以产生比自己所取得的更好的学习成果。一个典型的例子就是利用物联网传感器网络的节点进行分析,或称为边缘分析。随着物联网的发展,将会有越来越多单独的实体被用来以多种方式进行协同学习。

  • David Ha
    的“世界模型”,目标是研究个体能否在其自身的梦境中学习,需要利用增强学习来学习一项规则,依靠世界模型中抽取的特征来解决制定的任务。
  • OpenAI
    开发了一个类似人类的机器人手,通过增强学习算法获得操纵物体的灵活性。
  • DeepMind
    在《自然》杂志发布了一篇论文,讨论虚拟环境中,人工个体的网格表征怎样通过矢量导航找到解决。
  • TextWorld
    是以文字游戏为灵感的学习环境,用于训练增强学习代理。www.8455com 3

4. 深度个性化推荐(Deeper Personalization)

个性化推荐既是伟大的,但它同样也会令用户感到厌烦。我们经常会收到一些没有什么价值的建议,而那些个性化推荐似乎与我们实际上可能感兴趣的任何东西没有任何实际的关系。但将来,凭着机器学习技术的发展,相信用户将会收到更精确的建议,推送的广告也变得更有效,准确性也更高。用户体验也将大大提升。

相关开源项目推荐:

Apache PredictionIO
— 面向开发者和数据科学家的开源机器学习服务器

PredictionIO  不久前从 Apache 孵化项目中脱胎而出,宣布成为 Apache
顶级项目。

PredictionIO
是面向开发者和数据科学家的开源机器学习服务器。它支持事件采集、算法调度、评估,以及经由
REST APIs 的预测结果查询。使用者可以通过 PredictionIO
做一些预测,比如个性化推荐、发现内容等。PredictionIO 提供 20
个预设算法,开发者可以直接将它们运行于自己的数据上。几乎任何应用与
PredictionIO 集成都可以变得更“聪明”。其主要特点如下所示:

  • 基于已有数据可预测用户行为
  • 使用者可选择自己的机器学习算法
  • 无需担心可扩展性,扩展性好
  • 提供个性化视频、新闻、交易、广告或职位信息
  • 帮助用户发现有趣的事、文件、App 和资源等

PredictionIO 基于 REST API(应用程序接口)标准,不过它还包含
Ruby、Python、Scala、Java 等编程语言的
SDK(软件开发工具包)。其开发语言是Scala语言,数据库方面使用的是MongoDB数据库,计算系统采用
Hadoop 系统架构。 

5. 认知服务(Cognitive Service)

这项技术包括类似 API
和服务的工具包,开发者可以通过这些工具创建更多可发现而且是智能的应用程序。机器学习
API
将允许开发者引入智能功能,如情感检测分析;声音、面部和视觉识别;并将语言和声音理解融入其应用程序中。这个领域的未来将是为所有人推出深度个性化的计算体验。

简单来说,认知服务可向应用、网站和机器人注入智能算法,以自然的沟通方式来观察、倾听、谈话、了解和解释用户需求。

关于认知服务的一些假设:

当我们谈及人工智能时不可回避的一个问题是,人工智能究竟是天使还是魔鬼。而认知服务的主要任务是让机器理解人类世界,并能按照人类的思维方式或者超出普通人的思考能力去替代人类完成某些的判断或决策,以替代人类大脑。一旦人工智能拥有“思考能力”之后,人类很难预测她的行为究竟是善意的行为,还是恶意的陷阱。目前的认知服务是否开启了人工智能的潘多拉魔盒我们还未尝可知,未来的一切还有待我们来探索。

在机器学习的光明未来中,我们认为这些都是会发生的事情,不过同样的,引入一些新的未知的颠覆性技术将会使得我们永远无法预测未来。

编译自:https://dzone.com/

  • Google研究员开发了一项名为 MnasNet
    的技术,是一种自动化神经网络架构搜索方法,用于通过增强学习设计移动化机器学习模型。
  • www.8455com,OpenAI Five 利用增强学习,能在复杂游戏 Dota 2
    中打败业余水准的人类选手。
  • DeepMind 开发了名为 PopArt
    的技术,利用增强学习在多任务环境中具有高精确度。
  • 三星的 CozNet
    是一种增强学习算法,在两项知名的NPL比赛中展现了顶尖表现。
  • Arel 使用对抗奖励学习来讲故事,解决故事评估维度的局限。
  • Metacar 是为无人驾驶汽车而设计的增强学习环境,在以 Tensorflow.js
    打造的浏览器上使用。
  • OpenAI 发布的 Gym Retro 平台提供 1000多个游戏,进行增强学习研究。

机器学习系统需要更深的理解能力,才能与人类在情感层面互动。

  • 这篇新论文提出了“层级化CVAE用于精准的仇恨言论分类”,能够理解40多个群体和13中不同类别的仇恨言论。
  • 这篇论文讨论如何使用简单的支持向量机变量获得最佳结果,并指出模型方面需要注意的几点。目前大部分情感分析都是基于神经方法,研究时需要注意模型和特征的选择。
  • 这篇论文定量分析了推特表情肤色修改器的使用效果。

www.8455com 4

  • 这篇论文讨论如何使用深度卷积神经网络检测讽刺。另外,这项新研究使用眼动追踪、NLP和深度学习算法检测讽刺。
  • 研究员开发了一项成为“情感聊天机器”的方法,这个聊天机器人不仅能给出符合事实与逻辑的答案,还能在聊天中加入悲伤、厌烦等情绪。
  • Lei Zhang
    等研究员发表了一篇论文,综合概括了深度学习方法如何用于情感分析。
  • 这个双向异步框架可以在聊天中生成有意义的情感回复。
  • 这项研究使用计算机视觉方法,研究语境中的情感识别。
  • 这篇在2018 NAACL
    大会上发表的论文,提出了一种方法可以使用简单的递归神经网络模拟情感流。www.8455com 5

  • DeepMind 与哈佛大学教师 Wouter Kool
    合作发表了论文,研究人类如何使用大脑来做决定,以及这些研究结果能如何启发人工智能的研究。
  • 这篇论文引入了“群组归一化”的概念,可以有效替代批归一化,被认为是深度学习的一项重要技术。
  • Sperichal CNN 是一种打造卷积神经网络的新方法。
  • BAIR
    发布了一篇文章,讨论目前循环神经网络和前馈神经网络在解决各种问题时的优缺点。
  • Facebook 的 AI 研究小组开发了一项新技术,能将 AI
    模型运行效率提升16%。这能提高 AI
    模型的训练速度,并简化模型的量化和运行。
  • 这篇《自然》杂志论文,介绍了一种可以预测地震后余震位置的深度学习方法。
  • DeepMind
    研究员开发了一种新方法,利用神经算数逻辑单元改善神经网络,追踪时间、用数字图片运行算数、数图片中的物体个数等等。
  • DARTS 是一种架构搜索算法,可以设计高性能的图像分类卷积架构。
  • 这篇论文《实证验证序列建模中的通用卷积网络和神经网络》,讨论了序列建模中
    CNN 和 RNN 的区别。
  • 图形神经网络如何帮助推断潜在关系结构、模拟多代理和物理动态。
  • 谷歌 AI 研究团队发布了一篇论文,提出了一种改进版的
    RNN,能够提高自动数据解读的精确度。
  • Distill
    发布了新研究,可以在一个数据源的语境下分析另一个数据。www.8455com 6

  • 如果没有任何数据、也没有任何人类知识工程,有可能习得精准的认知模型吗?这项研究会告诉你答案。
  • 这篇论文详细描述了针对深度神经网络的批归一化研究。
  • 这篇论文回顾了神经网络中,如何更好地进行批训练。
  • 这篇论文讨论如何正确评估深度半监督学习算法。

本文作者:

阅读原文

本文为云栖社区原创内容,未经允许不得转载。

发表评论

电子邮件地址不会被公开。 必填项已用*标注

相关文章

网站地图xml地图