AI在味道和艺术中 - 当前机器学习状态理解偏好

丹尼尔Faggella.
《阿凡达》

Daniel Faggella是Emerj的研究主管。他受到联合国、世界银行、国际刑警组织和领先企业的呼吁,是一位全球广受欢迎的专家,研究人工智能对企业和政府领导人的竞争战略影响。

AI在味道和艺术中 - 当前机器学习状态理解偏好

爱尔兰德国比分直播人工智能和机器学习已经推动了技术创新市场营销,电子商务以及其他几个行业。许多人都体验过AI和ML系统的好处甚至不知道它每次搜索谷歌或点击Spotify中的歌曲。

人工智能可以帮助推荐电影和音乐——是什么让这些系统在葡萄酒或美术(如油画或雕塑)方面缺乏鉴赏力?

在机器中开发艺术或烹饪“味道”的挑战在某种程度上与推荐电影或音乐的挑战不同。

将艺术或烹饪“味道”融入人工智能系统的挑战

最近,搜索和推荐引擎似乎在理解用户意图方面变得相当出色。特别是,在很多情况下,推荐引擎可以在产品首次出现在网站上并点击产品列表几分钟后就向网站用户推荐产品。这就好像推荐引擎能够判断出用户对音乐或服装的品味一样。

Netflix推荐电影的方式,或者亚马逊推荐产品的方式——与人类相互推荐事物的方式非常不同。迄今为止,机器还不能像人类理解的那样使用我们所说的“味觉”和偏好——它们只能通过在大量数据中寻找模式来实现对味觉的理解。在某些情况下(如电影或音乐推荐),与人类偏好相比,这些代理可以非常有效和可伸缩。

有人可能会说,机器最终可能有能力鉴赏好波尔多葡萄酒,但在目前的情况下,它根本无法做到这一点;机器无法“欣赏”人类意义上的任何东西,因此在没有人类用户反馈的情况下,它们无法判断葡萄酒的“好”或“坏”、味道的“好”或“坏”。机器只能根据从人类输入的数据来判断味道的好坏。

此外,机器尚无法以任何合理的准确度确定这些质量,而无需访问大量的量化,可重复数据。此类数据并不总是可用的。每当一个情况要求对难以量化的特定刺激的主观评估(换句话说,味道),机器将没有依据进行评估。

然而,人工智能模型可以被训练成在特定条件下准确预测味觉偏好。在某些情况下,这些味觉的代理决定因素很容易得到。在另一些情况下,人类需要付出大量努力才能产生必要的数据,以便训练机器学习模型理解味觉。

以下是人工智能和机器学习模型目前可以和不能确定用户口味的一些例子:

音乐 - Spotify如何确定用户偏好

人工智能准确预测人类口味的一个具体例子是音乐。2016年,美国音乐产业的销售额超过70亿美元,其中68%来自Spotify等订阅流媒体音乐平台。这些音乐平台使用机器学习来告知他们推荐引擎。这些推荐引擎通过提供与Spotify听众的口味相关的推荐,为他们提供了一个订阅的理由。反过来,听众可能更愿意自己购买音乐文件。

像Spotify这样的平台在音乐销售方面如此成功的原因是它们基于个性化。他们能够根据用户自己的历史和成千上万具有类似资料和人口统计数据的其他用户的参与,确定哪种类型的音乐可能会吸引特定的用户。

Spotify具有来自其数百万用户的数据点,它用于向特定用户提供相关的建议。它具有可量化的数据,了解倾听某些歌曲的人,往往会倾听其他歌曲,其中AI解释为“喜欢”或“品味”。推荐引擎注意到某种类型的用户侦听歌曲或音乐的长度,他们暂停或重放某一部件的频率,以及它们在播放列表中的频率多久包括歌曲。

2017年在巴塞罗那的DataEngConf会议上,Spotify数据/后端工程经理Gandalf Hernandez分享了Spotify用来决定推荐音乐和从音频轨道学习的一些过程:

Spotify——通过各种途径——使用这个数据来衡量“喜欢”,当它积累足够的数据(播放歌曲,歌曲评级,将歌曲添加到播放列表,等等),它可以准确地预测用户听接下来会想听到某首歌,并相应地提出建议。当某个用户拒绝了某个推荐时,Spotify也会进行记录,以完善未来的推荐。

例如,Spotify的首次用户可能会选择收听两首歌曲,这些歌曲都是古典音乐作曲家Sergei Rachmaninoff的碎片。这不会给出关于用户的AI资料,以提出良好的建议。但是,推荐引擎后面的AI有大量来自其他用户的数据他们也在听这两个特定的拉赫曼尼诺夫的作品,所以它会观察那些其他用户点击了什么,然后为这个新用户提供一些建议。

例如,“来自某个国家的其他用户下载了Spotify并立即收听拉赫玛尼诺夫最终喜欢上了其他歌曲。让我们推荐[X]其他歌曲来吸引这个用户。”

当新用户点击下一首歌曲时,AI将使用此附加数据点来为此特定用户提供未来的建议。随着时间的推移,推荐引擎背后的AI将变得更好地“了解”这个用户在音乐中的味道或者至少更好地推荐他们的音乐。

这种所谓“理解”的关键是大量数据的可用性,这些数据可以被输入推荐引擎背后的机器学习模型。AI并没有真正推断或假设某种类型的音乐符合用户的口味;它利用用户根据响应、反应和行为提供的数据进行判断。它的“理解”方法是关于概率和对数百万用户“喜欢”音乐的各种代理的评估。

组成机器学习模型的算法处理这些数据的能力在模型做出预测和推荐的能力中扮演着重要角色。这些算法往往会不断变化,因为数十位数据科学家经常在任何给定的时间对它们进行研究。

然而,如果没有可以运行的数据,即使是最好的算法也是无用的。对音乐行业来说幸运的是,这些数据可以通过流媒体音乐服务轻易获得。在数字世界中,我们的听觉转换得相对较好。但对于我们的其他一些感官以及与之相关的味觉方面来说,情况并非如此。

葡萄酒 - 感官味道和ai

人们可以争辩说,如果一台机器可以训练为“了解”或至少推荐产品,或者在谈到音乐方面的味道时,应该可以训练它在葡萄酒中做同样的事情。假设,是,机器学会如何识别用户在音乐中的味道时所展示的相同过程适用于用户在葡萄酒中的味道。然而,采样音乐与采样葡萄酒不同。它们涉及两种不同的感官,物理味道不会赋予数字化。

当用户点击音频文件时,他或她可以在纯粹的数字环境中体验它,并通过聆听音乐的整体,重播它,选择类似的音乐,或者放弃它 -玩和可能跳过完全不同的东西。所有这些数据点都被数字上捕获,并且这些数据点立即用于通过机器学习模型进行处理。

量化人们如何决定他们是否喜欢一种特定的葡萄酒并不像预测一个特定用户会喜欢的音乐类型那么简单。舌头不像耳朵那样适合数字化。为wine收集数据需要在物理世界中进行,而完全存在于数字空间的机器学习模型无法立即获得这些数据。

如果想要确定机器学习模型可能训练的用户葡萄酒口味的代理,他们需要在物理世界中收集大量数据,机器学习模型可以在这些数据中找到模式。

此外,葡萄酒的味道是臭名昭着的主观。机器学习模型没有味蕾,所以它永远无法理解人类可以的方式信息信息。因此,确定用户的偏好是更困难的,或者味道,葡萄酒。它只能根据其化学成分和每种特征的感知值分配给葡萄酒的特定属性的值,使其成为人类投入定义的“好”葡萄酒。对于机器学习模型来说,准确预测对人们可能吸引什么类型的葡萄酒,建立模型的数据科学家需要以某种方式收集与葡萄酒偏好相关的可量化数据。由于这种数据需要在物理世界中收集,因此可能不是不可能的,但它可能是非常困难的。

量化因素可能包括:

  • 葡萄酒中发现的化合物
  • 葡萄酒中各种化合物的相对量(毫毫升)
  • 葡萄酒的颜色
  • 胜利的粘度
  • 葡萄酒的种类(波尔多、仙粉黛等)

更有挑战性的是如何在人类的感知中提炼出真正的人类“味道”标签,例如:

  • “顺利”
  • “橡木”
  • “水果”
  • “馅饼,但顺利完成”
  • 等等……

为了真正将这些主观经验提炼成品质可以可靠地推荐酒,大量的控制味觉测试将会与人发生各种各样的口味偏好,在葡萄酒和可量化的因素(化学组成、颜色等)必须可靠地“映射”的这些主观经验报道成千上万的人类(或成千上万)。

还有其他挑战。人类在一天中听取100首歌是完全合理的。用100杯酒做同样的意思是急诊室的旅行。事情进一步复杂于食物的存在 - 因为可以用相同的葡萄酒训练,但是用相同的葡萄酒训练的可靠系统 - 但有数十种不同的食物菜肴(从奶酪蛋白质到鱼叉,更多)。

它可能需要一个高度仪器化的、在不同地点的可控环境、大量的参与者和几个品酒会议。这些参与者将被要求品尝随机挑选的几种葡萄酒。每一种葡萄酒都要事先进行化学成分分析,并对选定的特性进行质量编码。

然后每个参与者会被要求根据这些品质对每种葡萄酒进行评价,比如酸碱度、酒香和甜度。根据评分,参与者会用1到10李克特量表对葡萄酒进行评价。这个量表将量化参与者的判断,从理论上讲,机器学习模型可以使用这些判断来确定什么是“好”酒,什么是“坏”酒。

这种数据收集方法需要大量的时间,金钱和努力。培训机器的数据所需的数据量需要几个月的时间需要几个月的时间。它将仅仅30分钟就会收集相同数量的数据。

也就是说,李克特规模判断是主观的,通常是异想天开的。同一个人可能会判断一天的葡萄酒是一天的“5”,另一个取决于他们的心情。另一种方法可以涉及更多客观的措施。例如,亚马逊将历史重大购买历史,以其推荐引擎。如果参与者为了评价葡萄酒,但在品酒时购买3瓶,那么机器学习模式可以将购买作为“喜欢”的代理,而不是参与者的判断。购买3瓶特定葡萄酒的人可能会认为葡萄酒是以某种方式的“善”。

由于这些挑战,今天的葡萄酒建议更有可能从购买数据中解散,而不是从葡萄酒化学化妆的任何强大评估,或者将该化学化妆的“映射”放在人类主观术语上,如“平滑”或“果味”。购买数据很容易。味蕾数据很难。

当所有人都说完成时,在线购物者可能能够查看一瓶酒的产品页面,并被推荐其他葡萄酒。页面上推荐引擎背后的机器学习模型可能能够确定葡萄酒品尝的参与者,评为葡萄酒的葡萄酒,购物者正在高度观看的葡萄酒也很可能高度评价另一葡萄酒。建议引擎然后将其他葡萄酒展示给购物者。

视觉艺术——人工智能模型如何理解图像

最近,谷歌公布了实验与人工智能他们试图拍摄一张图片,并对其进行编辑,使其更适合观众。据谷歌AI介绍,机器学习“模仿专业摄影师的工作流程,在谷歌街景中漫游景观全景,寻找最佳构图,然后进行各种后处理操作,以创造出赏心悦目的图像。”

但是,重要的是要注意“美学上令人愉悦”是一个非常主观的概念。有些人可能会令人愉悦,可能不是其他人。这一切都归结为上下文。AI可能能够模仿专业摄影师的特殊用途的质量和工作,例如广告滑雪胜地,但人们希望在博物馆中看到广告。存在特定图像的上下文影响人们是否喜欢它。

从艺术角度来看,视觉媒体很难判断为葡萄酒。为了教导AI获取对视觉艺术的味道,有必要将机器“理解”的可量化代理将其分解为可量化的代理。这可以通过将值分配给颜色,形状,手势和其他可视元素的组合来完成,并让人们再次评估那些在李克特级上存在这些组合的图像。

幸运的是,收集视觉数据比收集感觉品味的数据更容易,因为视线转化为数字世界。Google Images,Facebook和其他Visual Media平台将图像上的数百万个数据点降至这些图像中的特定像素中的特定颜色。

机器学习模型可以消耗这些数据点并使用它们来对特定用户如何响应人脑解释为图像的这种像素数据 - 像素数据来进行预测。例如,机器学习模型可以确定加利福尼亚特定县中的人们更有可能回应主要涉及来自美国其他地区的人的颜色蓝色的图像。此确定可以向推荐推荐产品推荐给该国家的人的推荐引擎。它也可以通知营销活动用视觉广告瞄准那个国家的人。

AI并不真实地理解那个县的人更喜欢蓝色图像,但它预测他们对基于数据,数字,统计数据的那些图像的响应。

人工智能理解味觉的现状

机器没有知觉。因此,它们现在既不能拥有自己的偏好和口味,也不能真正理解使用它们的人类的偏好和口味。他们很有可能在未来做到这一点,但这是一个相对遥远的前景。

目前,他们依靠数据来制作预测并确定可能性,模仿人们“了解”彼此的偏好,而无需真正掌握能够对人类大脑的完整理解。及时,这些统计机器学习方法可能延伸到化学感变(味道和嗅觉),但是这样做的遗漏挑战,我们试图在本文中突出。

标题图像学分:共和国,华盛顿

保持AI曲线的领先地位

发现在业务未来将赢家分开获奖者的关键AI趋势和应用程序。

注册“AI Advantage”通讯:

" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Thanks - check your inbox for a confirmation email">
" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Error - There was some problem.">
订阅
订阅镜像
qwfwef.

Wwefwef.

wefwefwef