新网工在YESLAB   

IT技术专业学习平台
IT人才专业服务提供商

 

VUE考试注册预约电话:010-82608710

全国热线:400-004-8626

人工智能强化学习10|隐藏的秘籍

首页    技术博文    强化学习    人工智能强化学习10|隐藏的秘籍

  时间过得很快,已经快要到春节了,然而就在本周DeepMind突然发布消息说自己的《星际争霸2》游戏AI搞定了,这说明经过失败后的不断努力果然是有效的。他们定于北京时间本周五公开直播人类玩家挑战《星际争霸2》游戏AI,据说这种AI是由N多的阿法狗升级版组成的,这样的消息让人不得不佩服强化学习技术彩蛋多,总有惊喜带给我们。

《星际争霸2》游戏AI

  强化学习是一种建立在多学科基础上的机器学习技术,今天我们就来看看几个隐含在强化学习技术中的概念性彩蛋,这些彩蛋就好像鸡汤一样,可以灌溉幼小的心灵,不管是不是带毒的,滋味总是好的。作者就收集到了一些跟刺激相关的鸡汤,下面我们一起品鉴一下。

  鸡汤1 多重刺激
  强化学习中有这么个概念,一种刺激给动物带来的反应是不足以引起重视的,但多重刺激叠加的话,就很容易让动物乖乖听话。简单来说就是,如果武松看到对面有两只老虎,就不会那么冲动了。这样的理论知识看起来索然无味,可你如果仔细观察身边,你会发现很多有趣的现象,如果我想创业,有个好的产品属于一级刺激,那就够了吗?当然是够我赔本了,但如果我又同时有靠谱的市场渠道,甚至背后有支持,那么就很容易成功了。

AI强化学习中的配图

  还有那些商店的折扣,首先是女朋友看到商品非常喜欢,这时如果商品不打折她会犹豫的。所以一旦碰到东西又好,还能打折的情况,那就属于接受了两级刺激,基本上不买就不可能了。这时如果再加上受到一些促进消费的信息影响,简直就是羊入虎口。所以想要创业记得不要冲动寻找对用户的多重刺激,遇到打折需要多想想这是不是在多重刺激你。

  鸡汤2 刺激粘贴
  这是跟刺激相关的又一个理论,刺激粘黏是指两种相关的刺激往往会粘起来一起反应,而没有粘黏性的是不容易一起反应的。例如人类训练狗,让狗坐下才给食物,这样这两种刺激就会粘黏起来,本来你说坐下它完全无感,但是训练成功后你可以随时让它坐下。当然这种反应也叫条件反射,一旦条件反射建立起来是很难消失的。那些电商每天都在研究的用户黏度,利用你的浏览时间等等数据进行复杂的数据分析,得到黏度数据再向你定向推荐,不也是为了培养你的条件反射吗,大多数人都容易重复买自己熟悉的产品,口红是不是买了一个又买一个呢?游戏机是不是买了XBOX又想买PS4呢?


  鸡汤3 永久刺激
  对于已经施加给动物的多级刺激,越高级别的刺激越难抽离,甚至无法抽离。还是以打折为例,首先是产品跟用户心理相关,然后折扣诱人,最后客服态度极差,这三个顺序你得看商家是如何安放在客户心里的。往往我们都是通过商品找到商家,所以首先是产品刺激,确实是我需要买的东西,刺激完成;之后我在浏览网页中看到折扣,刺激完成;最后商品发货很久才到,期间我找客服,态度极差。所以我留下的评价很大概率会集中在客服态度上,因为其他都没有感觉有问题。如果我将后两种刺激顺序调整,首先我看到产品,刺激完成;之后我咨询客服,态度极差,说不明白还不理人;最后我看到折扣诱人,这时可能我还是愿意为了折扣而买单,毕竟我是买产品又不买客服,最终货物按时送达,我也没有再想过去理会客服。这时候我留下的评价就不会集中在客服了。

人工智能强化学习中永久刺激理论
  所以聪明的商家会把最吸引客户的部分留在第二或第三位置让客户发现,而那种每天都在店门口挂着白布写着“清仓!挥泪甩卖!明天就搬走!”的店以及玻璃上贴“50% off”的那种只能卖卖熟客,毕竟没去过的人连产品都没见过何来信心相信折扣呢。

2019年1月24日 10:02
浏览量:0
收藏