查看原文
其他

大象产业——能不能不打大象?

鶽鴞 象语KTE 2021-06-11

一些被坚信着的观点

打大象的原因:树立象夫、驯象员的等级威信,惩罚大象的错误行为…

打大象的好处:快速改变、塑造行为,大象记忆深刻;缓解象夫情绪等。

打大象的坏处:大象会受伤,会恐惧。大象也可能会报复,但概率极低,低到没有人会重视。

不打大象的原因:尊重大象。

不打大象的好处:大象免受伤害。

不打大象的坏处:象夫失去自己的支配等级,口令逐渐失效;大象失去控制,可能会破坏设施、盗食庄稼、伤到人类…

惩罚手段之一,吓大象

首先,来定义一下打。本文所关注的打不仅仅是传统意义上的挥动击打,还包括刺、扎、拉拽等一切会引起大象疼痛的刺激。打最主要的目的是肢体惩罚,会造成大象恐慌、做出回避/逃避的行为。打大象通常发生在行为训练、财产和人员保护的情景中,具体发生在大象出现错误行为的时候,比如要求的动作没做出来,或是表现出攻击性时。有些象夫或训练师,在大象做出正确的行为时也会比较用力的拍打、敲打大象,这个算是强化行为,不算打。而有些人毫无缘由地也会敲打两下大象,制造出很响的声音,并表示说这是维持关系的手段、对大象来说不算什么。这属于有毛病,不做讨论。

在这张照片中,看似是象夫用错了手法,用有钉子一头向上戳大象来制止大象取食圣树的行为。大象回避刺激只会维持扬头取食的行为,而不会低头。其实这是象夫在促进大象取食,取悦游客,还假装是在制止。

大象有自身的行为模式,也有自己学习行为的方法。大象会表现出各类型的行为,即便是经历过长时间地训练,和训练师、象夫相处过数年,它们也不一定能轻易地做出正确的行为。大象每一种行为的出现都有一定的概率,正确的行为也是如此。想让大象明白训练人员的意思,在众多可以表达的行为中做出正确的行为,有很多方法。惩罚大象的意图是削减不正确行为的发生,这样正确行为发生的概率会增加。一旦正确的行为出现,训练人员会给予食物等奖励,以促进该行为的再次发生。这种方法被称为正强化(正强化及相关术语在本文第二部分)。近些年来,正强化好像成为了一种口号似的宣传,训练师都会说不打大象,用正强化的方式,还有什么来自国外的专家、技术等。这时我不禁想问,你们训的那个行为,大象在自然界中会做么?比如画画、按摩、倒立、走钢丝如何在不打大象的基础上让那种行为出现的概率一点一点增高?

与上一张图片不同,这名象夫确实不希望大象肆意取食,他戳击了大象的左足刺激它离开原地。戳脚不行便用钩拉象鼻。

不打大象在一些环境中是可能发生的,比如动物园的环境。按照训练方面专家的说法,需要动物园大象做出的一切与其福利相关的动作,都可以在保护性设施PC和正强化的基础上完成,打、罚大象是完全可以禁止的。但这绝不意味着动物园会完全采用PC和正强化。举一个例子,在进行行为训练前,有时需要大象对工具进行完全的脱敏,让大象对这些新异、熟悉事物的反应减弱,从惩罚和强化变为中性的认识。这些事物包括目标棒、保定架(夹栏)、不同的人、日程之外的活动等。这是需要时间的。如果大象经历过很多残忍的对待,它们是不容易信任伸向它们身体的棒状物的,如目标棒。脱敏后的训练更需要时间和经验,可能一头大象的某些行为要塑造几周、甚至几个月。并不是所有动物园都有这个耐心,但是一旦行为塑造好了,大象之后的护理、行为便可以是在无侵扰的条件下实现了。

视频中击打造成的伤口

在大象能够自由接触人类环境、自然环境的象营、大象园,不打大象是可能的么?基本不可能。大象的天性是一直吃、边走边吃,如果它们能自由活动在充满食物气味的环境中,怎么会不去吃家里的粮食和水果、农田的作物和水果?只靠象夫用象钩拉拽、戳刺是很难将扎进玉米田里的大象弄回来的。惩罚是不可避免的。

在有动物表演的场所,不打大象可能么?我在肯尼亚旱季的两个月,住在保护区的核心位置,几乎每天出去观察大象,每天记录几百头大象的行为,我没有见到大象后腿直立站起来取食的情况。如果去问常年在野外监测大象的工作人员,他们也会说那是很罕见的行为。这是由于那种站立的状态是很费力气的,两条后腿突然增加一倍多的重量,这不是常见的大象活动的模式。后腿站立并不会获得更多的食物,对生存的帮助微乎其微。食物多的时候没必要如此,而饥饿的时候不如把树推到。可能有时大象会心生玩意,垂涎树上的食物。但这绝对是极低频的行为,前足站立更是不可能发生的。但这种单足双足站立成为了动物表演、把戏的招牌。大象是单位质量耗能最小的陆地动物,它们的一切行为、身体构造都是服务于降低能耗的。对未受人类干扰的大象来说,它们绝大部分时间是较缓慢地、高度协调地走动的,极少做出突然的动作。再去想想马戏团的那些动作,要如何诱使大象做出那么低频的行为,并一点一点地将之强化成习惯的行为?不打大象是不可能的。且不说打的问题,大象在野外大部分时间是在吃东西的,而训练中的马戏团大象只有少得可怜的奖励可吃。它们的行为完全是在饥饿、打骂中形成。

Tutdao不听口令的偷食,引起了园丁的不满。园丁违规击打了大象,造成了较严重的创伤,完全恢复用了几个月。在我看来,这种惩罚行为应该是一次警告直接开除的。

上图为挤出的脓,每天都会挤出很多。

以上说的是打大象在不同产业的可能性,但是打不打大象还和很多产业环境因素有关,比如盈利模式、人员素质等。动物园的特殊性在于,动物园的大象“流动性”很高。从数据上看,动物园比其他行业更不在乎一头大象的死活。这里并不是在针对任何的饲养员、训练员,他们中无疑有相当部分热爱大象的人。动物园大象的死亡率高、平均寿命短是无可争议的,平均寿命、幼象第一年死亡率远低于伐木业的大象。但很矛盾的一点是,动物园却也是最科学的存在,福利、医疗水平最高的。这与动物园和动物医学、训练、科研机构联系密切有关。动物园是很容易做到不打大象,也有充分的时间一步一步地塑造大象的行为。但是只有很少部分的动物园在使用PC和正强化的训练系统。

索食吼叫、撞横木


只要食物吃完,两头大象就会表现出一些索食行为,比如拉拽围栏出口的横木试图打开、撞横木、吼叫等。大象触碰、拉拽横木并非真的想出去,更多是在表达不给食物就要出去了的信息。每次行为的发生都会伴随着人类的喂食,所以被强化了。索食时的大象很吵闹,但如果它们知道能打开横木,便会很静悄悄地打开,悄悄走出去吃东西。一旦看到人过来要教训它们便飞快赶回围栏。这些习惯的养成根源于象营的喂食方式,大象没有探索食物的机会。但是大象不能一直喂,怎么办?我会在象栏的四周藏一些食物,只要大象吃完食物就会去找寻这些角落。获取藏着的食物,需要大象善用吸气和吹气,以及对工具象草茎的使用。但是,大象不会在这些方面投入太多时间,10几分钟就会恢复恼人的索食行为。这种食物丰容也需要刺激,一般我在场的时候,大象才会更多时间去探索。

动物园有着最大的市场,也理应承受最大的舆论压力。从伦理层面看,动物园很难给出正当的理由。在科研和保护层面看,动物园也是被批评最多的,因为它们没做到的事情太多了。西方国家的动物园舆论压力大概发生在20世纪末期,动物园开始接纳正强化的训练理念、开始改造象区。但国内的舆论似乎都被海量的信息过滤掉了。给人们的印象是,国内动物园的改善工作好像进行得很缓慢很缓慢,尽管理念早已和西方接轨了。如果,动物园提供了最好的福利,最人道的训练方法,最优质的兽医服务,都像西方国家最优秀的一些动物园一样,大象的寿命延长了很多,甚至有很多大象能活到4050岁,有退役回归森林的机会,我想,那样的动物园,会有更高的社会接受度。国内的动物园什么样,可能热爱大象的大家都很清楚。先得把非洲象、亚洲象的幼象、少年象养活,同时有一批从事TBEEHV相关工作的员工,一系列改造象区象馆的工作在紧锣密鼓地进行。可能,想得到改变的证据要很久,因为现在的这批小象仍在比较不理想的环境中挣扎。

大象会养成一些坏习惯,很难矫正。比如图中的大象会向人扔东西,会扔到人、也会扔人类的事物,有几次危险的情景。这种习惯的养成是由于大象扔过东西后被喂食的结果,强化了这种行为。

全世界动物园的圈养大象也就1000出头,而泰国一个国家就有近3800头工作象,且95%为私有。如上文所说的,象营是不可能不惩罚大象的,因为大象生活在充满食物诱惑的环境中。但是,在那些有着深厚宗教、传统大象文化的地区,人们大多是不会过分惩罚动物的。一方面是受传统观念的约束,一方面是经济层面的限制。一头大象几十万上百万,任何的伤病都不是小事,单是看病的运输成本就不小。对于大多数家族企业的象营来说,大象是他们几十年的赚钱工具,不善加对待的话,整个家族都会失去这份异常轻松的职业,不得不去竞争其他劳烦百倍、工资低廉的工作。哪些人会恶劣对待大象?有钱企业的、有政府保障的象主。一些伐木行业的大象承受着悲惨的工作和生活,有时企业家会无视一些个体的问题。一些以大象为招牌的旅游景点是受政府扶持的,象主人即便失去了大象也不会损失太多,仍会获得足够的补贴去购买下一头大象,比如印度的斋蒲地区。写到这里,我希望重提一下收容所退役大象的原则,优先选择低价租用状态不好、需要休养治疗的大象,即便是购买也要用最低的价格,这样做的目的是让卖方不再从事大象行业的工作。

马戏团的大象,或者说表演用的大象,是最悲惨的一群大象,(在我看来)在不久的将来会完全被禁止。就像美国在20世纪末的情况一样。由于大象的肺结核、疾病、营养等问题,也包括安全和社会舆论的问题,马戏团表演逐渐淘汰大象的环节。我上文也介绍了,在我看来,动物表演、马戏团,这种人和动物自由接触的、强烈违反动物自然表达行为的系统,不打大象是不可能的。

近些年,受公众的舆论压力,很多地区、象营在禁止象钩,在向公众承诺不对大象进行体罚。但这种禁止基本仅仅是出于平息舆论的压力,而不是出于尊重大象的原因。由于人身安全的优先级一定是高于动物福利的,这种禁止很快会被取消。在大象能自由活动、和游客自由接触的环境下,打大象是不可能避免的。只有在保护性接触的体系,或是收容所的环境下,才可能完全没有体罚大象。下文我会分两个部分具体解释象钩的用法和保护性接触系统。这篇其实是之前写的几篇合成的,所以可能看着有些乱。

伤口处会发痒、会吸引蝇虫,大象常会蹭伤口导致伤情严重。

象钩和打大象

大象自然的行为是边走边吃的,如果路过菜摊儿、农田、香蕉车,有什么能让他们不去吃食物的理由么?一把香蕉和一车的食物比,哪个诱惑大?我见过两次大象不顾象夫的口令、勾拽跑起来追香蕉车的情况。人根本追不上它们。它们之所以不去靠近那些充满诱惑的气味源,只是因为身体承受着疼痛过不去,或是害怕被惩罚,比如正在被用象钩勾着,或是在朝着食物走去的时候被打了。有自由活动机会的的象营大象是不可能存在公众想象中的无伤害的。

如果大象在外面,它们会快速“跑起来”追香蕉车。

梵语中有个词Nila,是大象敏感点的意思,也是象夫使用象钩的刺激点,用以约束、控制、引导大象。象夫们非常知道如何刺激大象。如果大象不听从了,他们会马上去检查象钩的问题,检查是不是象钩太钝了刺激不到大象了,或是结构松了发不上力了。


象钩尖锐程度的简单衡量方式,立在食指上感受是否刺痛。

象钩是一根直棍,在一端通常有两个尖端,一个是弯钩的,一个直的。有的象钩只有弯钩,而有的在直的一端是根很不明显的短钉。弯钩是用来向人一侧拉大象的,可以作用在象鼻、象耳、腿内侧、腹侧、背部等,也是击打大象的一端。直尖端主要用于戳刺大象,迫使其远离。

上下两名象夫才控制住大象,没有进入玉米田,象钩造成了伤口,说明大象很用力在抵抗。

通常来说,给予疼痛刺激的方向是朝着目标方向的,大象如果反抗,逆着刺激方向活动,只会让疼痛加剧。只有朝向目标方向移动,才会减轻疼痛。所以,大象的行为是在回避刺激,这是属于负强化的方法。人在大象身上时,用钩子、钉子端戳、打大象头部是常用的手段,想让大象往哪个方向走,就从头的另一侧向那个方向戳。比如想让大象往左走,就在大象脑袋右侧刺激,这样大象为了远离疼痛便会离开,象夫也常会去踢大象右侧的耳朵。在地上时,想让大象向右走,就用钉子扎大象左侧身体,比如左腿的外侧、鼻子左侧、左耳等,或用钩子钩拉右腿的内侧、鼻子的左侧等。如果想让大象起身,就从腹部、腹侧刺激;让大象低头、爬下、跪下,就从上面往下扎或是钩拉。这些是基本的控制大象的手法,在没有食物诱惑的时候,这些手法很容易改变大象的行为。大象会在皮肤破损前做出改变。但如果是面临食物的吸引,或是长时间处在饥饿、过度工作、过度惩罚的状态,大象会忍耐很剧烈的击打。

示大象头部和尾巴的疤痕,上图的大象无疑被打得很严重。下图是一些传统劳役的大象,头部的疤痕很少。除了最后一张图左侧的GeeNowl,她是一头很可怜的伐木象,头部有不少伤口,害怕水每天被蝇咬食几十处。

所有严重的伤害都会在身上留下疤痕组织,一些浅色的、区别于大象皮肤的区域。疤痕组织是纤维化的,纹理与皮肤是不同,且表面凹凸不平。疤痕颜色会随着时间逐渐变为白色,且在该区域没有毛发。亚洲象皮肤的“褪色”是渐进的,雀斑式的,不是一整块的,粉色中常夹杂未褪色的灰色区域。而疤痕是一整块的。疤痕常集中在头部、腹部、尾巴等处。在老实的大象身上,往往能找出很多的疤痕,这是由于它们的老实是被打出来的。与自然的褪色不同,大象身上还会表现出另一种成片、成形态的褪色,这种褪色是由于与身上的工具、设备长期摩擦形成的,比如脖子周围、足四周。疤痕和成片的褪色几乎不会出现在野生大象身上。此外,限制大象的工具还有很多,常见的如脖绳,用以牵引、支撑等作用,还有类似牛鼻绳的象耳绳,在耳朵扎洞穿绳,用以牵引大象改变方向。还有如脖钉,让大象不容易转头,限制其活动。

Sambu四肢、足部有很多因链栓造成褪色和疤痕;下图Ot脖子也有一处。下图2Ruby背部一处拉木头时期留下的囊肿。


上为脖钉和耳绳

打是有方法的,但大部分时间人们是看不到象夫如何对待大象的,只有通过检查大象的体表才知道发生了什么。而且象夫知道击打不容易被人发现的地方,比如腿内侧、毛密的头部等。一个简单的衡量标准是,打是否造成了体表的破损。象钩和钉子在施用得当的情况下,是不会造成体表出血、淤血的。过分的钩刺会造成大象身体上出现划痕、出血点。一般的轻微破损出血,第二天就会痊愈,三天后就几乎看不出来了,不会留下疤痕。严重的钩刺会造成皮肤较大范围的开裂。如果是打击,基本会在皮肤上留下戳洞,需要很长时间的治疗、康复。会留下疤痕的伤害都应该给予象夫口头或记过警告。


上图中象钩造成的划伤、刺伤或是挫伤、木刺造成的伤口基本两天内就可以恢复。下图是控制大象远离农田时造成的划伤,算是比较严重的,第二天几乎看不见了。

下图是一处不知原因的划伤,第二天伤口就愈合了。

上图脑袋处的打击伤口用了3天。下图的打击,伤口完全恢复超过了一个月。


象夫也会用木棒端打、戳,也可以起到作用,且能做到没有痕迹。但很难给力量界定大小,或提出某个标准,标准以上就是殴打,就要接受一次警告。我常看到其他营地用条帚很用力地击打大象,木头发出了很大的声音,大象甚至吼叫了起来。但没有留下痕迹。

上图为一处原因未知的伤口。下图为象钩木棒短狠狠击打后留下的痕迹。

我以前写过一个象夫守则,是基于警告次数来约束象夫行为的制度。其中一条是,如果大象身上出现严重的戳洞,无法自然康复、需要每天治疗上药的,且明确是象夫打了大象的,一次警告就被开除。如果大象破坏了他人的房屋、造成了游客需要就医的情况,两次警告开除。如果象夫被大象扔了下来,发生两次也要开除。这些警告其实是告知象夫,如果虐待大象,他就有被警告开除的危险。

被大象摇下来断腿的象夫

但是在现在看来,很多情况是无法给予警告的,比如象夫出于阻止大象进入农田而击打大象。不去讨论大象过去是如何训出来的,只关注当下的情况,对于那些野性很强的大象,它们是不适合自由接触环境和人类的,象夫容易失去对其的控制,比如我比较了解的TutdaoTutdao伤害过很多人,把自己的象夫摇下身体致其断腿,拴脚链时踩过象夫,多次用鼻子甩过营地主、游客,还爱向人扔东西。

近些年,越来越多的人知道正强化这种训练方法,网上能看到很多应用类似的方法在训练大象。大意是利用食物奖励来实现行为的学习和记忆。比如训练抬脚修甲、举鼻收集鼻液甚至国内的某家大型动物表演场所也会鼓吹他们不打大象,完全正强化。但还是那句话,人们看到的只是行业人们希望展现出来的,而看不到产业内、幕后的行为。大象可以身上完全没有外伤,因为被其他物质的颜色掩盖了。象夫可以让人看不到钩子、棍子,但兜里揣着钉子,在人看不到的情况下扎大象。

看到我在拍照,象夫用叶片汁液掩盖伤口。

食物是原始、初级的强化行为事物,是最强烈的刺激。而大象是为“吃”而生的,一天到晚都要吃。食物能诱惑大象做出一些行为,比如吸引他们来到象圈的一个角落。但为了获得食物奖励而做出行为不意味着就是正强化来的。人们看到的视频大多只是,强化完

成的结果,以食物、口令加响片让大象做出一些比较特别的行为,比如抬腿。但在漫长的训练过程中,训练人员是否完全使用PC系统、正强化,人们不得而知。

训练部分

这部分是关于正强化和保护性接触的。大概是简单介绍下目标训练target training的模型,解释一些名词和概念。具体的训练有机会再作介绍。

下面目标训练的一个简要流程[1]

阶段0:声音奖励训练

——重复[响哨-暂停几秒-喂食]。

解释:让大象建立响哨和获得食物的联系,条件化响哨这一刺激(用响哨或响片click功能一样)。哨声强度不引发大象回避的行为。哨声响起前,不能展示出食物。哨声或响片属于桥接信号,这种声信号能促进动物的主动、关注和期待性,促进行为的学习和记忆。

阶段1:触碰目标棒

——向大象展示目标棒,如果大象嗅闻、触碰泡沫材料端,响哨奖励。重复[触碰-响哨-移除目标棒-奖励]。

解释:每次触碰目标棒后,要移除目标棒。这样每次展示都会是新的刺激。目标棒是训练大象的核心工具,一根端部包裹泡沫材料的棒状物。目标棒对大象来说是中性刺激的。如果动物惧怕目标棒,需要做脱敏。可以是选择习惯化或正强化的方法。习惯化很简单,长时间呈现给动物即可。正强化的方法,如果动物会远离目标棒,可以重复以下的程序:展示目标棒-响哨-移除目标棒-喂食-缩短展示距离-响哨…重复直到动物可以靠近目标棒。如果大象过于兴奋,试图尝试更多的探索,需要在它触碰前提前响哨,并移除目标棒。

阶段3:口令后快速触碰

——加入“名字-target”的口令,喊target的同时展示目标棒,直到完成率和时间(流畅度)达到标准,80%的完成率、展示目标和动物触碰的时间差小于5秒。

解释:缩短时间是一步一步来的。如果动物没有在10秒内触碰目标棒,移除目标棒,直到动物看起来重新关注你再进行训练。

阶段4:位置转换

——在围栏的不同位置展示目标棒,动物适应在不同位置完成刺激反应。尝试将动物引导到不同位置,比如厌恶的区域如保定栏(夹栏)。进入厌恶区域,响哨、强化,重复。

解释:引导到不同的位置相当于是给予不同的刺激,动物很可能会拒绝靠近某些区域,比如要进行治疗护理的夹栏。这需要训练者一步一步引导大象,从轻微厌恶的逐渐过渡到更厌恶的环境。引导应遵循距离、难度逐渐增加、难易混合的原则。最终在连续强化的位置变换训练中,达到80%的完成率。

阶段5:人员转换

——换另一名训练员进行训练。

解释:去除人的无关刺激。在训练中,动物可能会将训练人员视为强化物,这个阶段要将人去条件化,让大象仅对客观的口令、目标棒做出反应。这是从训练员过渡到其他人的过程,比如象夫、兽医、饲养员等。

阶段6:刺激控制——口令等待

——展示目标棒,不喊target。直到动物停止触碰目标棒,进入等待状态,立即喊口令。口令后触碰,响哨、奖励。逐渐将动物的等待时间延长至30秒。

解释:在之前的阶段,口令target和目标棒是同时刺激动物的,但动物很可能无视口令,看到目标棒就兴奋地去触碰。这个阶段是在强化口令的作用,只有在喊过口令后动物去触碰才能得到奖励。

阶段7:干扰因素——训练流畅度、完成度

——在不同的干扰因素下,如环境中有其他人、工作在进行,重复训练。控制完成度为95%,5秒内完成。

注意:

目标行为要一步一步来,难度不能上得太快。不论在什么难度,响哨、奖励的频次都需要保持在一定的频次,奖励频次太低会造成动物失去关注、感觉挫败,所以需要难易搭配。这尤其容易发生在口令刺激控制阶段,如果多次进行长时间的等待,响哨、奖励频次过低,动物很容易放弃。

某一身体部位触碰和获得奖励的联结建立后,同理可以去强化其他的身体部分,比如足、体侧、臀部等。这样便可以引导大象贴边、抬腿等行为。

训练系统

大象训练大致分为两种系统,自由性FC和保护性PC的接触系统。两个系统能获得同样的行为,但它们的理念是天壤之别的。做一个简单的解释,FC中用象钩作用在前腿后侧,腿前抬远离象钩;PC将目标棒接触前腿,前腿提起接触目标棒。一个远离,一个靠近,是完全相反的作用。FC是基于给予疼痛刺激的、依赖等级的、逼迫的,大象行为的发生是出于回避、负强化来的。PC是基于奖励的、引导的,大象的行为是自愿发生、正强化来的。很多FC也会应用正强化,甚至也杜绝了象钩,似乎是介乎于FCPC之间。但在理念上,二者是没有过渡的。PC系统设计的两个核心问题是人类安全和大象福利。大象由于受迫于权威口令、人类的支配等级而被迫做出的行为,是不满足大象自由表达行为的福利标准的。PC设置保护性障碍,不仅仅是出于保护人类、淘汰象钩、限制大象活动的目的。隔离了人和大象的自由接触,才有可能让人脱离大象认知的社会等级体系,大象才可能自由地探索行为。也只有配合使用正强化和PC技术才能被称为PC系统。

下面具体解释下两个系统和一些重要的概念[2,3,4,5]

自由性接触(FreeContact, FC

FC系统中训练人员和大象直接接触。训练以象钩为基础提示大象做出各种动作,之后以食物、赞扬和肢体接触来强化行为。象钩是负强化的象征,大象的目标行为是由于象钩刺激的消失而强化的。随着训练时间的增加,逐渐用口令替代肢体提示。FC需要大象完全服从训练人员,如果人和象的关系不是完全等级服从性的,人很可能被伤害甚至死亡,此类事件报道的很多。适于FC的大象通常是易于执行口令、无需化学和肢体限制就可以进行健康检查的个体。不适于FC的大象很多,比如成年雄象。马戏团、象营和一半左右的动物园在训练大象时仍是FC的。

保护式接触(ProtectedContact, PC

PC系统中训练人员和大象隔着围栏互动。象钩被淘汰,不再参与迫使大象做出行为。PC时,大象行为的训练基于目标训练法,通过食物、目标棒、响片clicker或是口令等元素捕捉和强化行为。在PC系统中,正强化是最主要的行为塑造的方法。只有在正强化的各种策略都失效的情况下,才使用令大象厌恶的技术,如负强化和非肢体惩罚。如果不良的行为出现,三种方法被认为是可接受的,消退、训练不兼容行为、以及暂停惩罚。在大多数情况下,简单的忽视不良行为即可,比如攻击行为。PC系统中暂停作为唯一的惩罚方式,仅仅是取消了动物继续获得正强化的机会。肢体惩罚只有在威胁生命的情形下才可以使用。PC系统的期望是保护训练员、废除肢体惩罚和大象的等级认知,强调奖励(正强化),也有部分原因是回应公众对惩罚的厌恶。西方一半左右的动物园是PC的。

象钩(Ankus

象钩是专门针对大象设计的训练工具,它能延伸人的接触范围,有触、推、拉等方式作用大象身体。象钩是负强化的象征,是维持训练者在大象社会等级中支配地位的核心工具。象钩一般是一个尖端较锋利的金属弯钩和棍状物嵌合而成的,弯钩或弯钩端棍常有另一个尖锐的突起。象钩的作用建立在给予大象厌恶的刺激,大象出于回避接触刺激做出行为的改变。象钩在给予刺激同时也要配合口令、食物、鼓励强化行为。随着目标行为出现频率的增加,肢体刺激逐渐由口令替代。通常,将象钩的刺激定义为轻微的身体接触和轻度不悦的刺激。象钩是所有FC必需的工具,一些PC在特定时期也会用象钩。

在一些情景下,象钩也被用作肢体惩罚,用来打击大象,比如大象做出撞人、挤人等危险行为的时候。再次强调,象钩在FC作为保护人身安全的工具是必需的。象钩的使用中,击打被认为是不可接受的。但是,击打并不是罕见的事件。这是为什么很多动保人士呼吁禁止象钩的原因。在动物园正强化的工作中,训练师基本可以用口令、手信号和目标棒引导和塑造所有行为。而且,训练师不是处在大象的社会支配地位,体罚也被禁止了。那么象钩还有什么意义?

目标棒(Targets

目标棒是PC中的核心工具,用于正强化塑造行为上。目标棒对大象来说是中性的、自愿接近的物体。但对很多用传统方式训练的大象来说,棒状物即代表刺激,这种情况需要在训练前进行脱敏。目标棒通常人造材料的棒状物,一米到几米长的都有,一端以不会产生刺激的泡沫材料包裹。目标棒实现的目标很简单,当呈现目标棒时,大象靠近并以身体不同的区域接触目标棒。这种目标的实现基本可以解决很多护理的问题,比如将鼻子抬高、抬腿、一侧贴近等。

ACTIVE ENVIRONMENTS一个20世纪90年代活跃在美国的PC系统应用和正强化训练组织。上图来自其网站http://activeenvironments.org/gallery/

惩罚(Punishment,P

训练是作用于动物在口令和线索的指示下做出的反应的。强化反应,行为出现的改变会增加;惩罚,行为频率便下降。对于如何处理不按要求行为的动物,有很多讨论。过去的一些训练会涉及肢体惩罚,有时会很严重。现在,这种惩罚极大地减少了。大多数的动物园训练师是认同肢体惩罚应该是低频、低伤害的。大多数的训练系统不再使用肢体惩罚来矫正行为,取而代之的是负强化(即正确行为出现后取消施加的较温和的刺激)和负惩罚(表达错误行为时撤销提供的令其愉悦的资源)。比如,训练师以象钩或训练棒触碰大象的足(身体部位),大象会因为触碰的刺激程度增加而抬脚(目标动作),完成目标动作时会取消刺激,这是负强化。在PC中,大象做出正确的行为时提供食物和触碰(奖励、强化),而非目标行为出现时,不提供实物和触碰,这是负惩罚。负惩罚的一种方法是暂停训练,训练员离开场地或是无视大象的索求,给予动物时间来理解。

限制方法

大象的基本限制方法是链栓Tethering,比如一条前腿、对角的一前一后链栓或是运输时的四足链栓。链栓也是护理、治疗过程中重要的流程,很多大象在接近的时候需要链栓限制活动,比如足部护理或采血时。接受脚链通常是在很小的时候就被训练的。

另一种方法是保定栏(elephantrestraint device, ERD),或简称夹栏。夹栏是很窄的栅栏,比大象腹部宽不多。夹栏可以限制大象的活动,但有时仍需要栓脚链。ERD的设计需要满足可以通过大象移动或设施调节以接触大象的四足、牙、象鼻、面部、耳、体侧以及臀、尾等各处。要限制大象活动的空间,又不能让大象感觉太局促。大象平静地接受ERD是需要时间训练的,以便将来需要长时间的保持在其中。

其他训练术语[6]

条件作用,条件化(conditioning):由于改变环境,行为的频率和形式发生变化。可以通过提供强化或惩罚的结果实现。

操作性条件作用(operant conditioning):动物的行为有其自然的模式,每一行为的出现都有其一定的频率和形式,而频率和形式是受到环境影响的。操作性条件作用是动物认识条件和关联的学习方式,动物对环境进行了操作,得到结果,进而了解结果的操作条件。比如大象向人扔东西(操作),人给予食物(结果),大象扔东西的频率和可能性就会增高。大象认识了扔东西是获得食物的条件。一个行为的增加或减少是直接受结果影响的。如果动物的行为得到了好的结果,动物会更倾向于表达这种行为。

刺激(stimulus):一种体外或体内的物体,或事件,能够引起个体的行为反应,与反应response相对。

强化(reinforcement):强化前,目标行为是,出现的概率或频次很低;强化后,目标行为出现的可能性或频率增加。

强化物(reinforcer):任何导致反应出现频率升高的结果。翻译为强化物,是由于结果基本是获得食物这种强化行为的食物。实际上的翻译是,导致行为强化的结果,这是遵循理论原意的翻译,大象认识的是结果的好或坏,或是说是对自身生存力、繁殖力影响的好与坏。

惩罚物(punisher):任何导致反应出现频率下降的结果,表现为一种刺激或事件。同样的,翻译本意是,得到惩罚的结果。

非条件强化物(unconditioned reinforcer):能引发非条件反应(unconditioned reponse)的强化物,如食物和水,有提高生存力的意义。也叫初级强化物。

条件强化物(conditioned reinforcer):曾经是中性的刺激,与另一强化物配合发生,成为强化物。也称为次级强化物,通常是配合初级强化物。

信号,线索(cue):有助于动物在做出特定行为的刺激或条件。线索并不能出发行为,只是提示动物,只要行为完成,强化就会发生。

中性刺激,信号:在条件化之前,对个体行为没有影响的刺激。

正强化(positive reinforcement):指在正确的反应发生后提供一个强化物(结果),从而增加未来该反应再次出现的可能性。

正惩罚(positive punishment):在不正确的行为反应后给予一个惩罚物(结果),一种厌恶的刺激或是增强厌恶刺激的强度,以降低该反应出现的频率。

负强化(negtive reinforcement):行为反应后,刺激消失,导致该反应发生的频率增加、

负惩罚(negtive punishment):一种惩罚的过程,动物做出反应后伴随着正强化刺激的移除或强度下降,导致该反应频率的降低。

桥接信号(bridge):桥接信号发生在正确行为与初级强化物之间,因与初级强化物配合发生而获得强化作用,如响片clicker和哨。当动物做出目标行为后,紧接的桥接信号会第一时间传达行为正确、马上奖励的作用。桥接的声信号会使得动物保持在兴奋、期待、专注的状态中。实验证明在有桥接信号的训练中,动物学习得更快、记忆得更久。

暂停关注(time out):在个体表现出不良行为时,采取暂停正强化、取消对其关注的反馈,以减少不良行为。是负惩罚的一种。

行为消退(extinction):之前强化的行为不再给予强化,让其逐渐消失。

非兼容行为(incompatible behavior):一种会干扰或不能与另一行为共存的行为,用以应对非目标行为的出现。

正强化:在正强化系统中,大象是可以随意探索表达行为,只有目标行为会被奖励,而其他所有行为不会有负面的行为反馈,如肢体打击。训练者要通过暗示、设定目标、食物奖励等手段捕捉、固定、强化行为。简单说,正强化是奖励来的,动物自愿形成的追求愉悦的反馈。

负强化negativerein forcement:在负强化的系统中,大象不能随意表达行为,非目标行为可能会因受到惩罚而减少,而目标行为的出现其实在回避负面的行为反馈,如击打、钩刺。训练者会以口令、象钩钩刺、打击迫使大象回避,大象回避才是需要强化的行为。负强化是在回避痛苦、刺激,逃避厌恶的反馈。

脱敏desensitization:改变动物对刺激认识的过程,去条件化的过程。让刺激的强化或惩罚的意义变为中性,动物对刺激的反应逐渐减弱。过程需要时间和经验成本。在脱敏时,如果没有采用强化手段,脱敏是被动的,或称为习惯化(被动脱敏)。主动脱敏会运用基本的正强化方法。

系列文章:

想永远趴在大象背上的人

象夫

大象产业——我们在抵制骑象什么?

大象产业——能不能不说谎

大象结核病TB的知识和一个案例


参考:

1.Westlund K. Traininglaboratory primates–benefits and techniques[J]. Primate Biology, 2015, 2(1):119-132.

2.PROTECTED CONTACT - BEYOND THE BARRIER http://activeenvironments.org/pdf/PC_Beyond_Barrier.pdf

3.Protected Contact and Elephant Welfare http://activeenvironments.org/pdf/PC_Elephant_Welfare.pdf

4.PROTECTED-CONTACT ELEPHANT TRAINING http://activeenvironments.org/pdf/PC_Elephant_Training.pdf

5.Converting Elephant Programs to Protected Contact

http://activeenvironments.org/pdf/Convert_elephant_progamPC.pdf

6.吴乃江_野云飞博客http://blog.sina.com.cn/s/blog_51267c5e010163td.html


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存