Steam游戏平台的评价体系解析

荷科箱包网

经过较多年的发展,实际上Steam的评价功能已经相对成熟丰富,商店游戏页右上的一个总分,和下方的一个整体的评价展示区域,形成了Steam评价的基本部分。基础功能上我们通过三张截图示例和一张Xmind思维导图的功能梳理进行呈现。

例如Steam的打分机制是二维制度,只有推荐和不推荐的打分办法,并没有像其他商店那样采取五星制的打分手段。同时在分数展现上,Steam也采用了以文案描述为主的方式,而不是x.x分这样的办法。

另外特别值得一提的是,Steam在提供评价筛选器的同时,还给玩家十分硬核地提供了评价趋势分析的功能,十分用心。

虽然整体梳理了Steam的评价功能基础结构,但这对于深度理解产品是远远不足的,那么接下来就让我们更深入地研究一下Steam评价体系的产品观是什么样的。

Steam对于其评价系统一直寄予很大的重视,在不断的产品更迭中更是迭代数次其评价体系。其基本的产品发展指导原则可以总结为:做一个能够为客户“精准导购”的评价体系。进一步说明,就是希望评分评价体系能够帮助用户准确地做出游戏购买和下载的决策。

之前一个颇为常见的扰乱到评分的行为,就是开发者会发送Steam Key来换取评价。这当中的情况又分两类:

用户通过Steam Key激活游戏进行游玩,游玩过程或者游玩结束后给出游戏评价。而这一批用户因为其本身的属性特殊,属于较为核心的游玩群体,对于开发者又有一定的粉丝属性,因而在评价过程中更倾向于给出积极的评价。

开发者在发送Steam Key的过程中,明确要求了希望用户能够给出好评,实际上进行了一场Steam Key与好评的对等交易。

而这两类情况,往往都会导致总分失去准确性。在以上方明确的基本产品原则上看,Steam Key来源的评价在Steam团队眼里有必要在分数算法中进行剔除,因而在其之前的产品公告中明确宣布了去除。

Steam官方在其博客中就提到过,除了可以通过Steam Key刷取好评外,其在平时的运营观察中也发现了一些有组织的用户刷好评的行为,其来源仍然是开发者使用有偿的付费刷好评服务。

相对于Steam Key刷好评的过程,直接的付费刷好评服务会更难追踪,因而也需要更强大的风控算法对用户的评价价值进行评估,被认定为水军的账号评价进行适当剔除总分计算。

评价轰炸,Review Bombing,Steam同时也称之为Off-topic Review现象。第二个名称其实会更好理解一些,即“跑题评价”,评价聚焦的核心不再是游戏体验本身,而是与游戏弱关联的一些事项(例如、人事相关事件等等)的发生,给游戏带了一波差评,导致游戏分数快速失线所示,笔者采集了两个例子。一个是2018年2月,游戏深海迷航的公司员工被辞退的消息在Twitter发酵,导致当月一批集中的差评在Steam上齐刷刷地送给了游戏本体。另一个例子是2018年10月,游戏《古墓丽影:暗影》由于厂商在游戏发售后较短时间内,便给出了优惠促销措施,导致最早原价购买的一批玩家心里不平衡,旋即给游戏送上一批集中的差评轰炸。

这些差评并不围绕游戏本身的玩法、画面等角度展开进行比较客观的评价,而是基于一些外部因素,导致游戏分数的准确性降低。

对待这种行为,Steam在产品价值观上,始终认为此类动作对于准确的评分展现没有帮助甚至更多的是负面帮助。实际上,Steam的产品价值观并非纯粹建立在较为主观逻辑判断上,在实际追踪了此类群体行为发生的过程后,Steam团队发现,分数在当时情况下的快速失真,最终会被“时间”慢慢修复,游戏的分数会回归到其本身游戏体验所展现出的价值。

那么这些外部事件的发生,更多的是在当时个把月的时间范围内,影响了新客的购买判断,做出可能的错误购买决策。

因而面向这种较为常见的玩家泄愤行为,Steam最终选择了建立Review Bombing解决机制。在系统检测到一定程度的Review Bombing之后,会将跑题评价从总分计算和时间段分数计算中剔除,让分数本身更多地去折射游戏本身的体验。

同时,Steam还为玩家们提供了是否剔除跑题评价的能力,又在这基础上提供了评价数据趋势分析功能,帮助玩家在有个性化需求的时候追踪评价的动态变化过程。

实际上Steam在这里使用了一问一答的方式来构建“赞”“踩”功能,问句是“Was this review helpful”而回答Yes或者No来表达“赞”“踩”。

严格意义上来讲,意思是有区别的,评价并没有帮助到浏览者并不完全等同于“踩”的负面含义。但是这样的构建,已经足够为算法对于评价的排序进行数据支撑。

表面上看,似乎是让浏览者的情绪表达专门制作了一个选项。但是深挖Steam之前的官方解释,会发现这是为一个常见的人类行为“抖机灵”制作了引流。

可以参见图示9,用Funny筛选出的评价,更多地是聚焦在发布一些有趣、令人捧腹一笑的短小式评论,这些评论在普通的“赞”“踩”体系之下,可以快速地获得点赞,甚至进而升顶到热评第一位,但这符合Steam对于评价体系的“精准导购”的定位吗?

答案显然是否定的。这甚至对于一些认认真真写评价,围绕游戏玩法等角度展开评论的用户而言,都是一种热情上的和评论方向上的打击。

所以这时候Steam团队采用的办法,就是利用增加“Funny”选项,让用户在感到评价很有笑点的同时,能够适当去点击Funny而非点赞,那么对于排序算法来说,也就可以更高效地避免对“抖机灵”的评价进行不适当的升序计算。

总评和长期热评无法动态展现游戏近期的调整和变化。实际上,在一款游戏的生命周期当中,会有相当数量的版本调整和运营动作,这些事项也可以在评分中适当出现。

很多用户其实在没有完整体验过游戏之前,就会对游戏进行评价动作。TA可能是在游玩的半途当中,甚至并没有开始多长时间,那么此时的评价准确性可能仍然是不够充分的。

那么这些用户,一部分人最终会不断推进至游玩结束,此时当他们再做出对游戏的评价,是会比游玩前期做出的评价更为精准的,这时候Steam也会以提示的方式请求用户考虑是否需要修缮评价。

如图示11所示,无论是在游戏单页的底部评价浏览区域,或者是游戏的评价单页,Steam都给玩家提供了充足的筛选项,来帮助玩家在需要的时候对评价深挖浏览,选项包括“评价类型”、“购买类型”、“语言”、“日期范围”、“ 游玩时长”、“展示方式”。

实际上,即便调动了较多的产品逻辑来保障评价的显示排序尽可能地合理,Steam也无法完全保障评价排序是完美的,那么此时筛选器就可以发挥较好的辅助浏览的作用。甚至于当用户有更加个性化的评价浏览需求时(例如一定要看游玩时长x小时的玩家评价),筛选器会发挥更大的效用。

本文第一部分是简单地将Steam的评价产品从单纯的表现层开始推到做了一份思维导图的功能梳理,但实际上我们知道做产品的过程中这类梳理仍然是不够的,因而会有了第二部分更加立体的产品观的介绍,方便大家理解Steam在发展其评价产品体系的过程中,对其用户群体是如何运筹的,只有在充分理解其立体的产品观及其背后的思考逻辑之后,才能理解第一部分的产品设计为何这样做(例如为什么会有“欢乐”功能等等)。