自FIFA 17推出FUT Champions模式以来,对其中的Skill Point以及匹配规则充满了好奇,经过查阅一些资料以及自己在周赛中的不断摸索和尝试后终于可以成文。以下文章中可能存在不准确或不正确的观点,欢迎在评论中进行指正,在此谢过。
说到排名那必然要提到算法,而算法中和游戏有着密切联系且大家接触到最多的当属Elo了。
Elo是20世纪60年代初由阿帕德·伊洛(Arpad Elo)发明的,最早是用来优化国际象棋评估棋力的一种方法。现在不仅被很多其他棋类联盟采用,而且也是现在一些游戏中在线对战积分系统的首选。例如曾经火爆的的魔兽世界竞技场,现在正在运营的FIFA Online 3天梯赛,炉石传说,以及FIFA的在线赛季和前几年FIWC在线选拔的积分系统都是采用Elo。
尽管Elo相较于更早的一些排名系统有很大的改进,但也有它自身的一些问题。这个系统的问题在于无法确定选手评分的可信度。假设有两名评分(Skill Point)均为1800的FIFA玩家A和B。在进行一场比赛后A获得胜利,假定在Elo系统下,A选手评分将增长16,对应地B选手评分将下降16。但是加入A选手是已经很久没玩,但B选手每周都会玩,那么在上述情况下A选手的1800评分并不能十分可信地用于评定其实力,而B选手的1800评分则更为可信。
FIFA Online 3天梯排位的积分计算
那么可以理解为:
- A选手的评分增长值应该大于16分,因为他的1800评分作为初始值并不可信,同时击败一个稳定在1800评分的选手表明他的实力很可能高于1800;
- B选手的评分减少值应该小于16分,因为他的实力已经被很精准地定位在1800附近,而他输给了一个评分并不可信的对手,那么B选手的实力评定其实从该场对战中并不能有多少“学习”。
虽然很多情况下并不是这么极端,但将选手评分的可信度考虑进入是很有必要的。所以在1995年波士顿大学教授马克·E.格里克曼创造了Glicko排名系统。Glicko对Elo进行了扩展,不再仅计算选手的积分,还加入了“评分误差”(RD,ratings deviation),RD用于衡量一个评分的不确定度(RD值越高,评分越不可信)。高RD值意味着选手并不频繁地进行在线对战,或者该选手仅进行了很少次数的对战,而低RD值说明选手会很经常地进行在线对战。
在Glicko 系统中,选手的评分仅根据对战的结果而改变,但其RD值改变同时取决于游戏结果和未进行游戏的时间长度。该系统的一个特征是游戏的结果经常会减少选手的RD值,而未进行对战的时间则经常会增长选手的RD值。造成这个现象的原因是因为选手玩的局数越多,关于选手能力的信息就学习到越多,评分也就越真实;而随着时间流失,系统对玩家实力就越不确定,反映在RD值上就是增长。另外,对战双方评分的变化并不像Elo那样经常是相同的。例如A选手的评分增长了X,在Elo系统中对手B的评分会减少X,而在Glicko系统中并非如此。实际上,在Glicko中,对手B的评分减少取决于双方的RD值。
由于Glicko系统会同时用评分和RD值、以区间的形式评定选手实力,因此相较于仅使用评分更具有实际意义。此处应用95%置信区间,那么区间下限是选手评分减去2倍的RD值,区间上限是选手评分加上2倍的RD值。例如一个选手的评分是1850、RD值是50,那么他的实际实力区间为1750~1950。选手的RD值越小,该区间越窄,也就是说Glicko系统有95%的把握可以确定选手的实力在一个较小的区间值。
那么具体在FUT Champions中如何工作呢?
每位参加FUT Champions的选手的基础评分(Skill Point)为1500分,上面所说的RD(差值)值推测是根据每位选手UT Online Season场次和胜率以及周赛场次成绩等综合判定所生成的。每次周赛的头五场比赛为选手的定级赛。定级赛根据与每位对手的比赛成绩以及双方RD等多项数据生成当场的Skill Point并进行累加。待五场定级赛完成后,选手的段位就基本形成。根据定级赛结果,Glicko会对选手的Skill Point评分以及RD进行修正。
周赛需要五场比赛完成评分确定
在定级赛完成后,选手的评分(Skill Point)就基本确定。并根据当前评分和RD差值完成对手的匹配。这一过程直到40场周赛完全结束。
可能有朋友会问周赛和在线赛季的匹配区别到底在哪里?周赛的匹配就如上所说,对手的匹配会严格按照评分和RD置信区间匹配,置信范围外的选手是不可能匹配到的。而在线赛季则是将选手划分了10个段位,同段优先匹配,匹配随机抽取。如同段未能匹配则跨段匹配,匹配范围上下浮动两段。随着你比赛场次的不断增加,RD差值的范围也会逐渐缩小,并最终将选手的评分精确在一个区间内。这就能解释很多人反应为什么能在D1赛季遇到的对手却在周赛无法遇到。另外如果能够持续保持连胜,那么随着评分的提升遇到的对手也会越来越强。
不过由于国内网络条件的问题,大部分国内选手在周赛的评分都普遍偏低,所以稳定的客观条件是保证评分可信的先决条件。