美网 × IBM:体育大数据的「次世代」范本

来源:ob欧宝官网

阅读 12
发布时间 2021-10-20 09:39:06

  中,作者介绍了美网在 NFT 上的勇敢尝试。在本篇文章中,作者将借助美网✖️IBM 合作的案例,更加详细地阐释美网如何用大数据,为赛事带来了全新的观赛体验。

  在推出了赛事历史上第一个 NFT 项目之外,2021 年,也是美网和 IBM 一起合作的第 30 个年头。

  作为美网的官方云服务和人工智能(AI)合作伙伴,IBM 一直和美国网协(USTA)紧密合作,为全球超过 1000 万网球迷开发和提供世界一流的数字体验。这些体验通过美网的官方应用程序和网站来提供给受众,并通过 IBM 的混合云技术进行支持,同时还融入了 IBM Watson 的洞察力。

  在今年,IBM 也在美网推出了一系列的新功能,其中包括世界上第一个基于人工智能的网球运动员排名—— IBM Power Rankings。而 IBM Watson 则产生了一系列带有预测性的比赛洞察,来帮助球迷将注意力集中在整个美网赛事最有趣的比赛上,并识别出潜在的冷门以及具有明显上升势头的球员。

  IBM Power Rankings,是一个由 AI 生成的球员每日走势排名,可以帮助预测美网每场单打比赛球员获胜的概率。

  这个排名的算法,将球员最近的比赛得分和全面的数据统计分析,与 IBM Watson Discovery 的自然语言处理(NPL)能力相结合,来了解媒体对球员表现的评价,把球迷的注意力引导到最引人注目的比赛上。

  该排名每天更新一次。在整体的页面上,你可以看到每位球员的 Power Ranking、单打世界排名、姓名以及国家 / 地区。

  当点击右侧的下拉箭头时,你可以看到每位球员更为详细的信息。以下图的新科奥运会冠军小兹维列夫的数据为例:

  在界面右侧,则显示了小兹维列夫的 Power Ranking 随时间变化的情况——他的 Power Ranking 从未跌落到第 4 位以下。同时,我们还可以看到他在 8 月 31 日、9 月 2 日、9 月 4 日和 9 月 6 日分别赢下了 4 场比赛。

  而在 Power Ranking 中排名第 7 位的加拿大选手阿里亚西姆,呈现出的则是不一样的信息:

  如果球员尚未被淘汰,你可以在该球员的 Power Ranking 详细信息页面中点击「Match Insights(比赛洞察)」来了解由 IBM Watson 提供的关于该球员即将进行的比赛的预先分析。

  「来自沃森的比赛洞察」是通过人工智能技术生成的比赛指南,可以帮助球迷在美网的每场单打比赛前快速了解比赛对阵双方的情况。

  美网通过企业级的人工智能和 IBM 云,来挖掘最新的球员数据统计和媒体评论,以获得比赛洞察,其中包括了最新的 IBM Power Rankings、来自各种媒体渠道的相关引述以及通过自然语言处理技术完成的关键致胜指标。

  在前四轮比赛获胜后,他在 2021 年 9 月 7 日的男单 1/4 决赛中面对南非选手哈里斯。基于 Watson 的赛前分析,小兹维列夫有 64% 的概率会在这场比赛中获胜。他的 IBM Power 排名是第 1 位,而对手哈里斯的排名是第 6 位。两人的单打世界排名分别是第 4 和第 46 位。

  在随后的「In the Media(媒体评论)」板块,呈现了媒体对两位球员各 3 条的引述。这些引述是 IBM 利用其 Watson Discovery 平台,基于 AI 的智能搜索和文本分析得到的。

  接下来的「By the Numbers(关键数字)」,则是基于两位选手在美网比赛中的详细数据统计所得出的洞察。

  ·  截至第 4 轮,小兹维列夫在发球时的得分率是 76%,在所有 128 名选手中排名第一

  · 他的一发平均时速为 127 英里 / 小时(204 公里 / 小时),是所有选手中发球时速最快的

  除了上面数字外,在不同选手间的比赛洞察中,还有诸如:Ace 球占比、平均一发时速、接发球得分率、破发成功率、上网次数占比等众多不同的数据。这些数据可以让评论员和观众进一步了解选手的表现,增加他们对选手特点的认知。

  同时,这些数据也会随着选手的不断晋级在每一轮后更新。因此每位选手在每场比赛中的洞察都会有所不同。

  而所有这些数据和排名的基础,都来源于 IBM 在每场比赛的现场专门安排的数据统计人员,通过专用的数据统计软件来人工逐分录入的数据。而 IBM 则通过专门开发的 SlamTracker 比分应用程序,来呈现这些比分和数据。

  在 2011 年, IBM 和美网共同开发了一款名为「PointStream」的应用程序,通过对数据进行可视化来呈现比分和数据统计。经过不断地更新迭代,PointStream 成为了现在的 SlamTracker,而它的功能也一直在不断地变化。

  根据美网官方网站的描述:「IBM SlamTracker 是美国网球公开赛首屈一指的比分应用程序。它提供了每场比赛的实时比分、数据统计以及逐分的深入分析」。

  在 SlamTracker 上,我们可以看到对阵双方选手的头像、名字、比分以及这场比赛的项目、轮次、场地、比赛用时等基础信息。

  而除此之外,SlamTracker 的下方共有四个部分来帮助球迷了解一场比赛的情况,分别是:比赛概况(Overview)、态势分析(Momentum)、数据统计(Stats)和比赛洞察(Insights)。

  「比赛概况」的内容其实就是之前「来自沃森的比赛洞察」页面中第一部分的内容。其中显示了基于 IBM Watson 在赛前分析所得出的双方选手胜率、IBM Power Ranking 和选手的单打世界排名。而双打比赛的「比赛概况」呈现的是对阵双方球员的基础个人资料。

  「态势分析」应该说是整个 SlamTracker 中,对数据进行可视化的应用典范。它显示了随着比赛不断进行,球员得分胜负变化态势的情况。

  根据美网的描述,「这一功能可以直观地描绘出比赛得分的态势变化,让你可以一眼看出哪方选手的态势更好,以及整场比赛中态势是如何变化的。」

  通过观察,笔者发现:代表双方表现的态势线条会从中间向赢得一分的选手一侧绘制。而一方选手连续赢得的分数越多,态势线条就越会向该方增长。

  线条的颜色代表了这一分的得分方,蓝色代表着左侧的球员得到了这一分,而黄色代表着右侧的球员得分

  如上图所示,最左侧的图只能看出最基础的得分走势;中间的图则提供了更多细节,可以让球迷得知一分是否为 Ace 球(A)、双误(D)、制胜分(W)、非受迫性失误(U)和破发点(B)。

  当出现破发点时,「态势分析」中还会给出「破发机会(BREAK POINT OPPORTUNITY)」的提示,来告诉你现在是哪方选手有机会破掉对手的发球局。

  如果你点击右上角的小齿轮,你还可以根据自己的需求,决定是否在主界面中显示不同的关键分注释,如下图所示。

  在比赛进行的过程中,「态势分析」还会根据选手在刚结束一分中的发挥给出与该分相关的双方数据对比。

  例如在下图中,我们可以看到,截止到第 3 盘比赛第 8 局比分为 40:40 时,小兹维列夫和哈里斯的制胜分分别为 38 和 32 个。而当你滑动下方的圆点时,数据会告诉你:小兹维列夫 45%(17/38)的制胜分是 Ace 球,而哈里斯 41%(13/32)的制胜分是 Ace 球。

  通过这张图,我们则可以看到:小兹维列夫的平均发球时速为 193 公里 / 小时而哈里斯的平均发球时速只有 178 公里 / 小时。小兹维列夫的最快发球时速是 220 公里 / 小时,最近一次发球的时速是 207 公里 / 小时,而哈里斯的最快发球时速是 207 公里 / 小时,最近一次发球的时速是 183 公里 / 小时。

  例如下图:截止到第 3 盘比赛第 9 局比分为 30:15 时,小兹维列夫的总跑动距离是 4506.47 米,平均每分跑动 25.18 米,而哈里斯的总跑动距离是 4467.13 米,平均每分跑动 24.96 米。和种子球员以及所有其他球员相比,两人的跑动距离都略低于平均值。

  所有这些额外的数据对比,都是 IBM Watson 根据比赛进程来自动实时计算并推送的。可以看出,尽管只是比分应用程序中的一部分,美网依然进行了很细致和全面的工作,来为受众提供更多信息。

  在「数据统计」部分,提供了网球比赛常见的统计数据,包括了:Ace 球、双误、一发得分率、二发得分率、破发成功率、制胜分、非受迫性失误等等。

  而点击下方的「Full Stats」(全部数据统计),你可以看到更多更全面的与比赛密切相关的数据信息,一共分为五个部分:

  总体数据中展示的,就是常见的网球数据统计。只不过在这里,数据可以按照全场比赛和各盘来分别进行查看。

  在发球数据的部分,可以看到双方在发球方面的表现情况,其中包括了:Ace 球、发球制胜分、双误、发球次数、发球得分、发球局数、平均发球时速以及最快发球时速。所有数据都按照一发(1st Serve)、二发(2nd Serve)和总计(Total)分别进行汇总。

  接发球数据的部分也是类似,其中包括了双方的:接发球制胜分(俗称「Return Ace」)、接发球非受迫性失误、接发球次数和接发球得分。这些数据也都按照一发、二发和总计分别进行了汇总。

  而击球数据的部分,则显示了双方选手在不同击球类型下,正手(FH)和反手(BH)的制胜分、受迫性失误和非受迫性失误数量。这七种不同的击球类型分别是:

  如之前所述,在每场比赛中,IBM 的数据统计人员都会在现场通过专用的数据统计软件来人工逐分录入比赛数据。而在每个对打回合中,最后一拍的击球类型和得分种类都是他们需要去进行统计的数据。

  除此之外,数据统计人员还会通过雷达系统,捕捉球员的发球时速信息并记录他们的发球方向——这也是「发球方向数据」的来源所在。

  在发球方向数据的部分,我们可以看到两位球员在最快发球时速、平均发球时速、发球得分、发球界内和 Ace 球的这 5 项数据与发球方向之间的关系。

  这些数据会根据球员在平分区(DEUCE)和占先区(ADVANTAGE)发出的是外角球(左)、追身球(中)和内角球(右)的不同来进行汇总。

  通过这些数据,我们可以发现一些比较有意思的洞察,例如:小兹维列夫在这场比赛中的二发只发向了中路和内角,而他发出的内角 Ace 球数量要多于外角 Ace 球的数量。如果没有 SlamTracker 的可视化呈现,普通球迷可能很难能够通过这个视角来了解比赛。

  SlamTracker 在这里也展示了与上文中「来自沃森的比赛洞察」一样的内容,让球迷可以在不需要切换页面的情况下就能看到一场比赛的洞察内容,并且把其中的关键数字和球员在比赛中的表现进行比较。

  可以看到,在 IBM 的技术支持下,美国网球公开赛为全世界的球迷带来了与众不同的数字化体验。而除 Power Rankings、Match Insights 和 SlamTracker 外,IBM 还为美网提供了混合云平台,并使用复杂的分析和机器学习能力来帮助识别和解决对美网数字平台的潜在威胁。

  正如美国网协一样,在很多其他行业大大小小的组织里,人们也都在利用同样的技术来进行数字化转型,加速它们的创新步伐。

  从网球(tennis)到电信(telco)、从硬地(hardcourt)到医疗(healthcare)、从正手(forehands)到金融服务(financial services),这些技术不仅改变了美网的观赛体验,也改变了世界。

上一篇:重磅!华为轮值董事长徐直军:6G将在2030年左右投 下一篇:网信动态 宝坻、武清区委网信办、大数据管理中心开展交