steam游戏帮科普SteamSpy销售量这个东西

最近台制游戏登上国际
就开始看到有些人在讲SteamSpy这个东西准不准
这东西基本上就只是搜寻演算法的一种应用
他会从Steam上搜寻你的游戏库然后也会延伸搜寻你好友的游戏库
在此前提下做交叉比对,然后得到一个统计数字+变数
然后当你把游戏库设成隐藏或是像我一样没好友边缘人
是有"机会"Spy没办法从你身上采样的

因此,以此为基准做几个结论点
0. Just collect Owners.
1. 销售量越低的时候越不可信,一般共识是低于一到三万这个量以下
2. 销售量越高可信度也会上升,毕竟是大众数剧,一般共识是数十万以上就有相当的可信度
3. 因为是从现有的Steam伺服端定期抓的数据,加上交叉比对的演算法,
所以一般来说SPY显示出来的销售量是被"低估"的
4. 给数据流看的: 当产品达到数十万时,误差值是2-1x%
5. 阿六出不去,美心上国际,台湾发大财\O.O/

Introducing Steam Gauge: Ars reveals Steam’s most popular games

LEARN ABOUT STEAM SPY

Steamspy 的演算法不是它当下真的扫出了 100 万人有这套游戏,
然后就可以确定游戏有了 100 万的销售量好吗。
它是用统计学估算的。
以这篇 2014 年的技术文章的说法,那时候他们一天可以抓大概 10 万上下的有效样本,
那时候 Steam 的总用户约有 1.7 亿。
而现在 SteamSpy 说法是他们一天可以抓上百万的样本,
但现在的 Steam 总用户量应该也超过了 3 亿,就算一天能抓一两百万、那也不到总量的 1%。
当然如果用这种方式傻傻地抓,不只慢,在有效样本足够以前、也很难做出正确的估计。
所以 SteamSpy 应该还有很多特殊的演算法和估计的公式。
例如有办法先抓取那些高度活耀的、购买力高的帐号,
我想在线时数以及社群活耀程度应该都有纳入考虑范围。
另外 SteamSpy 自己也提到关于 "免费周末" 之类的额外效应,
所以它应该也有设定特殊的演算法去处理这一类官方正式行销手法造成的特殊状态。

What’s going on with Steam Spy?

这篇网友留言的文章里面、SteamSpy 负责人也有提到,
因为 Steam 对于玩家帐户隐私权设定的改变,
和一些「可能」针对他们这些第三方资料挖掘网站的小动作,
导致从 2018 年 4 月开始、旧的 SteamSpy 的演算法和统计机制、已经变得无用。
现在 SteamSpy 用的演算法,不是纯粹的 Steam 用户资料挖掘,
而是再配合上大量网路搜寻资料等等数据的结果。
实际上、连负责人自己都对这样的结果不满意(虽然之前几次测试下来、出来的结果还蛮准的),
这也是为什么从去年下半年开始,SteamSpy 不再开放过去开放的大量详细资料的缘故。
他也说了,在能够解决所有的问题前,SteamSpy 会对一般用户关闭大多数的数据功能。

以这次「还愿」的玩家拥有量在几乎一两天内、暴增了近 100 万的状况来说。
难道说 SteamSpy 这一两天抓的几百万份样本、几乎都买了「还愿」,
然后这些人买了一不游玩
(还愿这三天来最多在线游玩人数在 1.3 万、直播人数也不如开卖的头几天),
二不打评价(突然暴增了 5、6 倍的拥有者、那多个 2、3 倍的评价不算过分吧),
这不是很奇怪吗?

我相信这次事件、肯定有让「还愿」有藉著人气、多卖了一波。
但是这次的状况、SteamSpy 的统计估算机制,也很可能失准了。
因为在它的统计机制里面,
肯定没有「游戏因为非官方的行销方式、突然出现了巨大的讨论热潮 & 爆买爆退的情形」
这种状况下、需要的特殊演算法。
如果使用正常游戏在没有促销的正常销售方式下,拿来估计这次「还愿」遇到的状况,
我相信肯定会有失准的情形。
官方也有澄清「目前网路上所流传的讯息、严重高估的还愿销量」,
指的应该就是 SteamSpy 的统计吧。
还是有人认为赤烛真的卖了 100 万套、还故意说没有,有需要那么心机吗?




首先Steamspy在2018的四月之前仍然是有一定的公信力的,
然而在四月十一日Steam已经更改私隐设定了。

steam游戏攻略指南

所以自从四月二十八日steamspy重开后开始,
它所抽取的数据就存有一定误差了。
另外假如Gaben发现Steamspy的创办人一直帮助开发Epic game store的话,
那么他又会不会乖乖地提供客户资讯给Steamspy?

steam游戏攻略指南



(手机排版请见谅)


真的很多人买游戏不玩
我就很多款买了连下载都没有
就跟买爽的一样
没办法不买不爽,买了再说
光我一个办公室部门,就有40-50套是只有买,还没下载,当然也没开始玩的
甚至其中有2/3的同事,连电玩都没在打,纯粹就是买赌烂的
这是SteamDB的资料,提供参考

https://i.imgur.com/JyqPhwa.png

实际准则,还是参考官方公告消息吧!
来源网址: https://steamdb.info/app/1006510/graphs/
※ 引述《g1208g (张小仙 )》之铭言
> 以这篇 2014 年的技术文章的说法,那时候他们一天可以抓大概 10 万上下的有效样本,
> 那时候 Steam 的总用户约有 1.7 亿。
> 而现在 SteamSpy 说法是他们一天可以抓上百万的样本,
> 但现在的 Steam 总用户量应该也超过了 3 亿,就算一天能抓一两百万、那也不到总量的 1%。
统计学的重点就是
母体的数量其实无关紧要
只要抽样的数量达到一定标准
就能以极高的概率获得有效样本

一般来说的95%信心是到2000分左右就能达成
不管母体是4000、4亿、4万万亿都不会有多大影响
实际上抽样百万份
已经是接近物理学的标准了
是很高的抽样水平

> 当然如果用这种方式傻傻地抓,不只慢,在有效样本足够以前、也很难做出正确的估计。
> 所以 SteamSpy 应该还有很多特殊的演算法和估计的公式。
> 例如有办法先抓取那些高度活耀的、购买力高的帐号,
> 我想在线时数以及社群活耀程度应该都有纳入考虑范围。
> 另外 SteamSpy 自己也提到关于 "免费周末" 之类的额外效应,
> 所以它应该也有设定特殊的演算法去处理这一类官方正式行销手法造成的特殊状态。

刚好相反,抽样要正确
就要无差别的随机抽取
包含死掉的帐号都要一视同仁
无视地区、活耀率、人种、文化
随机才是正确还原母体的方法
一般来说,这种抽样在小概率事件会有更大的误差
旦在大概率事件上的准确性
基本不用太怀疑
就跟开版说的一样
如果一个东西只卖几万份
误差可能很大
但是卖到上百万份
基本就靠谱了
以上~
※ 引述《mymamyma (雨情 )》之铭言
> 统计学的重点就是
> 母体的数量其实无关紧要
> 只要抽样的数量达到一定标准
> 就能以极高的概率获得有效样本
> 一般来说的95%信心是到2000分左右就能达成
> 不管母体是4000、4亿、4万万亿都不会有多大影响
> 实际上抽样百万份
> 已经是接近物理学的标准了
> 是很高的抽样水平
> 刚好相反,抽样要正确
> 就要无差别的随机抽取
> 包含死掉的帐号都要一视同仁
> 无视地区、活耀率、人种、文化
> 随机才是正确还原母体的方法
> 一般来说,这种抽样在小概率事件会有更大的误差
> 旦在大概率事件上的准确性
> 基本不用太怀疑
> 就跟开版说的一样
> 如果一个东西只卖几万份
> 误差可能很大
> 但是卖到上百万份
> 基本就靠谱了
> 以上~

关于统计学的部分,这篇说的是对的。
旧的 SteamSpy 资料挖掘的方式,确实可以获得可信度相当高的游戏销售数据。
但是 What’s going on with Steam Spy? 这篇提到三个重点:

现在的 SteamSpy 使用的是 Steam 用户的资料吗?
其实大部分不是。有很多是使用网路上的流量数据统计参照的综合结果。

有办法恢复过去的作法吗?
没办法。除非 Steam 想开了。

现在的 SteamSpy 准不准确。
其实很不准。虽然很多时候的结果还蛮令人满意的,但有时候还是有些出现了异常的数值。
估计值和实际的量相差 5 倍也不是奇怪的事情。

老实说、整件事情最令我吐血的事情是,除了台湾香港的媒体,
至少我用 google 查不到其他国家的游戏媒体,引用 SteamSpy 的数据、当作游戏的销售量。
难道那些美国欧洲的游戏媒体网站、还没有台湾媒体熟悉 SteamSpy?
还是说这些国外媒体知道,SteamSpy 的数据仅供参考,
一个认真严谨的媒体不会任意使用这样的数字、更不要说是还放在新闻标题上面?
弄到官方都要跳出来澄清,结果今天最新的报导内容还不断在引用 SteamSpy 的数据。
这样的新闻媒体素质,是不是应该要再加强啊?


  如果是一般正常状态下 以统计来算可信度高
但突然爆量的情况下 以统计来算十分容易高估
且这次很多是买了评价退款 所以实际销售量会少很多
个人推断三十万左右吧
星期六 十万
星期日 二十万
星期一 一百一十二万
这问题己经超越销量多少的问题了
而是升华到信仰阶层了
真的数字早己不是重点了
而是在于能为信仰充值多少
聚焦在实际销量满没意义的
看看昨天破百万消息出来后再被媒体一条龙做新闻时谁敢出来分析一波?!

steam游戏攻略指南

还愿自发行开始到星期五出事,高峰时间在线人数达到1万3左右,然后到星期五之后明显下跌,现在已经基本每天只能保持3000-4000的游玩人数,很明显之前几天冲销量和在线人数的都是中国玩家,有可能会出现事情发生后反而销量暴涨到百万的情况???
这在线人数明显不符合这个销量的常理
来补充一下
※ 引述《g1208g (张小仙 )》之铭言
> What’s going on with Steam Spy?
> 这篇网友留言的文章里面、SteamSpy 负责人也有提到,
> 因为 Steam 对于玩家帐户隐私权设定的改变,
> 和一些「可能」针对他们这些第三方资料挖掘网站的小动作,
> 导致从 2018 年 4 月开始、旧的 SteamSpy 的演算法和统计机制、已经变得无用。
> 现在 SteamSpy 用的演算法,不是纯粹的 Steam 用户资料挖掘,
(discord对话 2018/4/20)
adamlieb
Curious what % of profiles you are/were sampling are now "public"
Steam Spy
Maybe 0.5% are public now
And most of them are super hardcore collectors
Having hundreds of games
Rayvolution
Are you bothering to scrape that data anymore? I imagine its very bias, since most casual gamers (who may also be into very different kinds of games) probably are not even aware they have a profile in the first place, much less are they going to switch it to public.
Steam Spy
I'm still doing it just in case
But it's not really useful anymore
The sample is very biased
You can check it by looking at average playtime for almost any game before April 10 and after
It tripled :wink:

现在抽样到有公开个人页面的只占0.5%,而且大部分的人是重度收集玩家
使得统计的结果非常偏差,无法代表大多数玩家,抽样的结果不再有用
=> 猜测现在来源应不再包含抽样的资料

> 而是再配合上大量网路搜寻资料等等数据的结果。
文章有一段
(...predicting economic outcomes based on accidental data that might be irrelevant to the predicted results using machine learning)
用机器学习以看似无关的资料来预测销量
=> 猜测资料可能包含在线人数、评论数、社群活跃度、youtube/twitch热度等各式资料
> 实际上、连负责人自己都对这样的结果不满意(虽然之前几次测试下来、出来的结果还蛮准的),
> 这也是为什么从去年下半年开始,SteamSpy 不再开放过去开放的大量详细资料的缘故。
> 他也说了,在能够解决所有的问题前,SteamSpy 会对一般用户关闭大多数的数据功能。

(discord对话 2018/5/6)
5lider
How accurate is it comparing to the old method (before Valve changes)? Are historial data (before changes) the same?
Steam Spy
Well, it's way less accurate now. The previous one had margin of error around 5% on big titles with confidence range of 98%. The new one has around 10% on small titles and the confidence range is at 90% at best.
The problem is the new one is way less precise on big titles (above 500K)
But more precise on small titles (under 500K) than the old one
Especially for titles under 50K
5lider
It's actually better for me :smiley:
Steam Spy
The margin of error is not as much of an issue now. The confidence range is what scares me
90% means that every 10th game is not in the expected range
Still ok for tags and genre exploration
Not good for individual games research
新的演算法在畅销作(>50万)的预测比旧的预测差,相对的另一边(<50万)的预测比旧的好
有十分之一的游戏预测会非常失准(文章说高达5倍)
适合用来分析潮流类型,不适合用在研究单一游戏
> 以这次「还愿」的玩家拥有量在几乎一两天内、暴增了近 100 万的状况来说。
> 难道说 SteamSpy 这一两天抓的几百万份样本、几乎都买了「还愿」,
> 然后这些人买了一不游玩
> (还愿这三天来最多在线游玩人数在 1.3 万、直播人数也不如开卖的头几天),
> 二不打评价(突然暴增了 5、6 倍的拥有者、那多个 2、3 倍的评价不算过分吧),
> 这不是很奇怪吗?
> 我相信这次事件、肯定有让「还愿」有藉著人气、多卖了一波。
> 但是这次的状况、SteamSpy 的统计估算机制,也很可能失准了。
> 因为在它的统计机制里面,
> 肯定没有「游戏因为非官方的行销方式、突然出现了巨大的讨论热潮 & 爆买爆退的情形」
> 这种状况下、需要的特殊演算法。
> 如果使用正常游戏在没有促销的正常销售方式下,拿来估计这次「还愿」遇到的状况,
> 我相信肯定会有失准的情形。
> 官方也有澄清「目前网路上所流传的讯息、严重高估的还愿销量」,
> 指的应该就是 SteamSpy 的统计吧。
> 还是有人认为赤烛真的卖了 100 万套、还故意说没有,有需要那么心机吗?
成为会员后可以看SteamSpy上的图表
我真是盘子
还愿过去六天的估算

steam游戏攻略指南


返校过去六天的估算

steam游戏攻略指南

返校过去一年的估算

steam游戏攻略指南



为何2/24一下涨那么多,2/25却没有持续这个势头?
我是倾向认为请愿的情况太特殊了
上市第五天就遭到负评炸弹攻击
假设SteamSpy的机器学习把评论数和社群热度加入参数的话
得到的数据可能就会有很大的偏差
我个人比较认同[闲聊] 还愿购买人数估算这篇的估算

以下为回答内容:
其实这就跟以前常在游戏机版看到的战销量...浪费时间又蠢,厂商卖多少你又没买股票关你屁事
[g1208g:张小仙] 我说的是player every day那数据

steam游戏攻略指南


不过我这数据一定是很粗暴,而且高估游玩人数的数据,但也比百万销量合理不少XD
[hk12003:MatthewScarlet]player every day 指的是每天人数的最高峰数字,不是每天开这个游戏的人数吧。
[g1208g:张小仙] 干,被英文字骗了

steam游戏攻略指南


它就叫 "Steam Spy"、没毛病啊 XD
"SteamSpy Estimations"都写那么大了..
这个数据很清楚了, 峰值13943玩家是星期五之前的,然后就暴跌到现在只有3000多玩家,根本不符合后续越冲越快几天就百万销量的传闻,自欺欺人
帮忙离清解释一下下,我们讲的东西都是在一般正常增长下(也是以此为基准)结果有很高的可信度,这也是解释的初衷,这次还愿在环境变数下可能会有很大误差,无法相较而论
这次的事件,等同于是有人用作币程式去严重干扰了采样,采样已经被污染了.
关于统计学的部分,这篇说的是对的。但是我文章也有提到,在 2018 年 4 月之后,所有的 Steam 资料挖掘都已经被 Steam 给相当程度的阻挡起来了。
https://galyonk.in/whats-going-on-with-steam-spy-deed5d699233
我用回文的好了...等等...
你竟然出现了台湾新闻媒体有素质的错觉 LUL
台湾的媒体一直都是娱乐业阿ww
不会拉,其实对平常人来说其实只是心态改变而已,以不是特例来说,运作推算的手法其实都差不多,只是以前跟现在的来源不一样了,以前的准确度更高,跟现在用模拟的还是有差
对媒体方面表示部分认同,其实资料准确度有待商议,只是可信度高还是有报导的价值,不过像这次又特别是特例,觉得应该特别标示此资料仅供参考更符合媒体素养
三十万也是高估,因为这相当于平均一天超过4万套,可以参考去年的太吾绘卷,太吾第一周是每天4万套,还愿这速度已经超过太吾了(更别说100万的传闻)
可是你知道太吾那时候可是保持了两周全球热销榜的前三,而还愿现在已经连前50都没有,怎么可能销量会比得上太吾,更别说那个百万销量的远超太吾的情形了
实际还是等官方公告,但首周30万也有1.5亿了
智商问题吧 觉得别人完全死命相信一百万销量的人的智商堪虑
我也说了百万基本上很唬 大多数人基本上都只是觉得卖得不错替赤烛高兴
我讲白一点 你一直扯没中国没销量让我看了很不爽 所以你要不要回去那篇回应一下我的问题? 根本连问题都不敢回 只会一直跳针跳针
反正五毛中国仔就是这种水准 讲不赢跳针 换个串继续跳针 我也是笑笑 可悲
所以你的全球销量排行榜呢? 我的疑问你要不要回答一下 我看不爽你的就是一直捧中国外加跳针

steam游戏攻略指南


来 这张图片是你拍来说销量不好的 解释一下 为什么不敢拍上面的类型? 还敢说这是真正的全球排行榜啊?
[a2067931:桔梗麻雀™] 负评轰炸?
[hk12003:MatthewScarlet]也许有影响吧 不过看还愿其实炸了也顶多炸了9K左右
会影响Steam数据那么庞大吗w
[a2067931:桔梗麻雀™] 毕竟正常情况下评论数比起购买数实在不多,如果演算法包括评论数,就会很易出错
[hk12003:MatthewScarlet]也是有可能的推论 但我觉得其实30万这个数字可能差不多w 如果要看负评炸弹的影响可能要去查查之前Metro系列的走向涂了

内容来源于网络,本站整理。

转载注明出处:https://www.jiuwo123.com/youxi/steam/2024/0630/288446.html