Oops,好像这2款的得分也不太高,比较之下你更想要选哪一个

释放双眼,带上耳机,听听看~!
文:申思雨
来源于:心理测试与评定(ID:gh_391183cc6a43)

想像一下,你即将买一个新的手机上,在电子商务上检索以后,你锁住了2款价钱和特性都类似的H手机上和F手机上,他们唯一的差别取决于点评成绩和点评总数不一样,如下图(括弧中的数据为点评总数)。

Oops,好像这2款的得分也不太高,比较之下你更想要选哪一个呢?

选哪一个嘞?(单项选择题)

  • 自然是左侧的 H

  • 肯定是右侧的 F

这个问题看上去非常简单,绝大部分人都是会选 H,终究它的点评总数多,点评成绩也高些嘛 —— 但假如心理学专家对你说,实际上选 F 更可靠,你是否会觉得难以置信?

斯坦福学校的Derek等专家学者根据几百万的商品评论数据信息,应用贝叶斯算法对顾客的“科学研究”选购个人行为模型,得到了以上结果。

评价总数与点评成绩

线上上,大家针对产品的挑选和品质分辨,会大量取决于商品品牌、详细介绍,尤其是别的顾客的满意率——顾客点评的总数和点评的成绩。大家都喜爱评价多、得分高的产品,这一般代表着更强的品质和更优质的挑选。

但另一方面,很多科学研究确认了在经济发展管理决策中,当应对例如均值、样版尺寸等统计分析案件线索时,大家常常应用简单化的定性分析或全过程来做决定,最终造成并不“科学研究”的逻辑推理和管理决策误差。

这类根据得分盲目跟风管理决策的方法确实“科学研究”吗?从 Derek 的科学研究看来,点评有效,但你很有可能跟错风了。

评价多的品质就高?

学者从amazon上爬取了15,655,439条商品评论数据信息,对手机上及零配件、数码产品、养生美容及厨房用具4个类目的356,619种产品开展了剖析,并操纵了产品价格的差别。

科学研究应用核密度估计法(kernel density estimation),各自测算了这4类产品均值点评成绩(x,取值范围1~5)在不一样点评总数(n)上的条件概率。图2为4个商品类别的n值中P(x|n)的可能几率結果,横坐标为均值点评成绩x,纵坐标为点评总数n。

amazon点评数据的分析結果

如下图所示,点评成绩在不一样的点评总数中的遍布都主要表现出了一致性——在四种产品种类中,不管点评总数较多或是较少,她们的均值点评成绩的概率分布函数都相对性平稳。

换句话说,尽管大家判断力觉得好的产品会更火爆,但事实上点评成绩和点评总数中间的关联并不算太大,只是火爆度(即点评总数)并并不是合理的产品质量(即点评成绩)指标值。

反直觉?由于你忽视了点评总数对点评稳定性的危害

学者应用贝叶斯模型(Bayesian Model)对管理决策个人行为开展模型,用样本均值测算总体平均值,从点评数据信息中推论产品的品质。假设θ为整体商品评论的真值,线上点评为该整体的样版,根据样版中产品的均值点评成绩(x)和点评总数(n)或P(θ | x,n),可能商品评论的真值(θ,取值范围1~5)。

依据该统计模型,针对产品A(多点评总数)或是B(少点评总数)的挑选能够根据较为θA和θB的后验遍布推算出来,根据测算P(θA > θB | xA, nA, xB, nB),来明确哪一个产品很有可能会更高品质。图3为不一样评价量下A产品(点评量多)好于B产品(点评量少)的优点几率,横坐标为A产品得分,纵坐标为A产品更高品质的几率,不一样的线形表明A产品不一样的得分优点。

 

评价量多(下左图)和评价量少(下图)时A产品好于B产品的优点几率
 

实体模型结果显示,样本数越大,产品评价量越大,A产品的得分优点就越明显,大家越能相信結果的可靠性、越能证实产品质量的好或差;而当评价总数较较少时,成绩会更非常容易遭受极端化数据信息危害,产品质量的概率也就越不稳定。

因此 ,当点评较费力罗,该实体模型趋向于挑选点评总数较多的产品A(p(A优于B) > .50),当点评较弱时,该实体模型趋向于挑选点评总数较少的产品B(p(A优于B) < .50)。

换句话说,当某产品的点评高过平均时,点评的人越多,该产品的品质就越很有可能有确保;但当某产品的点评小于平均时,挑选点评总数少的产品是更优质的管理决策。

 

我们是判断力遗传学家——顾客具体管理决策试验

好了好了,我可以了解大伙儿对这一结果有建议,再如何,不选择 H 选 F 也太吓人了 —— 但最少,大家可以达到一个的共识,那便是不可以只看点评总数,是吧?

下面是这篇科学研究的另一部分,也很有意思:学者从Amazon Mechanical Turk (MTurk) 征募了138名成人开展试验。该试验包括25组趣味测试,每一组趣味测试都是会向被试展现2款不一样的手机上,让被试从这当中挑选一款。每一款手机上都是有一个均值点评成绩(从1星到5星)和总的点评总数;同一组趣味测试中2款产品的总点评总数相距125人上下(例如,高点评总数为150人,则低点评总数为25人)。

除开告知被试2款手机价格类似以外,沒有一切智能手机的详细信息叙述。被试每看一组产品,就必须对产品的选购意向开展六点的得分(1为更愿选购左边产品,6为更愿选购右边产品)。也就是文章逐渐让大伙儿做的趣味测试啦。

被试事实上是怎么选择的呢?她们的挑选和上一个科学研究的实体模型結果截然不同:总而言之,无论点评成绩是多少,被试都更钟爱点评总数多的产品,在25种不一样标准检测的21种中,大部分参加者都挑选了点评高些的产品(标记测试法,p < .01)。

挑选评价较多产品的被试占比
 

科学研究结果显示,被试喜好多点评总数产品的成见十分比较严重。

但实际上,当2个产品的点评都很低时,点评总数越多,数据信息越平稳,越能相信该产品的品质差;点评总数较少时,得分会大量的受极端化数据信息危害,比较之下这一产品反倒有高些的高品质概率。

例如,在均值得分为3.1的一对产品中,一个点评量为29,另一个点评量为154,统计模型表明,点评总数少的产品有60%的概率是更高品质的;但事实上,90%的被试却都挑选了评价总数大量的产品。

总结

尽管社会发展学习培训能够协助大家仔细观察他人的个人行为迅速做决定,但启迪误差(heuristics and biases)经常使我们在飞驰的全过程中踏入不正确的路轨,这类误差在涉及到数据的经济形势中尤其广泛。

因此 下一次再货比三家的情况下,了解如何选了吧?尽管,这只解决了千千万万管理决策误差的在其中一个,人脑也有许多系统漏洞,等候大家渐渐地发掘。

论文参考文献
Derek Powell & Melissa DeWolf(2017).The Love of Large Numbers: A Popularity Bias in Consumer Choice. Psychological Science 2017, Vol. 28(10) 1432–1442
 
批注:申思雨;编写:Emeria。文中转载微信公众平台:心理测试与评定(ID:gh_391183cc6a43),北京师范大学心理测试与评定试验室。关心前沿的心理测评核心理念与技术性,出示最科学研究的心理测试与评定服务项目。
排版设计:小鲸鱼  Bobby

创作者名:
申思雨

转截来源于:
心理测试与评定(ID:gh_391183cc6a43)

转截原文章标题:
怎样看透网购评论圈套?心理学专家教你一招

受权表明:
口头上受权转截

心理科普

情商高的女孩会有什么主要表现?

2021-1-11 0:00:00

心理科普

何不勇敢一点,开朗应对,做好自己想要做的人

2021-1-14 0:00:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索