电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

光环大数据培训_数据竟也会撒下弥天大谎

5页
  • 卖家[上传人]:gua****an
  • 文档编号:51373709
  • 上传时间:2018-08-13
  • 文档格式:DOCX
  • 文档大小:44.64KB
  • / 5 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、 光环大数据光环大数据-大数据培训知名品牌大数据培训知名品牌http:/ 光环大数据光环大数据 http:/光环大数据培训光环大数据培训_ _数据竟也会撒下弥天大谎数据竟也会撒下弥天大谎光环大数据培训机构光环大数据培训机构,前参议员乔治J米切尔(George J. Mitchell)提交 报告指出罗杰克莱门斯(Roger Clemens)等其他 80 多位美国职业棒球大联 盟(Major League Baseball)球员使用违禁药品以提高自己在球场上的表现。 与此同时,这位前赛扬奖(Cy Young)得奖投手继续为自己进行辩护以证清白。 在克莱门斯提交国会山立法者的证词中,还包括了一份由一家市场营销机构根 据统计数字所撰写的长篇累牍的报告,以求证实克莱门斯的无辜。但沃顿商学院的四位教授在 2 月 10 日出版的纽约时报(New York Times) 上联合撰文表达了另一种观点:统计分析的有效性只适用于其中的组成个体。 这一论点将会得到更多的重视,因为今天的机构和个人都试图在那些越来越庞 大、复杂和密集的信息量中获取意义。“现在,信息的消费者们都深陷数据之中,”沃顿商学院商业与公共

      2、政策教授 贾斯廷沃尔弗斯(Justin Wolfers)说。“对企业、工人、政府和其他活动 所进行的不断测量产生了大量的数据,并且存在众多的方法来从原始数据中得 出结论。遗憾的是大部分方法都引向了错误的方向。”他举例说,零售连锁商店可能会对其一段时间内的运营情况进行分析,并且发 现他们降低销售价格的时间段正好和整体销量下滑的时间段相一致。“那可能 会让这家连锁店得出结论说低价会导致销量的减少,”沃尔弗斯说。“但可能 存在真正的更深入的因果关系。在这家零售商计划提高价格以促进销量之前, 他们应该对其他因素进行分析,以明确在那段时间内整体需求是否受到其他因 素的影响。例如,也许该公司在滞销时期内正好在进行半年度的促销活动。如 果是这样的话,那是低销量导致了价格下滑,而不是价格降低导致了销量下滑。 ”沃尔弗斯称这正说明了将统计分析应用到商业、社会科学和其它领域所存在的 固有的关键性难点。“当研究者面对实验或自然科学数据时如医学隔 离和排除无关数据一般来说相比更容易,”他指出说,“在实验中,制药公司 可以随机将药物使用到一组实验对象上,并且将无效对照剂应用到另一组对象 上。如果研究人员在挑选药

      3、物的实验对象上遵循了随机的原则,那么他们可以 分别得出关于药物或无效对照剂效果的结论。”但要应用在商业环境并非那么容易。“在连锁商店的案例中,要孤立出其它种 种因素的影响更加困难,”沃尔弗斯说。关于销售价格的变化,“有必要考虑 天晴或下雨,或者天气炎热和寒冷等因素对销量和购物者行为的影响。”光环大数据光环大数据-大数据培训知名品牌大数据培训知名品牌http:/ 光环大数据光环大数据 http:/沃尔弗斯与沃顿的统计学教授谢恩延森(Shane Jensen)、亚伯拉罕怀纳 (Abraham Wyner),以及市场营销学教授埃里克布莱特劳(Eric Bradlow) 共同撰写了纽约时报上这篇关于罗杰克莱门斯案件的文章。文章的标题 为支持克莱门斯的报告对数据进行了精心挑选(Report Backing Clemens Chooses Its Facts Carefully)。亨德里克体育管理公司(Hendricks Sports Management)撰写了那份报告以支 持克莱门斯所宣称的未使用任何类固醇药物。但在纽约时报的文章中,学 者们对该公司所采用的方法提出了质疑。“在这份克莱门斯的报

      4、告中,他们企 图将克莱门斯与在 1993 年 46 岁时退役的诺兰莱恩(Nolan Ryan)进行对比, 以将这件事情化解。”作者们写道。“在这份对比中,克莱门斯的行为看起来 没什么不一样:两者都在他们 40 多岁时收获了巨大的成功。但是如果将克莱门 斯与另外两位同时代的投手蓝迪詹森(Randy Johnson)和科特席林(Curt Schilling)相比,也可以得出同样的结论。”沃顿商学院的研究人员们称那些对比并不完全。“报告仅仅将克莱门斯与那些 在职业生涯第二阶段获得成功的投手相比较,而不是与那些同克莱门斯一样在 最初就取得成功的所有投手相比较。通过这个方法,报告人为地缩小了克莱门 斯的数字会显得不正常的机率,”他们写道,“统计学家将这个问题称为选 择偏向。”沃顿商学院的研究者们认为,正如零售商需要在一个价格对比分析中考虑其他 选择因素对销售的影响一样,克莱门斯的表现也应该同“所有职业生涯持久的 投手”进行对比。如果进行那个对比,克莱门斯在“事业第二春的表现就显得 不同寻常了”,他们写道。大部分投手在他们职业生涯的早期的球场技艺会稳 步得到提高,并且在 30 岁达到高峰,之后表现

      5、会缓慢下滑。相反,克莱门斯的 职业生涯在他 20 来岁后期就开始下滑,并且之后在他 40 多岁中期时得到了提 高。沃顿商学院的研究者们指出,“雇佣统计学家”们倾向于选择那些会对自己客 户有利的对比对象 。但如果分析结果不服务于任何特定观点时,统计分析会得 到如何的使用呢?金融分析、计量经济学、审计、生产和运营是其中的几个领 域。在这些领域,各利益方寻找无偏置的数据,以能够在面对不确定性时做出 正确的决策。可口可乐和共同基金可口可乐和共同基金喝可口可乐就能减肥吗?这也是一场法律诉讼的中心问题。这场集体诉讼案所 针对的是可口可乐公司生产的含咖啡因的绿茶饮料 Enviga 的广告宣传。向新泽 西州卡姆登联邦地方法院(U.S. District Court)所提出的诉讼中称,Enviga 的广告宣传说“该产品能够燃烧的热量超过了饮料本身所含有的热量,从而能 够减少人体热量”。光环大数据光环大数据-大数据培训知名品牌大数据培训知名品牌http:/ 光环大数据光环大数据 http:/诉状称可口可乐所宣称的内容是基于“一份小型的短期研究的摘要,这次研究 由可口可乐公司提供资金”。诉讼文件称该次临床研

      6、究的对象是相对偏瘦 的个体,并且他们的平均体重指数(Body Mass Index,BMI)为 22,但“绝大 部分美国人都偏重或者肥胖,”他们的 BMI 达到了 25 甚至更高,他们很可能无 法通过使用 Enviga 来达到减肥的效果。但可口可乐的发言人称公司的研究和其 结果都是有效的。另一个在统计方面颇具争议的案例是三月份华尔街日报(Wall Street Journal)上关于德莱弗斯基金(Dreyfus Funds)的广告。北卡罗来纳州三角 研究中心(Research Triangle)的独立统计顾问,也是美国统计协会 (American Statistical Association)成员的大卫彼得斯(David Peterson)说,广告宣传该公司中期收益基金(Intermediate Term Income Fund)在晨星(Morningstar)的评级中获得了四星。“广告中小心地指出过去的业绩并不代表未来,却没有指出德莱弗斯基金旗下 至少有 19 支共同基金,”彼得斯说。“即使这 19 支基金本质上并没有任何不 一般的地方,其中最好的一支很可能一直都表现优秀。同样,最

      7、差的一支 在广告中并未提到一般也会表现很差。”他说,如果采用同样的原则考虑问题,那么制药公司“可以就新药的效果进行 10 次独立的不相干的测试,然后仅仅使用最有效的那一次实验结果来进行广告 宣传。”不信任与错误表达不信任与错误表达沃顿商学院的延森教授说,在所有研究中,产生非故意误差的机率同样也引人 担忧。“即使所选择的样本非常优秀,但也可能会产生令人误解的结果,”他指出。 “一个常见的问题就是数据挖掘。如果说分析一个大数据组的时间足够长,他 们就肯定可以找到某些变量在统计学上具有的显著效应,或者不同变量组之间 的差别。 ”但他说,遗憾的是,研究者们经常只是简单地报告他们个别显著的 发现,而没有提到“在他们得到那个结果之前进行了许多次效应不显著的试验” 。延森认为,“对整个试验流程进行适当的报告是有必要的,以保证各种类型的 试验结果都得到了表达。”但至少有两股力量经常对效应分析产生负面影响。 “第一就是对统计分析的不信任,第二就是在学院派统计学家和实践者之间缺 乏对话。”延森说。实际上,“我曾阅读了众多在医药、经济和社会科学领域 的研究, 如果他们能够与统计学家就所收集数据的分析,以及数

      8、据收集本身进 行更多的探讨,这些研究就能够从中受益。”光环大数据光环大数据-大数据培训知名品牌大数据培训知名品牌http:/ 光环大数据光环大数据 http:/布莱特劳同样对统计结果的阐述表达了担忧。“我经常告诉自己的学生说以数 据为驱动的解决方案不一定能告诉你正确的答案。相反,他们能够告诉你可以 排除哪些(答案),因为数据无法支持那些答案。”统计分析的真正价值在于 能帮助使用者正确地辨别不确定性而不是“最佳猜测”,以了解哪些结果具有 统计显著性,并且能就特定的假设情况给出答案。“关键问题就在于代表性,”他说。他再次回到关于罗杰克莱门斯的研究。 “研究者们和使用者们应该关心数据是如何取得的,这些数据是否是通过随机 抽样获得。如果不是,那么就应该小心其研究结论了。”布莱特劳认为即使研究人员没有任何预谋,也应该对其研究结果持谨慎态度。 “在 20 世纪 90 年代末期,我们在一个具有 20 年历史的公墓收集人口数据。数 据显示相比于埋葬在该公墓内多年的人,那些埋葬时间较晚(即越靠近研究时 间)的人平均死亡年龄较小,” 布莱特劳说。他将研究结果写入了一篇为机 率杂志(Chance)所撰写的文

      9、章:异象选择谈(A Selection of Selection Anomalies)。“数据很容易让人得出结论说年轻人的死亡率已经提高,但这个结论并不正确。 ”相反,他指出,如果对该研究中的数据进行分析,就会发现在公墓内所葬人 群的样本必定会更多地包括那些较年轻死亡的人,这只是因为他们的出生日期 更靠近调查日期,而死亡年龄只是参数之一。沃尔弗斯认为要减少统计学上的错误使用,关键在于直觉的合理性,或者对研 究者所使用的方法以及对各种力量之间的相互影响的了解。“重要的是了解在 不同变量之后的驱动因素,”他说,“只有在了解这些之后,研究者才能更好 地理解和建立因果关系。”延森举了另外一个例子。“我正在参与一个为美国职业棒球大联盟外野手的守 备能力建立模型的研究。研究中的一种假设是说如果球被击到他们身后的话, 外野手的守备会更加困难,因为这样他们必须倒退地奔跑,而如果球被击到他 们前方的话,他们只需要向前奔跑,这样会相比更加容易。”但是研究结果与所假设的情况相反:在任何给定距离下,外野手倒退奔跑能接 住更多的球。“这个结果看上去完全违背我们的直觉,”延森说。“但如果考 虑到滞空时间(即球在空中停留的时间)你就会觉得合理了。因为球被击打得 更远,那么它在空中停留的时间就会越长,这样外野手就会有更多的时间来接 球,即使球被击打到他们的身后。这是一个很有意思的案例,因为案例中数据 清楚地表明了我们之前推理所存在的缺点。”大数据时代大数据时代,数据分析师数据分析师,数据挖掘

      《光环大数据培训_数据竟也会撒下弥天大谎》由会员gua****an分享,可在线阅读,更多相关《光环大数据培训_数据竟也会撒下弥天大谎》请在金锄头文库上搜索。

      点击阅读更多内容
    TA的资源
    点击查看更多
    最新标签
    监控施工 信息化课堂中的合作学习结业作业七年级语文 发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.