您所在位置：网站首页 > 办公文档 > 其它办公文档 > 智商测试是伪科学吗？

智商测试是伪科学吗？.docx

8页

卖家[上传人]：ss****gk

文档编号：236508828

上传时间：2022-01-07

文档格式：DOCX

文档大小：253.28KB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10金贝

下载

/ 8 举报版权申诉马上下载

文本预览

下载提示

常见问题

智商测试是伪科学吗?"智商” （Intelligence Quotient或IQ ）是一项被设计用来衡量心理能力的测试,但事实上, 它只能测量低智力（学习困难）人群的能力和一般人的考试技巧智力测试起初是为学习障碍者而设计的,但因为低智力人群其实不那么需要这样的测试（详见下文的论证），导致实际上最后只有一些喜欢考试的人和一些想逃避现实生活的人热衷于 IQ测试01.从数学角度看，IQ测试是不科学的IQ测试在数学上的性质非常糟糕（在长尾分布［1］下衡量相关性会带来严重缺陷，它没有正确处理维度，将本质是复杂系统的思维简单地看成一项测试分数）IQ测试还可能被种族主义者/优生学家利用：他们可能会利用IQ测试来证明某些人种的智力比别的人种低下IQ测试通常只能解释人群在某些任务表现上2%到13%的差异（参考下文关于0.5相关性的解读），然而这些任务往往本身就和IQ测试很相似某些所谓的心理测量学者们仍然向不明就里的军队和企业等机构推销着这一“心理学中最准确的量表"如果我们考虑心理学家们在做研究时对数据的操控的话，这一解释差异的百分比其至还要再打折扣智力测试甚至不满足两项量表应该满足的最基本性质：单调性和传递性［2］。

一项在百分之八十到九十五的情况下都不准确的测试不应该被认为是“科学啲图1：本图在假设分布不为长尾的情况下说明了智力测试的第一个缺陷：相关性在分布不对称时没有意义令y轴代表被试在某实际任务小的表现我们在x轴上建立一个假想IQ 测试的得分obmm ami2i06»7S44 0 6400W 0114472•・ _・ •0M78080&224«10.46101 o 464NKMSr当被试在这一实际任务上得分为负值（也就是较低）时，假想IQ测试的得分和任务得分有100%的相关性；但当被试在这一实际任务上得分为正值（也就是较高）时，IQ测试和任务得分间完全没有相关性然后我们逐渐对两者间的相关性加入均值为零的误差来模拟实际中的情况，于是我们可以看到在图上，任务取正值的部位出现了本不应存在的相关性这一问题在智力因子作为主成分而分析得出结论时尤其严重我们可以看到IQ和SAT （美国大学入学考试）分数的相关性就表现出了类似的形式实际上大部分任务和IQ测试之间的“相关性"都和这一缺陷有关200 400 600 800 1000 1200 1400 1600SAT scores (verbal ♦ quantitative)IQ 与 SAT 分数的相关性 I Frey and Detterman, 2004问答题：你在10,000个人中测量IQ测试和他们在某项任务上表现的相关性，在这10,000 人中有2,000人是死人。

死人在IQ测试上得分为0,在任务表现上得分也为0 o在其余活人中，IQ测试和任务表现没有相关性那么，IQ和任务表现的伪相关会是多少？答案：37.5%这一偏差的本质在于，如果一个人的脑子被车撞坏了的话，那他显然在所有事情上的表现都会很差，任何可以用来识别能力低下人群的测试在这里都可以测量出这一点但没有什么对等的因素可以让一个人在所有事情上的表现都变得很好因此，实际上所有的能力测试都会和IQ有一定的正相关，即使它们之间完全没有关系实际上，如果某一能力测试和IQ之间的相关性很低的话，这说明两者间可能是负相关的02.IQ测试的是什么？数学推导：假设最具有代表性的情形，X、Y属于均匀分布［0,1］p为活着的占比，l・p为死亡的占比（代表临床上的智力极度低下）这说明了 IQ和任务表现间的相关只是因为这些指标在能力极度低的人群中必定存在相关性，但在能力较高的人群中并不一定IQ和现实生活中（例如“财富''）的一些指标没有任何统计上显著的相关性研究人员宣称的一些和IQ相关的“成就''往往也只是一种循环论证这些“成就"往往指的都是学业或者官僚系统小的成功而这不过是因为这两者本身高度的结构性及规律性和IQ测试有很大的重合罢了。

财富可能不是成功的唯一代表，但它是唯一能被量化的现实生活中和成功较为有关的指标还有人认为IQ测量的是心理能力，例如“智慧”、“耐心”、“决策”之类的等等特质实际上，IQ测试的东西和心理能力也完全无关如果我们想测量一个人在某项任务上的表现怎么样，比如说他的网球打得多好、有多擅长线性代数，我们只需要让他打打网球、做做数学题目来看看就可以了我们不需要一 •个理论上的测验来测量现实生活中的表现交易员们马上就能理解这点：“模拟''出来的交易策略在现实中往往不起作用人们在面对一些古怪的图片测试题时的反应和他们在现实生活中的表现并没有什么关系°03.IQ测试只是为极端低收入者而设计的除去分布极端值以后，IQ和财富间的相关性为零，数据包含的几乎全是误差（噪音）IQ和45,000以上的收入之间没有相关性即使是在有相关性的情形、低IQ或者低收入的人群中，噪音也非常的大这说明IQ只是为极端低收入者而设计的230,000 : 1■• •$80.0(MIIQSIMJMMI• ♦ •… •• • M• •siso.aoo • . • •$230,000SI 80.000$130.00(1$80,000$30,000SCO.OOO)750LIUZagorsky (2007)研穽如果IQ是被刻意设计成正态分布（几乎的确是这种情形），而现实生活中表现的分布实际上是长尾的话（的确是），那么IQ和表现间的相关要么不存在，要么并不具有意义。

在样本中我们也许可以发现之间的相关性，但在统计学上，这一相关实际上并不存在因此 IQ测试对表现的预测力被高估了04.但同时，IQ测试有严重缺陷的相关性IQ测试中得出的智力是由心理学家们用类似“模拟交易"的方法构造岀来的而这一测试的基础是我刚才解释的，有严重缺陷的相关性IQ和极端低的表现确实有相关（实际上它一开始也是被设计为用来识别学习障碍人群的）, 但在表现极端低的人群中几乎所有测试都会相关一项只在分布左端（较低一端）有预测力, 但在分布右端（较高一端）没有预测力的测试显然有问题我们自从著名的Terman纵向硏究［3］起就一直观察到这样的结果，即使之后研究的数据可能已经被操控过了耍说明这一点，我们可以考虑如下的情形：某人有严重的心理能力障碍，那么显然他的IQ 分数和表现会有100%的相关，但这一相关性在没有心理能力障碍的人群中不会出现c心理学家们忽略了这一非线性关系，而错误的认为这一相关性存在（我们可以说，一个IQ 只有70的人没法证明数学定理，这说明了 1Q在识别能力障碍人群上是有意义的，但研究结果并没有说明IQ得分150的人更有可能从事脑力工作）IQ并不能测量大脑的“硬件''。

它也许可以在实验室中测量某种可能有意义的心理能力但如果我们想用IQ来了解一个人未来会如何发展的话，我们需要知道他在未来可以发挥作用的心理能力但缺乏预测力的IQ测试显然无法测出这一能力05.在学术圈中，现实生活和学术圈的问题没有差别；但在现实生活中，两者显然不同当某人在现实生活中问你一个问题的时候，你肯定首先会想：“为什么他要问我这个？"这会让你把部分的注意力从问题分散到问题的语境上哲学家们早就发现了这一点例如说，有一个数列｛1, 2, 3, 4, x｝，问x应该是什么？只有完全不懂归纳法的人会认为5是唯一的答案（哲学小的Goodman问题对此有讨论）我们也可以应用维特根斯坦的“遵循规则"问题这一问题称，对于任一有限的数列，有无限个函数可以拟合这一数列这些认为只能是5的人不仅是不懂归纳法，他们还得循规蹈矩到只会用一种方式思考现实生活中不存在有确定回答的问题（大部分的现实问题都没有答案）只有某些特定的人会把口己的脑子浪费在考试问题上而有些人只会把口己的脑力专注在现实的，而不是教科书里的问题上智力测试无法判断哪些错误有代表性地说明了一个人的真实水平，哪些错误只是随机的偏差这一-点和机器学习中的“偏差■方差权衡"[4]类似——你需要犯很多无关紧要的小错误来避免有严重后果的大错误。

在现实生活中生存需要我们的一些心理偏差，而这些心理偏差会让我们犯一些小错误，但却对我们是有益的06.IQ测试的其他问题被随机性误导：发现一些表面规律的能力并不是什么有用的东西有些心理学家回复我的文章说：1Q测量的是识别规律的能力，这在现代社会中非常重要完全不对，能够在规律明显的时候识别出规律，不明显时懂得忽略它们，才是有用的能力不考虑对数据的操纵以及相关性的缺陷50%的相关性意味着两者间的相关只比随机选择好了 13%0such a variety of jobs.工作能力与IQ的相关性I来吕昭当不严谨的Intelligence: All That Matters by S Ritchie注意噪音的大小：得分最高的百分之25的门卫比得分最低的百分之25的大学教授得分还要高即使我们考虑到IQ测试的循环逻辑：医生的SAT分数较高，而SAT的题目和智力测试又有重叠，然而医生群体的智力和门卫群体的智力测试得分仍有很大重合额外方差：不像对财富和身高的测量，许多人做同一 IQ测试多次可以得到非常不同的结果，最高可以到两个标准差，这甚至比人群中的抽样误差还高！这一巨大的误差说明了作为一个个体，你本身测试的不确定性甚至可能超过了人群中确定的多样性！研究偏差：心理学研究发现医生和学术工作者的IQ更高（虽然其中的噪音占比很大），但这仅仅说明为了成为医生和学术工作者，他们需要擠•长和IQ测试类似的学校考试。

这会使得我们观测到的这两个群体的IQ均值偏大，方差却偏小员工”商：如果你把IQ命名为“员工商”，那么它测量的东西可能会更有价值一点IQ测量的不过是你有多攢长做一个只会执行简单任务的奴隶罢了备注：[1] 长尾分布指的是，在人群中有许多极端值，使得分布图往一端或两端延长的情况[2] 单调性指的是，如果B在IQ测试上得分比A高，那么B的实际智力一定比A高; 传递性指的是，如果B在IQ测试上得分比A高，而C的得分又比B高，那么C的实际智力一定也比A高[3] 20世纪二十年代，美国心理学家特曼L.M.Terman进行了一项大规模的研究实验，他通过智力测试将智商大于等于140分的孩子划分为天才，并以此为标准筛选出了一千二百名 “天才儿童”随后，美国政府负责为这群孩子提供最前瞻的教育资源、最优质的师资，并对他们精心培养，人们期待着从这1200位孩子中产生牛顿、爱因斯坦、霍金一般的伟大科学家五六十年后的今天，人们依旧可以追踪到的其中800多名“神童,啲现状经调查发现, 他们中的大多数人也并没有成为科学家，而那些被世俗定义为“成功''的人，反而都是具有坚强的意志品质和良好人格特征的人[4] 参数估计偏差(系统性误差)小的预测模型方差(随机误差)较大；而偏差大的预测模型方差较小。

硏究显示，现今有超过600万的中国成年人在一生中可能患上社交焦虑障碍(Huang et al., 2019)o临床心理学领域对社交焦虑进行了大量的研究，在针对社交焦虑的诸多干预方法中, 认知行为疗法(Cognitive Behavioral Therapy, CBT)的疗效最为显著。

点击阅读更多内容