21年对外经济贸易大学432统计学10月主题答疑直播课

饮霜 · 发表于 2020-11-30 18:06:22

好的，我们现在开始。这一次是咱们10月份的红宝书的答疑的大一的课程，然后今天咱们是两个内容，第一个是对一些重点章节进行知识点的梳理，咱们在梳理的过程中把可能考到的题型也是给大家说一下。第二项就是红宝书中，咱们也是在群里经常出现的同学们提问的比较高频的问题，在这里统一给大家做一下答复和和详细的解答。

首先第一项，因为咱们之前是应该是8月份的答疑，给大家说了一些非重点章节的知识点的梳理，咱们通过思维导图的形式，那么这次咱们还是这样把剩下几个重点章节项参数估计假设检验，房价分析，还有后面线性回归，这几个章节给大家说一下。首先咱们来看参数估计这一章的参与国际这一章，它可能考察的题型非常的广泛，首先明确一下他的概念这一块，他不可能说单独去考你，可能是和假设检验混在一起，一个简答题的形式去问你这两个它们之间是有什么样的区别和联系，那么在介绍参数估计假设检验的区别和联系之前，你要首先介绍一下两者的概念，所以这里是可能出的一个方向。

好，下面这个测试估计它是包括点估计和区间估计的，从考评来看点估计基本上有同学听不到是吗？你可以退出，然后重进一下试一下。其他可以听，其他同学可以听见吗？可以听到吗？好，可以，那个同学你就退出，再重进一下，再试一下。

参数估计它是分成点估计和区间估计的，但是点估计这一块基本上基本上都是提不到的，咱们也就是经常考到区间，估计这个首先明明确它的概念和基本原理，区间估计一般是在计算中考的比较多。还有这里就重点的是这些水平，还有置信区间的理解和解释，这个是这个是会考到咱们名词解释或者是在简答题里面的，声音断断续续的，怎么回事？咱们继续说评价估计量的标准，这三个是非常高频的考察点，而且就历年考过很多次，对于评估评价估计量的标准无偏性、有效性和一致性，这个的话如果考到你不可能直接就是写一下它的概念，这里最好是要写完概念之后，咱们画一个图来表示，具体的咱们课本上也有，这也就是这个点其实还挺简单的，主要就是考察咱们答题的时候一个完整度完整性，尽量能写的都写上去，把图也画上去，图画完图之后写下相应的注释就可以了。这样子。

然后参数估计还是分成两个方面，一个是一个单个总体参数的区间估计，还有两个总体参数区间估计，现在也是需要大家多掌握一些两个总体参数群，估计这个可能会以后考的越来越多。然后这里还有个样本量的确定，一个是会考计算题，直接让你去计算一个合适的样本量，咱们通过要公示估计误差的公式，e等于n乘上我就不再说了，然后通过那个公式来计算这个样本量，要么它可能会通过可能会考察你简答题就怎么在参数估计中，在样本上的确定中需要注意哪些问题，或者说怎么去确定一个合适的样本量，这个时候需要大家解答。是这样子两个考察的方向。

参数估计这一章基本上是这样子，主要的重点还是放在计算题上。关于在这里的计算题上的话，可能同学会担心计算量，计算量的大小，还有有些开根号的还不太好算，这个没有关系，咱们在考试的时候，这卷子上的题目，它最后面会给你一些备选的一些开根号它直接的答案，或者说是正态分布，障碍分布函数，发函数它的一个他的最终的结果，我们直接用考卷上给的结果去做，就带入这个数进去就可以了。不用咱们去手动开根号，这样子。

然后这一章差不多就这些，然后咱们看下一个假设检验，假设检验还是比较庞杂的一个体系，也是最重我觉得是最重点的一章了，他考察的可能考察方面非常广泛，首先咱们明确一下假设检验的一些基本问题。

一个来看，首先一个假设问题的提出，原假设和备择假设，首先明确它是什么？它是什么，然后具体怎么去选择，怎么去设定原假设被则假设，这是这里是一个难点，特别是在单侧检验里面，我们怎么去设定原假设备择假设有这么几个原则，首先原假设它是一个原有的传统的观点，那么我们一般把这个问题的现状放在原假设上，而把我们要去验证的问题，一个新的观点，希望去希望用事实去推翻原假设的时候，我们这些东西是放在备择假设上，这里也是之前有很多同学会问的，在群里会提问，就有些看到有些答案他设定的人假设和备择假设跟我们想的不一样，这时候你就要想一想，你就要想想这个问题他想要证明的是什么？

一般来说我们说想要证明的东西都是放在备择假设上的，这一个我们用这个想法去设定原假设和备择假设一般不会出问题，就是你把你想要验证的东西放在被自驾车上，还有就是说一个问题，它本身现状是什么，但是呢本身我们希望它是什么，但是现在样本出来的结果，他不是我们之前想的那样，这个时候要么出现这个结果，它是一个新的限薪的问题，对不对？它就是一些新的问题，这个时候我们就把新的问题给它放在杯子假设上，这是一般来说设定原假设和备择假设的一个原则，这个原则他可能会这个是在计算的过程中做计算题的时候，是我们设定假设的原则，还有他可能会直接问你，以简答题的形式问你，我们在设定假设的过程中需要注意哪些，或者说原假设被择假设究竟该如何设定，它可能会直接这样问你。所以说这样两个可能考察的方向。

然后下面是两类错误，两类错误就是一个阿尔法错误，一个贝塔错误，这个阿尔法错误它是器征错误，是原假设为真，但是我们却把它拒绝的所犯的错误，贝塔错误它是相反的。你假设他是假的，但是我们却没有将其拒绝，是这样子两个错误。

这里首先要明确他的明确它的概念，就是我刚刚介绍的两个错误，它分别是什么，这里可能会考察你简答题对不对？考查简答题。或者说是名词解释，直接让你去解释，假设检验中的两类错误是什么？还有就是一个新的考察点，是去年第一次出现，直接让你去计算这两类错误，持续计算计算阿尔法错误被他错误，那这种题型咱们红宝书里是放的是有的。

这个提醒咱们也有很多同学会问咱们红宝书上一个题，等一下我也会把这个题再给大家再详细的说一下。因为问的人确实挺多的，我在全程班的时候也是讲过，是讲过这个题，然后服务的去把它当做一个重点细节去讲。这两类错误的计算需要大家尤为注意，以后也会我预测了就是说今年的话可能还会再去考察，当然他是考察一个大的计算题，还是说好，现在可以听到吗？可能我这边网速不太好。

现在可以听到吗？天哪。有声音了是吗？不好意思同学，我们这边可能网速不太好。刚才是哪个地方应该听到了？假设检验的原则，这里其实再说一下，原则是首先要控制犯第一类错误的概率，然后在严格去控制第一类错误的概率条件下，再尽量去控制第二类错误的概率。好的，我现在换了我自己的移动数据，咱们继续。好，刚才说到刚才说了假设检验的原则，首先要控制犯第一类错误的概率，然后再严格控制第一类错误概率条件下，去尽量控制第二类错误的概率，这个原则是可能去直接问你解答题怎么去假设讲的原则是什么，就两类错误该怎么去取舍，该怎么去选择这样子，还有可能他直接问你，我们为什么要去首先控制犯第一类错误的概率，这时候我们打的就是后面这两点，因为要遵循一个统一的原则，大家都遵循一个统一的原则。

第二个就是原假设它是什么，通常是比较明确的，但是被子假设是什么？却常常是很模糊的，因为如果说我们放在尽量去控制犯第一类错误的概率的话，我们拒绝原假设就可以去直接证明我们的杯子假设。但如果说我们反着说，就把它这个位置反着设的话，就没有办法说很得到一个非常明确的这样一个结论了，是这样子，就是两个要打的话就这两个原因。然后整个假设前的流程的话，整个流程我们是我已经声音调到最大了。现在声音大家感觉大小可以吗？可以。

咱们继续。然后整个假设检验的流程的话，一个是我们在好，一个是咱们在做题的时候，整个流程首先你要设定原假设备择假设，然后第二步就是要选择一个检验统计量，再接着就把减速箱的值给它算出来了，算出来之后我们要选择一个临界值进行统计决策，所以整个流程的话你一定要非常的清晰，要体现出每一步是什么？在统计决策这里是有两种，我们是有两种决策的方式，一种是用拒绝域的形式看着桶匠是不是落入距决狱。

第二种就是我们用细致进行决策。这里咱们具体类型决策的时候很简单，就跟临界值进行比较就可以了，不管是双侧检验还是单侧检验，只要和这临界值比就行了。

第二个是长期指按期执行决策的时候，咱们之前有同学问过这个问题，在单侧检验中，单侧检验咱们是p和阿尔法比，双侧检验是不是p和2/2法比，因为我之前有同学这样问，咱们其实就只要遵循一个统一的原则就可以了，就拿p和r法比就可以了。因为咱们即使在双侧检验里面，你的阿尔法是我们的拒绝率是在两边，两边的概率各占二分之阿尔法，对不对？但是我们在双侧检验中，你计算p值的时候，你在双侧检验计算p值的时候也是算两边的两边的概率，这个时候其实是一样的，咱们都是拿p和阿尔法比就行了。只要拿p和阿尔法去进行比较，如果说p一小于阿尔法，这个时候就是拒绝原假设。

好，基本上这样，然后下面双侧检，单侧检验的话刚才也都说过了，主要就是考察咱们方向的就被原假设和备择假设的设定，在单侧检验里面就是一个方向的问题，就是这个方向。他是做单侧还是U单侧？好，这个是假设检验的基本问题，它具体再来分分成一个总体参数的检验，还有两个总体参数的检验。一个总体参数的检验的话，咱们是分成总体均值，还有总体比例以及总体方差，这几个总体均值考的是最多的，考的是最多的，现在也会相应的去考察一些，可能总体比例和总体方差，这个都需要大家掌握。

总体均值这里的话，首先我们要分成大样本小样本，看他是大样本的话，我们是都可以选择。书上是这样，但咱们在实际做题的时候，其实直接拿p和阿尔法比就行了。好吧？因为咱们在实际做题的时候，那批纸都是算双侧的，所以拿批和阿尔法比就可以。然后大样本这里，我们说只要是大样本就可以选择自己统计量，对不对？就可以选择标准正态统计量。

这里还要分西西格玛分西塔已知和西塔位置的情况，如果是西塔位置还是那就用样本方差s方去代替总体方差c个模方就可以。然后这里批制决策也是拿这个批和阿尔法比较，这都知道了小样本的情况下，我们就是说怎么去确定一个小样本，如果说n小于30，咱们就算是一个小样本，就算是小样本，这里小样本的这样一个正态总体，小样本正态总体这时候我们选择选择看它是西格玛已知还是西格玛未知，如果说西格玛已知，我们可以选择选择这个标准正态统计，选择z统计量对不对？

如果说一个小样本正态总体，但是西格玛位置这个时候我们就不能用 z统计量了，这个时候我们就要用t统计量，还要注意 t统计量它的自由度是n-1，不是n是n减一，好吧？这个需要大家注意。

在总体比例的检验的时候，大家要注意假定的条件，就是我们假定总体它是服从二项分布的，它是服从二项分布的，这个是一个非常重要的假定条件，这个条件也是可能会是一个隐性条件，需要我们自己去理解提议的二项分布，这样也是可能是一个隐性条件。这个样本比它是近似服从。当n充分大的时候，我们也是由中心极限定理可以让它近似服从正态分布。它的均值就是拍，它的方差是n分之拍成一减拍，这要注意一下，然后总体方差的检验是服从一个卡方分布，卡方分布它的自由度，这里自注意一下自由度是n减1，这里卡方卡方统计量，然后它的卡服从这个卡方分布，它的自由度是n减一。

好，这个是一个总体参数，如果说两个总体参数，现在这一块两个总体参数的检验是考察的应该是会越来越高频的，因为简单的考完了都考都考得没有什么新意了，咱们就要慢慢的难度就要上去，就要考一些比较难的，可能以后就越来越多的会考察，就有两个总体参数的检验，两个总体参数考察比较多，两个总体均值之差，两个总体均值之差。

这里的话我们是这里我可能列的不太全，一个是独立样本，一个是匹配样本。去年是考察了一个匹配样本的题，这也是给大家一个信号，要注意一下匹配样本，两总体参数，两两个均值之差的匹配，样本的检验，加做一下匹配样本，然后对于一个独立样本的话，我们要看我们要看它西格玛方，它西格玛方是不是已知的？

西格玛一西格玛二已知我们就看它是一个正态的，还是说还是一个分布位置的情况，但如果说分布位置，但是它又是一个大样本，这个时候我们其实是可以可以使用z统计量的，但是如果说已经知道它是一个正态，总体这个时候就不管它是大样本还是小样本，我们都使用z统计量是这样子。就是西格玛方已知的情况，如果说两个样本的西格玛方，我们两个总体西格玛方我们是未知的，是未知的，这个时候我们要看它是两个是相等还是不等，就看西格玛一和西格玛二是相等还是不等，如果说它俩相等的话，它俩相等，就我们虽然位置，但是又已知它相等，它具体值不知道，但我们知道它俩是相等的，这个时候要计算一个合并估计量，就是这个sw这个是合并估计量，这时候我们使用的是t统计量，它的自由度注意一下是 n1+n2再-2，这次要多注意一下。

然后如果说我们没有办法，就是要么是已知它西格玛一和西格玛二，西格玛二是不等的，或者说我们现在没有办法判断，没有办法判断，这个时候我们要这时候我们使用还是使用t统计量，但这个时候t统计量零，它的 t服从 t分布，它的自由度是v这个v是咱们有单独的公式去算的，这个公式就需要大家去记，所以这一块需要大家记两个比较复杂的公式，一个是sw合并估计量，还有咱们 t统计量的t分布自由度v这两个式子比较复杂，需要大家单独去好好去记它，不要记混了，不要记错这样子。

好，这是两个总体均值之差的检验，如果说这两个总体比例之差，两个总体比例之差，它也是要分情况，也是要分情况。他分情况就是我们要看这个是要检验两个总体比例相等，还是说检验两个总体比例之差不为0？这个需要注意，以前也有同学问过，如果说拍1减拍2=0和拍1-拍2就小于=0这种，假设它是一个单侧检验，它是个单侧检验，这个时候它到底算是检验总体比例相等，还是总体比例之差不为0？这个需要给大家再强调一下，只要咱们是和0比的，不管是等于0还是大于等于0还是小于等于0，咱们都把它看作是检验两个总体比例相等的假设，都是把它放在这个里面的，零只要和零比，咱们都是放在这里，都要去计算一个合并的比例，估计上批。

其余的其余的如果说是一个证明，就是拍一剪拍二它等于d d是一个 d是一个另外一张一个不为0的数值，咱们都放在第二项，放在第二项这种情况去检验。好吧？确实问的比较多，只要是和0比，咱们都把它看作是第一种这样子。

好，下面就是对检验结果的解释，检验结果解释这一块非常容易去考简答题，非常容易考简答题，就可能去问你怎么是怎么对一个问法是怎么对检验结果进行解释，怎么对假设检验结果进行解释。还有就是我们拒绝原假设代表着什么？或者说就不能拒绝假设又代表什么，这样可能也是一种问法。还有说这里因为拒绝原假设，不能拒绝原假设，这里其实可能会出现很多很多其他的一种说法，其他错误的说法，所以这里是有可能去考你判断题的，可能去考判断题，比如说我们就是拒绝原假设，是不是原假设就一定是错的，他各种错误的说法都给你放在里面，让你去判断是对还是错，这里是很有可能去考一个判断题的。

再强调一下，这里就需要注意几个点。我们说拒绝原假设只能说明原假设不正确的概率比较大，但是我们不能说原假设就一定是错的。好吧，如果说不能拒绝原假设，只能说我们没有足够理由去拒绝原假设，那就不能确定不能确定杯子，假设它就一定是错的。我们只是说不能拒绝原假设，也不能说接受原假设。

好吧？在这里有很多很多很迷惑性的说法，大家都注意一下，一绝对要以课本上这个表述为主，出现任何一个有歧义的表述，它都可能是去迷惑你的这样一个判断题。我们当然自己在做题的时候，你自己在做计算题的时候，最后要去写做计算题的时候你最后要去写结论，写我们决策的结论，你也要注意自己的表述。我们是拒绝原假设还是不能拒绝原假设？一定要注意，尽量不要出现或者一跟大家说就一定不要出现什么接受原假设这种说法，一定要就自己的表述，首先你要正确，还有就是面对错误的说法，你要去能够去判断它正误，这个判断题要能够去识别它，这样子。好，这是咱们假设这样就基本上这样了。

接着说一下方差分析，方差分析也是非常高频的考点，首先第一块它这个概念概念是考了无数次了，它会考你这个名词解释的方差分析是什么，或者是单独把里面的一个挑出来，让你解释什么是单因素方差分析，或者让你解释什么是双因素方差分析都有可能，咱们在介绍方差分析的概念的时候一定要尽量保证它尽量保证写得全面一点。你要介绍它整体的概念，你还要介绍它分成什么，还要教它分成什么，它分成单因素和双因素分别又是什么概念，所以一定要就介绍的一定要全面分差分析，它的基本术语，还有基本术语就是三个，这三个他都有可能单独去拿出来一个去考你名词解释。

当然这三个概念都挺简单的，很简单的，但是介绍概念的时候需要给大家说一下，你不可能直接写概念就走人了。

写完概念之后最好举一个例子，举个例子，咱们例子还挺多的，像那些咱们课本上是不是就有现成的例子？咱们课本上给的例子是不同的行业对于它的被投诉次数是不是有显著性影响，是不是咱们可以把这个例子直接拿到卷子上去答这些题，或者说你一些平时做的计算题里，是不是也会有一些比较好的例子都可以拿来来回答这个名词解释，作为一个例子的辅助。

好吧，这里还是说要答得全面一些。方差分析本质和形式，这里本质和形式是咱们自己要去理解的，我们方差分析的目的是啥？本质上我们要去检验分类型的自变量对于数值型页面上它是不是有显著影响，这是我们本质上解决的问题。

但是我们形式上不是这么形式上，我们实际上的做法中，我们是对每个总体均值是否相等来进行检验的，一定要搞清楚它本质和形式是什么。下面基本原理这里，资本原理这里也是个很庞杂体系，他每一个点都可能去出。

咱们首先看第一个也是我标的加粗的对误差来源的分析，这一块如果说这里整个基本原理这里，他如果说考你简答题，它就是一个非常复杂的题，他可能就问你放假加分基本原理是什么，或者你分差分析基本思想是什么，如果问到这种题的话，咱们就尽量把整个体系都给它搭起来，都给它答的全面一些。首先对误差来源的分析是什么误差，它可以分成随机误差和系统误差，咱们在方差分析里面把它归类成组间误差和组内误差，对不对？整个这一块误差要说清楚。

那么分差分析里对误差分解，每一个误差是什么？整个又把它误差怎么去表示？我们是拿平方和来表示误差大小的，对不对？

一个是组间平方和还有组内平方和SSe s s a这样子它的一个误差的表示误差表示完之后我们进行误差分析，怎么去表示它到底是不是存在这种显著影响，我们是拿什么？我们可以用我们可以用 r方来表示r方来表示这个解释力度，这里还有说我们封条分析为什么要去我们怎么去证明是不是有显著影响，我们是拿误差平方和给他就是除以一个自由度，得到军方军方残差和军方组建军方和组内军方进行比较来进行决策的，所以这里要是给他说清楚，我们这统计量的设置为什么要这么设置？

所以整个体系来说，你的误差有什么，然后误差的在方差分析里面误差的结构，误差分解的结构是什么？然后我们要怎么去表示误差大小，然后怎么拿误差的大小去去进行最后的决策，所以整个体系给它搭起来，来介绍基本原理。

如果说真问到这种题的话，答的肯定是非常多的，这种题目前还没有出过，只是我这里就点一下，如果说考到的话大家尽量多答好吧？当然也可能就单独去挑几个点去问你，那可能就直接问你就方差分析里面组间误差是啥，组内误差是啥？他可能单独去挑一个点去问你，这时候还是比较好打的。最怕的就是他整个去问你这种题就很体系很庞杂，注意一下，大家要把这个结构搭起来就好。

好，然后下面接着说，方差分析它不是分成单因素和双因素吗？咱们看单因素这里，单因素其实考的往年都是考察单因素，方差分析的这里就可因为考太多了，所以往后可能慢慢就要往双因素方差分析过渡，因为单因素也是考太多了，没什么新意了。但还需要大家注意就是在单因素方差分析里面这些答题的整个步骤，答题的步骤，还有对于方差分析单因素方差分析之后还有一个多重比较，这一注意一下。

做成比较大家注意一下，你要具体去检测到底是哪些均值之间存在差异，我们写采用的方式就是最小显著差异法， I s d这个方法，这个方法它还是要去进行进一步的假设检验的，进一步的解释这里步骤需要大家注意一下，还有统计量应该是选择t头像是不是？只能听懂这两，所以说整个步骤需要大家注意多重比较，这里也是一个可能考察的点。

但是相比于单因素方差分析，我还是建议大家更多的多重视一下双因素的考察的可能性还挺大的。一个它是分成一个无交互，一个有交互的。

其实这里双因素方差分析它也不是说很难，主要就是它的需要记的小点还挺多的，就这几个自由度是几个容易弄混的，也是我在全程班一直给大家强调，给大家强调自由度的问题，一个无交互，一个有交互，它两个自由度，它首先就在误差分解上，它就分的就不太一样，有行因素的误差平方和就列因素的误差平方和还有就随机因素还有总的，但在有交互作用的双因素方差分析里，它又多了一个交互作用的，还有多一个交互作用的误差平方和SSRC还有其次就是几个自由度好吧，自由度一定要给它搞清楚了，不要弄混了。像在无交互作用的双因素方差分析里面，它随机误差平方和的自由度是k2-1，但但是咱们在有交互作用的方方差分析里面，SSeSSe sorry。

想跟大家强调这个的就是磁极误差项的平方和它的自由度是k-1×2-1，但在这个里面它又变成了k2×m-1，一定要注意就不要弄混了就好。

还有要说一下，在有交互作用的双因素方差分析里面，很多同学会问到这个是什么？M是咱们交互项，也就是每一个行因素的每个水行业性的每个水平，它和列因素每个水平交叉项，我们要采集样本个数，就是m就m这个它代表意义经常有人问到，所以这个需要大家明确一下，就是交叉项的样本个数好吧？好，这就是咱们方差分析这一章了。

一下一张就是要强调相关分析回归分析。

咱们这里是把两张内容合到一起来说了，就两章内容，一个是咱们是分别学了一元性回归和多元性回归，把它合到一起，在先进回归之前，咱们还有个相关分析也是很重要的，整个体系来说就是我们要首先进行相关分析，去明确变量之间确定是不是有相关性，我们只有确定变量之间有相关性，才可以去用相应的数学函数的形式去对它进行回归分析，来得到这样一个函数表达式，对不对？来得到这样一个数学表达式。所以这个过程中首先你要明确关系才能进行建模，才能去得到最后他们数学表达式，在相关分析里面就相关系数最相关系数最重要了。

相关系数一个是它的概念，还有它的性质，对不对？性质也是经常会考到的。

相关系数几个性质，对于一元性回归和多元性回归，在一元里面，我们要首先对它进行一个假定，我这里这个图里方的假定可能大家看到会有点陌生，因为不是咱们课本上的表述形式，这可以先不管，我们要以课本上来好吧课本就行。这个可能涉及到一些比较超高的说法，但其实内容都差不多了，咱们只要保证以课本上来去看它的基本假定就行了。这是医院先回归最小二乘估计我们要掌握他的思想是什么，它是要使估计值，那么使得估计值和真实值之间的离差平方和达到最小，对不对？这是他思想你得搞清楚。

然后具体最小二乘估计它的过程，我们要这个过程怎么去使离差平方和达到最小？是不是我们要对它对两个回归系数分别进行求就是求偏导。这个过程也需要大家知道，咱们课本上也有最小二乘估计怎么求？在一元现回归里面最小二乘估计怎么求？那个过程得大家都会写，因为什么呢？最小二乘估计可能会考你名词解释对不对？可能考你一次解释你怎么答，那就把那个过程打上去。一个是思想，还有他的整个去求解意愿性，回归最小二乘估计的参数，去求解参数估计值的过程，你要写出来，这就是答这个名词解释的时候需要把这个过程写下来，所以需要大家去记。

进了几个，那进了几个柿子被写错了。咱们课本上有一个错误，就是在求偏导的时候，后面平方他应该是一直带着平方那个平方得去掉，因为裘援平球玩偏倒，大家数学都不错的，应该也能看出来课本上确实有个错误。

好吧，注意写答，咱们答题的时候可别答错了。然后还有合规直线拟合优度，那么咱们用r方来表示拟合优度。这里一个r方就判定系数来表示你和优度，还有一个就是估计标准误差，这里尤其给大家点一下，估计标准误差它是一个挺常考的点。估计标准误差 s e他经常考他经常考 s e他如果真考的话，应该是考这个名词解释，名词解释咱们除了要说估计标准误差的定义之外，还要把它的作用给它写出来，在咱们课本上还有包括红宝书上都有详细的这个题解详细的回答了，表述，咱们就背下来就行了。尤其要注意一下，这个也是考过那么一两次，往后还是有可能考。

然后咱们估计玩细数之后，还要对新合规进行检验，显著性检验要注意它是有两个检验的，一个f检验，一个t检验，那f检验是整个整个方程的线性关系的检验，它也叫做整体的显著性检验，对不对？ T检验是什么？ T检验是对每个合规系数进行检验，是对回归系数单独进行检验，因为我们要看具体有个系数它是具体自变量，它是不是对因变量有显著性关，有存在这样显著性关系？这是f检验和t检验。

还有它这里就是要注意表述，f检验它叫做线性关系检验，也叫做整体的型性检验， t检验它叫做他有时候就直接说t检验了，还有时候说我过系数的5个系数的显著性检验要注意一下它表述。而且在一元和多元里面，这两个检验它也是有一个区分点的，也是非常常考的一个非常常考的一个简答题。所以我们在为什么在一元性回归里面他们可以等同，为什么在多元性回归里面他们俩不能等同？

这里非常容易考好吧？咱们环保书上也是后面的背诵笔记里有这么一道题，大家也是要注意背诵就行了。但是在还是要说在理解的基础上去去记忆会比较好。先理解，先去理解再去背。

下面一项是预测，预测这里就是区间估计了，区间估计预测，一个是置信区间估计，一个是预测区间估计。这里还可能去问你，可能去问你，简答题，或者说问你名词解释，当然还有可能放在判断题里面去问你，因为咱们知道置信区间和预测区间是有大小的，一次修宪它一般是要比那个置信区间它要更宽一点，对不对？可能他判断题就跟你反着说，注意一下这个可能会考判断题来迷惑你。然后残差检验这一块，财产权这里倒是不怎么考，知道有这个东西就行。

知道咱们是为什么要进行检验，因为我们要要么去明确对于残差项我们是有假定的，但是我们都做了那么些，都是我们把这个线回归都建出来了，但是如果说残差检验，如果说残差，它根本就不服从我们之前的假定咱们做的所有的这些工作都白费，所以其实一定是要有参加检验步骤的。材料检验还有一个比较重要的东西，它目的是什么？我们要明确一下，目的是要检验方差是方差齐性就是说咱们误差向误差向一个系数，它的方差是不是都等于西格玛方？这是方检验它方差齐性，还有就是检验正态性，因为我们有一个假定是对误差项进行假定，就是误差项它一定服从正态分布，对不对？我们要进行假定进行检验，它是不是服从这正态性分布的，这是我们进行残差检验的两个内容，就检验他这两个内容。

好，这是一元钱回归，多元性回归。

多元性回归，他还是这些步骤产生这些步骤，但尤其要说一下在多元性回归里面，我们进行拟合优度检验，我们得到判定系数，它叫多重判定系数，还有多重判定系数？一个叫判定系数叫多重判定系数？名字要注意一下，而且我们在多元性回归里面要对多重判定系数进行调整的进行调整，我们得到是一个调整的多重判定技术。这里要注意一下，多调整都成判定系数，它有可能考你。名词解释名词解释的时候一定要记住把它的公式写上去，一减块一-2方的长什么？N减k减一分之n减一，那公式一定要给它写上去，好吧？

还有可能就问你什么？问你简答题，为什么我们要在多元性规里面使用调整的多少判定系数？为什么要使用调整的？为什么要或者说为什么我们要对它进行调整？为什么要对r方进行调整，所以这里是要一个考察点。当然咱们红宝书上都有都有详细的答案。好，这多就是多元性回归，显著性检验刚刚也说过了，会和一元里面进行比较，对不对？

好，下面自变量的选择，自变量的选择上三种方法向前选择向后剔除和逐步回归，最常考的还是逐步回归。什么叫逐步回归？大家知道了逐步回归都是逐步回归，就是把向前和向后结合到一起。所以这里他可能会问你，可能会考察你这名词解释什么叫逐步回归，或者说他去问你怎么在这多元性回归里面，我们怎么进行自变量的选择？这时候你三个都要说了，这是你三个都要说，但是最重要的还是逐步回归。

好，这就是这几张大概给大大家就带大家过一遍，说的也不是非常详细，更关键的是想要大家在过的过一遍的过程中，自己也回忆一下，回忆一下自己之前学的东西，就这样子，那么这几章重点章节大概就是这样给大家就是把大概知识点可能考察的方向都过了一遍，接下来咱们说几个红宝书上的题，同学们问的比较多的。

这道题第一个题是咱们答案标错了，咱们宏宝书上给的答案是a但实际上答案是b答案是b因为这里我们是要用到一个变异变异系数的，因为系数vs它是等于还是等于SS就是咱们标准差就除以x18，这里两个总体平均数不等，但是标准差如果说是相等的话，标准差如果相等，这里如果平均数越大，整个变异系数就越小，变异系数越小，整个整体它的变异程度越小的话，这个时候我们平均数的代表性就更大了。

明白吗？就是咱们变异变异程度越小，平均数的代表性就越大，变异程度越大，咱们平均数代表性就越小，是这样子，所以这题也是很多同学都发现它是错，答案是错的，应该选b对不对？在跟所以这里就再跟大家强调一下是选b好，下一个题。也是问的比较多的，他说假定这100名大学生的英语成绩是平均数是70，标准差是5，那么有多少同学的考试成绩是在58~82分之间？这个题这个题如果说直接我们用中心极限定理去做的话，会发现没有答案。这个题他可能就是说一个坑，他没有告诉我们这些大学生他到底是不是正态分布，是成绩是不是服从正态分布？

但是按理说这100名大学生他其实样本量足够大，是可以近似的，是可以近似正态分布了，应该是可以用中心极限定理来做的，但具体他出的是有问题，出有问题他没有这个课没有那个答案，有做的同学会发现没有答案。所以这个题咱们可以这样，考试时候不会出现那么不严谨的题，他如果说真的想要去考察你，如果说真的是出现这种题出现在考卷里的话，咱们还是拿中信基金经理去做，来帮鉴定你去做，应该是会有答案的，但这道题它出的不好，召集他出的不好，他肯定是想考察咱们大数定律，但他他出的他欠妥，你知道吗？所以说这道题给大家一个可以修改一下，就考察我们用大数定律去做，去算多少学生成绩是在58~82分之间的。

好吧，这里就是生大数定律去做的。

但是咱们要记住在考试的时候遇到这种情况，它是可以用中心极限定理去做的，是吧？考试的时候还是优先用中心极限定理，咱们当然也是通过这道题就复习一下大数定律了，大数定律不等式纪委为雪夫不等式，你是把这个切比雪夫不等式给大家就复习一下，这个题它是58~82之间，其实平均数是70，平均数是70， x是除以58~82之间的，这个概率它其实就等于什么？其实就等于 x减去70的绝对值是小于12的，对不对？

然后你就发现这个形式它不就是咱们县比雪夫不等式吗？就切比雪夫不等式吗？它就大于等于一减去。

咱们现在看下面现在看它这个公式是什么了？公式就是x减去一x的绝对值大于等于一个常数项。It was not。它的概率是小于一部系统方分之它 x的方差。还有一种就是如果说x-1x的绝对值它是小于还是小于这个常数项一波系统的，它的概率是大于等于一减去一减去后面这一堆，首先要明确这个公式，那显然咱们要用的是第二个公式，对不对？

怎么样用第二个公式？这里12就是一波新note。Three wasn't of sharp。它的概率大于等于1减去。It was no fun。分支。5的平方，因为标准差是5，所以它方差就是25，对不对？5的平方。大家一算它是约等于0.826的，咱们就选到b项了。这道题就是想跟他其实就是想考察你又切必学的不等式去做，但是他又没说。好吧，通过这道题咱们就把这两个公式复习一下。数三的时候也常用吗？数三也经常考到的，疏散概率论也经常考到这里。好，这是这道题。

下面这个题要跟大家说一下，这个题应该出的有点问题，他说某高校学生参加英语4级考试的合格率是零点90%，问合格率的方差是多少？赵提。答案，咱们红宝书上给答案是b给答案是b但是这道题他其实有点问题，他应该是求不出答案的。咱们知道整个高校的学生不是求出答案了，是这个题他就没有从已知的信息是得不到答案的。

他说某高校学生他参加，因为考试的合格率是90%，其实他可以看作把每个学生每个学生他设为x的话， x其实是服从一个二项分布的，他要么是河流，要么是不合格，对不对？要么是合格要么不合格，这时候还服从一个二项分布。合同二项的分布 p是0.9，现在要看整个合格率，合格率它就服从一个它也是可以近似，服从一个正态分布，我们知道这个样本比例，样本比例他服从的这样一个要不然比例它服从就正态分布，它的均值是甚至是np它的方差是 n分之不是这个是p然后它方差应该是p乘上一减p但还要出一个发出语文，这是这是样本比例他服从的相比还服从这样一个正态分布。

那显然咱们不知道对不对？咱们不知道的。所以合格率它其实方差如果说知道n的话，那就应该0.09来出一个就0.9×0.1，再出一个样本量就可以了。但是这里还没有这个信息，没有信息，所以这个题是出的有点问题的。

像这个题就到这里了，然后咱们说一下下面也是反反复复非常多的同学来问的，你说我也要强调算第一类错误和第二类错误是非常非常高频，也不是非常重点的一个考点，因为去年第一次考到今年咱们还是有可能会考的，这个题应该大家都比较熟悉，如果说做过红宝书的话，都比较熟悉这个题目，我们今天因为时间有限，只看第一问，好了就看第一问，就看第一问，他是总体是服从正态分布，它的均值为u方，差为西格玛方，检验原假设是u小于等于0，这字假设是u大于0，他已经给了我们拒绝玉了，已经给了我们拒绝语，而且这里的uI这里因为他不是上面均值，他这是个又这又是咱们标准正在统计上，他要写作z统计量也可以写作优，因为有些教材特别是在概率论的教材里面，他写成又统计量的，所以这里 U它是一个统计量，这个u是等于根号n乘以x8，拒绝率已经给到我们了，现在让我们去求第一类的错误的概率阿尔法u去求。

我们知道第一类错误是什么？

第一类错误是原假设为真，但是我们却将其拒绝的概率。也就是说原假设为真的时候，他落入拒绝率的概率对不对？他落入域了，这个原假设是什么？原假设是 u小于等于0，这是咱们原假设，它落入绝育的话，也就是说露记者喻的时候，也就是说又大于又阿尔法，也就是根号nx一拔它大于ur法，对不对？这就求出来咱们第一类错误，但是在详细的计算过程中大家都有问题。

我们看一下优，题目已知是根号n乘x8，注意一下这里的优势有统计量，对不对？所以这里其实这根号n乘x8是咱们的样本统计量，我们平时写样本统计量的时候怎么写？我们是不是把x把它减去？嗯咱们天上都是用妞，对不对？

一般来说咱们要么红浆是这个东西，怎么样要我们统项是这个东西，但是现在他给到我们是刚好n乘以x其实这里它想告诉我们什么？其实这里隐形条件 x它其实可以写成x拔，相邻÷1，再出一个2n对不对？这俩是不是一个东西，它是不是可以写成所以说现在咱们的样本统计量唷她就等于这个这是我们样本统计量，从样本统计我们就得到咱们这西格玛方它就等于1，所以这一块就有一个隐性条件，它告诉我们样本统计量它 s要么统计量这里，他就可以看出西格玛方式等于一的。

很多同学他问题就出在这里就问，就会问咱们怎么出完之后西格玛方没了。

他其实这里就是一个隐性条件，他告诉了我们它可以写成这种形式，也就是说 cinema方式等于1的。好，明确这一点后面就好做了，后面就好了，因为我们这是一个样本统计量，我们现在想要通过左把左边构造成一个标准正态分布，想要把左边给它进行一个标准化，从而能够得到发函数把这个发函数写出来的这样一个形式。所以我们左边要去给它减去一个真正的要减去一个真正的优，真正的一样，真正的均值，要减去一个真正的均值，你既然左边都减了之后，右边可能也要减，对不对？所以右边就变成了u阿尔法减去根号n乘以u好，左边标准化了之后，咱们就可以把它写成发函数的形式了，它也就等于因为这个是大号大于号，所以他就等于一减去发的由阿尔法减去根号nu他就等于这个。

咱们别忘了这个条件里面有什么条件里面有u小于等于0，所以说 fun函数它这一步这也是有很多同学有疑问，为什么它大于等于后面？

为什么是大于等于？因为我们知道翻函数它是一个它是一个递增的函数，方法就是一个递增的函数，但这里u它是一个负数，u是负数，这一块是不是正数？它前面是负号，所以这一块就是一个正数，它是一个正数，前面这里头这个肯定要大于后面 u r法，所以整个函数整个发函数它也是大于等于后面这个的。因为三函数是递增函数，对吧？所以前面大于后面，而后面发ur法它又等于一减r法。这块也有问也有人有问题，为什么发u阿尔法等于一减阿尔法？

这得画个图给大家说明一下。

三函数，反函数它是一个刚才说到它是一个递增函数，对吧？分函数它 u阿尔法，我说u阿尔法它是指的是上它是一个上分位数，上面是阿尔法的时候，我们说它是一个u阿尔法，但是发函数指的是它下面的概率，如果说发ur法它就等于这一块的，它就等于这块的概率，这也是我们的 five有阿尔法，这个明白吗？

用阿尔法是一个上分位数，就它右侧是阿尔法的时候，这一个值就是用阿尔法，但是我们的发函数它是一个表示它下策概率的，所以说发u阿尔法它等于我这个左边画阴影的部分是一减阿尔法，对不对？因为右边是阿尔法，所以左边肯定是一减阿尔法，所以psi u阿尔法就等于一减阿尔法。这里是很多同学在问的，就把这个图搞清楚，好吧？那就脱稿清楚。

好，既然得到这个的话，咱们整体的第一类错误的概率就可以看出来他我们说阿尔法，阿尔法15既然是一减去它的，所以它就小于等于一减去后面一减阿尔法，也就得到这个阿尔法，咱们犯第一类错的概率就不大于阿尔法。不大于玩法。

这就给大家说一下第一问就行了，因为第二个问题是跟第一问是一个思路，只把第一问里面这几个点搞清楚，第二问就能做出来。再跟大家重复一下有几个点，首先第一个，这里为什么西格玛方等于1，因为它已经构造好了一个统计量，刚好nx8它可以写成上面这个形式，x8-0除以除以一比根号n这里这个就隐隐含的一个信息，告诉我们西格玛方等于一，这是一个点。

好，第二个点是我们要构造左侧摆个左侧标准化才可以写成发函数的形式，把左侧标准化这里就是左右两边都减去，相当于都减去根号n优了，因为左边减去u之后是括号外还没有还有一个根号n所以右边你要减去一根号n由。这是第二个点。

第三个点是。第三个点是这个分函数它是一个递增函数还是递增函数？第4个点就是 u Alpha，或者说咱们z阿尔法它都是一个上分位数，它表示是它上面概率为阿尔法的时候，这个值是ur法，但是咱们的发函数指的是它这一个翻版书指的是这个值它下册的面积，所以发u阿尔法它等于一减阿尔法。好，这是这几把这几个点搞清楚，这个题目就没有问题了。但这个题是第一求第一类错误，第二类错误中觉得比较麻烦的比较难的一个题，因为它都是用字母来表示，而咱们在考试的时候一般来说代数就行，带数进去就行了，他就没有这么繁琐，没有什么繁琐，这道题之所以麻烦，就是因为它字母很多，而且跟咱们平常用的字母还不一样，因为我们平时用的是z统计，但是他现在他拿优，他写的是优，而且它均值用优，它的均值用优，它后面统计还用优，就是容易搞混，没搞好，所以这个是个挺容易迷惑我们的一个地方。咱们在考试的时候不用太担心，考试的时候他会给我们具体的数去算第一类错误或者第二类错误。

基本上这个题的思路就是差不多是这样子，然后第二问的话也是这个思路继续往下做。第二问就比较简单了。行，咱们今天今天这个直播内容就到这里差不多结束了。

其实讲的东西挺多的，现在大家看一下有没有什么问题，刚才说的这些有没有什么问题可以现在提问一下。有问题的话就打在公屏里。F呃批分部。I go拿一个p分布上一道题，他没有批分布，是这个球低了，第一类错误的题吗？我没明白你什么意思。就是这个题合格率合格率就是样本比例的分布。

咱们在做他不是怎么算的，这样给他推一遍也行，就是说每个咱们说高校学生他是不是合格？是不是合格给它设成x或者说合格数，甚至受x这个赫格树x他就服从一个二项分布，对不对？合格书x是二项分布，二项分布它是有一个n和p的，不从n和p的二项分布。

这里如果说样本量足够大，它其实可以近似服从什么？近似服从正态分布，对不对？

Mp长np就是封茬是np乘以一减p对不对？这个是它可以近似服从的状态分布，这里它是合格率，合格率是啥？合格率不就是x除以n吗？因为x是合格数， x除以n就合格率也就等于咱们 p了，或者说你叫他拍也行，他服从的，它就可以看做近似服从什么？正态分服从正态分布，它就是等于这个np你得除以p还就是p对不对？然后 n p×1减p他也他得出一个什么？出一个n方除以一个n方，它它就变成了nn分之p乘以一点p这就是咱们样本比例的分布，样本比例服从正态分布，近似服从正态分布。这里显然他没有告诉我们样本量，那告诉这个就没有答案，这题是有点问题的。

好，还有问题吗？可以打到公屏上。还有大家可以咱们的直播课想要去听什么内容，就关于下一次直播内容，大家也可以提出一些自己的建议。为什么会想到x把它减去u因为我们要对它进行标准化，引进标准化之后才能去得到它具体用发函数去表述这个概率。中心极限定理的时候，我们用中心极限定理做题的时候也是这样一个思想，就我们要把左侧给他，我为什么要用再用标准化？因为这是一个要门统计量，并不它是样本统计量，它是一个值，明白吗？其实它是一个具体的算出来能算出来值的东西，是个样本统计量，它是具体能算出值的东西，但是我们像现在要对它进行一个真正的标准化，真正的标准化就是要减去一个真正的u如果说这个题你想不太明白的话，你想一想你平时做假设检验的时候，over平时。

对平时做假设检验的时候，我们给出的样本统计量，它是不是一个值？你要去但是我们是说这个是服从一个正态分布，但它其实真正的去服从正态分布，构造一个真正的标准化的形式，这样子它是一个统计量的值。三数三概论已经学完了对吧？

然后咱们现在可能没时间看老师松了，但是同学你有买红宝书吗？咱们红宝书上它是有一块去总结可能出现的超纲的概率论部分，我们就把可能超标的概率的部分对应着毛时松看一下，或者你不对应也行，就看他罗列了几个点。我建议还是说除了数三个改革，还是需要补充一些洪宝树上列的这些点的东西。修正系数是在我们不重复抽样的情况下要用修正系数而且虽然不是这个大恩是总的量，大恩是总的量，恩是咱们样本量应该是n减一分之n大n减小n我记得是这样子，修缮系数它基本上不太可能考，你只要知道有这么个东西就行。

这里有没有可能去考你说判断题。判断题就是说在不重复创的情况下，它的方差是不是还样本方差是不是还是所以这个时候我们不能用不能用直接让他等于就是说他可能会考你判断题，在不重复创的情况下，其实我们是要加一个修正系数的，对不对？什么情况下重复不重复创可以算作重复抽样？它有这样一个规则就是说当我们要抽的样本量非常大，就是总量非常大的时候，就大n它无限大，这个时候其实我们可以算作重复抽样。

他还有如果说如果说没有这么大，但我们还要去比大n和小大n小n的比值，大洋洋的比值它是和这有点忘记了咱们什么咱们宏宝率应该是有专门列，在后面的背诵笔记应该是有一项关于修正系数，他什么时候要用？因为最终系数它还有一个近似，是有一个近似。他大恩大n比上大n减小，n是对的。

刚才小两点大两点不行，就是说行政系统它有一个近似，就在什么情况下有近似，咱们背诵笔记上应该是有的，但我现在具体我一时间也想不太清楚。记不清楚。背诵笔记后面应该是有这么一个题列了。

讲一下考题类型，应试技巧技巧的话，咱们是放在可以12月份给大家在最后说一下，就考前跟大家强调一下做题技巧。11月份10月份也可以给大家再稍微说一下。

行，我安排一下，下次跟大家讲一下。专业课现在要开始背了，现在已经这都10月底了对吧？然后最后11月12月份，专业课这些背诵的东西一定要给它搞起来了。而且因为现在咱们复习的都应该比较充分了，你理解上应该都达到了，先理解后背就非常就会非常容易一些。这个阶段也是背诵，咱们说应该最好是从9月份就开始背了，现在背诵也不晚，现在都要开始了，背诵都要开始好吧？方差分析他会给我们方差分析这里不太确定，如果说他出简单了，那就是方差分析表直接给你让你去填空，让你去填空也有可能，但当然以前没出过，但他如果真的想提高计算量，就会给你原始数据去算一下，这可能性会小一些，非常小，会非常小。还是主要大概率的会给你一个分差分析表去填空，进行比较简单的就是说让你去求自由度，然后去求军方或者让去填填平方和就这样子的。

大概率是出方差分析表。

大家还有什么问题吗？你就意思是说这个组间误差和组内误差里面的随机误差有什么区别吗？这没什么区别，它都是随机因素所产生的影响。没什么区别。都是随机误差，它都会含有随机误差。如果说区别的话，就在于这组间误差中既包括随机误差，它又包括无产，但组内误差是里是只有随机误差的，这样子。它具体随机误差都是随机因素起作用，你要非要去区分它没有什么意义，只要知道有随机误差就行。好的。

其他同学还有什么问题吗？不客气。咱们今天的答疑就先到这里，最后再打个广告，最后再跟大家说一下，因为咱们全程班是马上要开这冲刺班了，冲刺班10个课时，冲刺班也是主要内容是给大家再把整个高频的考点梳理一下，然后包括一些答题技巧，整个是在考前冲刺非常有必要的一些内容。好吧？才打下广告。

行，大概今天内容就到这里结束了，我们下次直播课再见，还有大家平时有问题都可以发到群里，包括对于下次直播课内容也可以提出一些自己的建议。还有匹配样本，假设检验会考吗？匹配样本它都可能会出的，参数估计假设检验都可能会出。所以要注意一下，平时遇到匹配样本的题一定要多注意一些。好吧，今天先到这里了。大家拜拜。

[432] 21年对外经济贸易大学432统计学10月主题答疑直播课