线性回归参数含义的理解问题

2025-03-23 11:11:20
推荐回答(1个)
回答1:

我擦,题主这么多问题一点悬赏都没有,太小气了!!知道我也不答!!

题主仍然小气的让人心碎,你得知道这个问题还是很复杂的。那我就简单讲讲吧。
首先线性回归模型有一个通用的公式是Y=(X^T)B (X^T是向量的转置,向量默认列向量),因为这个公式兼容了当函数是多元的情况。 在这里,将其展开是y=(1,x1,x2,...,xn)^T (b0,b1,...bn)一元的话,就是y=(1,x1)^T(b0,b1). 所以B一定是向量。
线性回归完整的模型是这样的。 对于任取一点,y是一个变量服从正态分布,分布的期望值=(X^T)B。你得知道,线性回归得到的y,实际上是一个正态分布的期望值, 只能对应一种预期。但对于一组实际的数据,你也可以看到线性模型的图与实际散点图并不完全重合。
然后系数的计算是使得(y-BX)^2最小,B的计算结果是包含y的,y又是一个变量,所以B也是一个变量。如果代入一组实际数据,那么我们得到是其实是对B的一个估计值,一般记作b。
(3)残差公式为 (求和符号)(yi-yi')^2。 yi为实际值,yi'为线性模型所求的值。在这里实际值与回归出来的函数都出现了。 标准差只是形容一组实际数据与其平均值的偏离程度,并没有出现回归出来的函数。
4. 置信区间是对一个变量说的。你这里置信区间是对参数B还是y呢?我MATLAB没用过,不知道究竟指谁。
5. 标准差应该解释清楚了吧。 这么多统计量都是为了说明 线性模型是否足以刻画这组数据。你可以看看一本书叫Applied Linear Statistical Method 第五版,这些统计量对于多元回归的变量的选取还是有一定意义的,
6. 可以理解成当H0成立时,我这组数据在当前模型里是不是最极端的情况。p非常小,意味着这组数据是非常极端的,在很多次实验里只能出现几次,所以就reject H0.