Hello~大家好,今天学姐为同学们分享昆士兰大学COMP4702/COMP7703相关专业考知识点复习归纳,学姐整理了非常详细的流程细节可以参考。
机器学习线性回归知识
米切尔(1997)将机器学习定义为:
如果一个计算机程序在测试中的表现随着经验的增加而提高,那么它就可以从经验中学习一些任务测试和一些性能测试
假设用P来评价一个计算机程序在某个任务类T上的性能,如果一个程序利用经验E在T上取得了性能提升,那么我们就说关于T和P,程序是从E学习的。
关于机器学习的相关通俗解释,我推荐一个b站的高手:YJango。
交叉验证
交叉验证(Cross validation),也称为周期估计,是一种将数据样本统计切割成较小子集的实用方法。因此,可以首先对一个子集进行分析,其他子集可以用于该分析的后续确认和验证。初始子集称为训练集。其他子集称为验证集或测试集。交叉验证是一种评估统计分析和机器学习算法对独立于训练数据的数据集的泛化能力的方法。
首先将数据集D分成k个大小相近的互斥子集,即D = D1 U D2υ… U Dk,Di n Dj = 1(í不等于j)。每个子集Di尽可能保持数据分布的一致性,即通过分层抽样从D得到。然后,每次k-1子集的并集作为训练集,剩余子集作为测试集;然后可以得到k个训练/测试集,从而可以进行k个训练和测试,最终返回k个测试结果的均值。显然,交叉验证法的评价结果的稳定性和保真度很大程度上取决于k的值,为了强调这一点,交叉验证法通常称为“k倍交叉验证”(k倍交叉验证),最常用的k值是10,此时称为10倍交叉验证;其他常用的k值有5、20等。
线性回归原理
线性回归假设特征和结果满足线性关系。线性关系的表达能力非常强大。每个特征对结果的影响可以通过前面的参数反映出来,每个特征变量可以先映射到一个函数,然后参与线性计算。这样就可以表达特征和结果之间的非线性关系。
线性模型试图通过属性的线性组合来学习一个预测函数
价值函数
用均方误差表示。
梯度下降
例如,我们在一座大山的某个位置。由于我们不知道如何下降,我们决定一步一步来。也就是我们每次到达一个位置,就求解当前位置的梯度,并遵循梯度的负方向。就是从当前最陡位置往下走一步,然后继续求解当前位置梯度,沿着最陡最容易下坡的位置再走一步到这一步。一步一步往这边走,直到觉得到了山脚下。当然,如果走这条路,我们可能去不了山脚下,而是到了某个局部高峰(局部最小值)。
从上面的解释可以看出,梯度下降不一定能找到全局最优解,可能是局部最优解。当然,如果损失函数是凸函数,梯度下降法得到的解一定是全局最优解。(来源知识)
梯度下降法按照以下过程进行:
1)首先给θ赋值。这个值可以是随机的,或者让θ是全零的向量。
2)改变θ的值,使J(θ)向梯度下降方向减小。
均方差
均方误差值越小,预测模型的精度越好。
海师帮昆士兰大学finm7403课程的在线辅导可以添加海师帮老师微信进行一对一咨询。海师帮专注辅导海外留学生在学习中遇到的各种问题。