📖 生信数据分析--分析流程，工具包等

机器学习基于R包mlr3(1)--分类--KNN

KNN–K近邻 1、KNN的步骤（1）计算输入数据与训练数据的距离（一般欧几里得距离）；（2）从训练集中，选取距离输入数据点最近的...

机器学习基于R包mlr3(2)--分类--逻辑回归.md

1、逻辑回归的算法理解逻辑回归 = 线性回归 + Sigmoid函数与线性回归相同的是同样需要学习变量的权重(系数)与偏置(截距)；与线性回归不同的...

机器学习基于R包mlr3(3)--分类--LDA与QDA

1、概述 LDA与QDA可以简单理解为有监督的降维，将多个预测变量信息压缩成少数（类别数-1）新的预测变量。每一个新的预测变量称之为判别函数，...

机器学习基于R包mlr3(4)--分类--朴素贝叶斯

1、朴素贝叶斯简介 Naive Bayes：预测样本属于每一类别的概率，取概率最高的类别。包含四个概念：后验概率、似然、先验概率以及全概率。如下图示例例...

机器学习基于R包mlr3(5)--分类--SVM

1、SVM相关基本概念超平面：比数据集的变量少一个维度的平面，也称为决策边界；间隔：（对于硬间隔）训练数据中最接近决策边界的样本点与决策边界...

机器学习基于R包mlr3(6)--分类--决策树与随机森林

1、决策树基础 1.1 决策树的构成（1）决策树由节点组成，可分为决策节点(Decision tree)与叶节点(leaf node)。（2）从上到下的...

机器学习基于R包mlr3(8)--回归--线性回归

1、关于线性回归 1.1 公式理解由于实际问题很少遇到单变量线性回归，所以更常见的表示为通用线性模型： $$ y = \beta_0 + \beta_1x_1 + \beta_2x_2 + …+\beta_kx_k + \epsilon $$ （1）β0表示截距，...

机器学习基于R包mlr3(9)--回归--GAM非线性回归

1、关于GAM非线性回归 (1) n阶多项式如前所说，线性回归的假设是每个预测变量与输出变量之间为线性相关。即类似 y = ax + b。当预测变量与输出变量之...

机器学习基于R包mlr3(10)--回归--岭回归+LASSO回归+弹性网络

在建立通用线性模型时，当模型参数即斜率值绝对值过大时，容易存在过拟合的风险。可通过下面介绍的3种正则化方法将每个预测变量的斜率参数缩小为0或...

机器学习基于R包mlr3(11)--回归--kNN+随机森林+XGBboost

1 2 library(mlr3verse) library(tidyverse) 0、示例数据 1 2 3 4 5 6 7 8 9 10 11 12 13 data(Iowa, package = "lasso2") head(Iowa) # Year Rain0 Temp1 Rain1 Temp2 Rain2 Temp3 Rain3 Temp4 Yield # 1 1930 17.75 60.2 5.83 69.0 1.49 77.9 2.42 74.4 34.0 # 2 1931 14.76 57.5 3.83 75.0 2.72 77.2 3.30 72.6 32.9 # 3 1932 27.99 62.3 5.17 72.0...