机器学习定义
机器学习是一种在没有明确编程的情况下让计算机学习的方法,通过大量的数据观察和学习,使计算机系统能够自动提高性能。
监督学习使最常用的机器学习类型,通过已知的标签数据进行训练,可以用于预测和分类等应用场景。
无监督学习则通过未标记的数据进行训练,常用于聚类和降维等应用。
分类
监督学习
- 回归(Regression):输入数据带标签,输出是数字
- 分类(Classification):输入数据带标签,输出不是数字,而是类别
分类的输出类别只能是有限的、离散的数量;而回归是可以有无数种可能的数字的情况的。
无监督学习
- 聚类(Clustering):输入数据不带标签,输出是类别
- 异常检测(Anomaly Detection):输入数据不带标签
- 降维(Dimensionality Reduction):输入数据不带标签