有监督学习(一)

作者 : icbug 发布时间: 2020-06-7 文章热度:193 共720个字,阅读需2分钟。 手机浏览

目 录

上一篇文章已经讲清楚了什么是有监督学习


分类:Classification

分类:就是通过已有的数据集(训练集)的学习,得到一个目标函数f(模型),把每个属性集x映射到目标属性y(类),且y必须是离散的(若y为连续的,则属于回归算法)。通过对已知类型训练集的分析中发现分类规则,用此推断新数据的类别。


回归:Regression

采取了一些父子的身,对这些数据进行建模,然后使用模型,根据输入的新的父亲的身高去预测其子身高的取值

拟合线性方程:Y=a X +b


分类算法

分类算法对已知类别的训练集进行分析,从中发现分类规则,以此来预测新数据的类别。分类算法的应用比较广泛,银行风险苹果,客户类别分类,文本检索和搜索引擎分类,安全领域中的入侵检测以及软件应用中的项目中应用非常广泛

原理分类:

基于统计:贝叶斯分类等

基于规则:决策树算法等

基于神经网络:神经网络算法

基于距离的:KNN

常用评估指标:

精确率:预测结果与实际结果的比例

召唤率:预测结果中某些结果的正确覆盖率

F1-Score:统计量,综合评估分类模型,取值于0-1之间


KNN

KNN:分类算法中的最简单算法之一,核心思想是如果离某一个样本最近的k个样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。KNN不但可以预测分类,还可以做回归分析。

有N个已知分类结果的样本点,对新记录r使用KNN将其分类的步骤:

步骤1:确定k值,确定计算距离的公式,比如欧式距离

步骤2:计算r和其他样本点之间的距离   d

步骤3:得到目前和r最接近的k个样本,作为KNN的训练样本

步骤4:将k个样本中最多归属类别分类标签赋予新记录r,分类介绍;


后半部分有更多精彩哦!!!欢迎关注我的机器学习算法专栏

常见问题FAQ

本站资源是否全部免费?
本站文章和普通速度下载资源免费,高速下载资源和讲解视频需要成为SVIP才能查看哦!
本站采用标准 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明!
icbug创客 » 有监督学习(一)

发表评论

CAPTCHAis initialing...