从零开始搭建一个机器学习模型(一):机器学习模型是怎么工作的

傻大方小编提示您本文标题是:从零开始搭建一个机器学习模型(一):机器学习模型是怎么工作的。来源是。

从零开始搭建一个机器学习模型(一):机器学习模型是怎么工作的。模型|从零开始|工作|决策树|搭建---


模型|从零开始|工作|决策树|搭建---

从零开始搭建一个机器学习模型(一):机器学习模型是怎么工作的

首先我们将解释一个机器学习模型是如何工作的,以及我们该如何使用它们。如果你之前建立过统计模型或者机器学习模型,会感到这很简单。不过不用担心,我们会很快建立强大的机器学习模型。

假设我们需要为以下场景建立一个模型:

从零开始搭建一个机器学习模型(一):机器学习模型是怎么工作的。模型|从零开始|工作|决策树|搭建---

你有一个表兄因为投资房地产赚了几百万美元。

而你恰好对数据科学比较感兴趣,他也愿意和你成为生意伙伴。他会提供钱,你则需要提供一个能预测各种房屋价值的模型

从零开始搭建一个机器学习模型(一):机器学习模型是怎么工作的。模型|从零开始|工作|决策树|搭建---

你问你的表兄过去是如何预测房屋价值的。他说只是靠直觉。但种种迹象表明,他是从他过去见过的房屋的价格中归纳总结出了一种价格模式

从零开始搭建一个机器学习模型(一):机器学习模型是怎么工作的。模型|从零开始|工作|决策树|搭建---

,他正是用这些模式来预测他正在考虑的新房子。

机器学习也一样。我们将从一个叫做决策树的模型开始。有些更理想的模型能给出更准确的预测。但是决策树很容易理解,它是数据科学中一些最好的模型的基本构建模块。

为了简单起见,我们将从最简单的决策树

从零开始搭建一个机器学习模型(一):机器学习模型是怎么工作的。模型|从零开始|工作|决策树|搭建---

开始。

模型|从零开始|工作|决策树|搭建---

从零开始搭建一个机器学习模型(一):机器学习模型是怎么工作的

简单决策树模型

它把房子按卧室个数是否大于2个分为两类,我们可以基于此来判断一间房子的价格。

这就抓住了房子大小和价格之间的关系。首先,我们基于上述的结论和已有的卧室间数的数据将所有的房子分成两组,然后再确定各组的预测价格。从数据中捕获预测模式的这一步称为拟合或训练模型

从零开始搭建一个机器学习模型(一):机器学习模型是怎么工作的。模型|从零开始|工作|决策树|搭建---

。用于拟合模型的数据称为训练数据

从零开始搭建一个机器学习模型(一):机器学习模型是怎么工作的。模型|从零开始|工作|决策树|搭建---

至于模型是如何拟合的(即这两个数据集是如何分割的),这是一个非常复杂的问题,以后我们再做解释。在模型被拟合之后,你可以将它应用到新的数据来预测其它的房屋的价格。

增强决策树模型

从零开始搭建一个机器学习模型(一):机器学习模型是怎么工作的。模型|从零开始|工作|决策树|搭建---

上述的决策树模型,虽然能够预测房价,但是它只考虑了卧室的间数,而没有考虑其它因素,例如位置,大小等。

我们能通过对数据集做更细的划分来利用更多的因素预测房价。

这样决策树叫作更深的决策树,它可以长这样:

模型|从零开始|工作|决策树|搭建---

从零开始搭建一个机器学习模型(一):机器学习模型是怎么工作的

复杂决策树模型

你可以通过追踪决策树来预测任何房子的价格,即在决策树中选择与房子的特性相对应的路径。

房子的预计价格在树的底部。我们将最底部的节点叫作叶子。

上述过程,就是一个决策树模型预测房价的大致过程。