机器学习(2): 机器学习的基本工作原理及常用算法

机器学习的工作原理

如果用现实生活中容易理解的概念介绍机器学习，那么所谓机器学习的过程，和训练动物的过程很相似。

例如教会狗狗握手，只需要伸手的时候，在某次狗狗无意中做出了握手的动作，那么就给他一块零食吃，久而久之，狗狗也能知道握手就能吃到零食，这个握手的训练就算完成。

简化下来也就这三个流程，预设动作→训练→反馈，对应到机器学习中，也是机器学习最重要的三个概念，即数据集→假设函数→损失函数

数据集：数据集分为训练集和测试集，他们内容和结构其实是一样的，只是在不同阶段使用，在训练时使用就叫训练集，在测试时使用就叫测试集。数据集有很多形式，用常用的矩阵（大学线性代数学过，忘了的去翻课本，类似excel表格）形式数据集举例，每一行都是一条数据，每一列都是该数据集的一个特征。

假设函数：顾名思义，假设函数，就是依据输入的数据给他预测出结果来的函数。比如有一个房子的特征数据，假设使用一个函数f(x)，能预测出该房子的房价，那么这个f(x)就是假设函数。

损失函数：通过假设函数f(x)推导出来的结果数据，有可能和实际存在的真实数据有差异，这时候就需要有一个函数来衡量这个差异的大小，这个函数就是损失函数。

机器学习的常用算法

虽然学习机器学习的初衷是想训练一个私人聊天机器人，而训练聊天机器人基本都是使用深度学习的方法，但这并不妨碍去了解一下其他的机器学习算法，所谓术业有专攻，深度学习并不是万能的，不同场景使用不同算法才是对的

朴素贝叶斯算法

从理念上讲，我觉得朴素贝叶斯算法最有意思，这个算法的核心观念是：事件的结果都不是确定性的而是概率性的，你所见到的只是概率最大的结果而已。

例如想要挑到一个保熟的瓜，那么常用的办法就是拍瓜听声，声音越沉闷瓜越保熟，声音越清脆，那么是生瓜蛋子的概率越大。朴素贝叶斯就能把「声音特征」概率化，结合西瓜其他特征数据训练出来一个模型，下次把西瓜的特征数据输入给这个模型，它就能返回「保熟」概率。

logistic回归算法

中文通常喜欢叫逻辑回归算法，它本质是一种分类算法，用来解决分类0/1问题，即把输入的特征转化为0和1这两种概率。

决策树算法

决策树算法是最接近程序员思维的算法，它由一系列if/else构成，在形式上类似于流程图，例如下图是一个分辨好学生与坏学生的决策树：

神经网络算法

深度学习所使用的就是神经网络算法，「神经网络」这一词语来自于生物学，因为深度学习很多概念的灵感都来自于对大脑的理解，神经网络就是由很多神经元连接所构成的网络。虽然如此，但是没有任何证据能证明人脑的学习机制与机器的学习机制一样，千万不要将机器的学习方法套用在人脑上，小心走火入魔。

引用亚马逊网站对深度神经网络架构的介绍：

深度神经网络又名深度学习网络，拥有多个隐藏层，包含数百万个链接在一起的人工神经元。名为权重的数字代表节点之间的连接。如果节点之间相互激励，则该权重为正值，如果节点之间相互压制，则该权重为负值。节点的权重值越高，对其他节点的影响力就越大。

从理论上讲，深度神经网络可将任何输入类型映射到任何输出类型。但与其他机器学习方法相比，它们也需要更多大量的训练。它们需要数百万个训练数据示例，而不像较简单的网络那样，可能只需数百或数千个训练数据示例。

拓展阅读