如果用现实生活中容易理解的概念介绍机器学习,那么所谓机器学习的过程,和训练动物的过程很相似。
例如教会狗狗握手,只需要伸手的时候,在某次狗狗无意中做出了握手的动作,那么就给他一块零食吃,久而久之,狗狗也能知道握手就能吃到零食,这个握手的训练就算完成。
简化下来也就这三个流程,预设动作→训练→反馈,对应到机器学习中,也是机器学习最重要的三个概念,即数据集→假设函数→损失函数
数据集:数据集分为训练集和测试集,他们内容和结构其实是一样的,只是在不同阶段使用,在训练时使用就叫训练集,在测试时使用就叫测试集。数据集有很多形式,用常用的矩阵(大学线性代数学过,忘了的去翻课本,类似excel表格)形式数据集举例,每一行都是一条数据,每一列都是该数据集的一个特征。
假设函数:顾名思义,假设函数,就是依据输入的数据给他预测出结果来的函数。比如有一个房子的特征数据,假设使用一个函数f(x),能预测出该房子的房价,那么这个f(x)就是假设函数。
损失函数:通过假设函数f(x)推导出来的结果数据,有可能和实际存在的真实数据有差异,这时候就需要有一个函数来衡量这个差异的大小,这个函数就是损失函数。
虽然学习机器学习的初衷是想训练一个私人聊天机器人,而训练聊天机器人基本都是使用深度学习的方法,但这并不妨碍去了解一下其他的机器学习算法,所谓术业有专攻,深度学习并不是万能的,不同场景使用不同算法才是对的
从理念上讲,我觉得朴素贝叶斯算法最有意思,这个算法的核心观念是:事件的结果都不是确定性的而是概率性的,你所见到的只是概率最大的结果而已。
例如想要挑到一个保熟的瓜,那么常用的办法就是拍瓜听声,声音越沉闷瓜越保熟,声音越清脆,那么是生瓜蛋子的概率越大。朴素贝叶斯就能把「声音特征」概率化,结合西瓜其他特征数据训练出来一个模型,下次把西瓜的特征数据输入给这个模型,它就能返回「保熟」概率。
中文通常喜欢叫逻辑回归算法,它本质是一种分类算法,用来解决分类0/1问题,即把输入的特征转化为0和1这两种概率。
决策树算法是最接近程序员思维的算法,它由一系列if/else构成,在形式上类似于流程图,例如下图是一个分辨好学生与坏学生的决策树:
深度学习所使用的就是神经网络算法,「神经网络」这一词语来自于生物学,因为深度学习很多概念的灵感都来自于对大脑的理解,神经网络就是由很多神经元连接所构成的网络。虽然如此,但是没有任何证据能证明人脑的学习机制与机器的学习机制一样,千万不要将机器的学习方法套用在人脑上,小心走火入魔。
引用亚马逊网站对深度神经网络架构的介绍:
深度神经网络又名深度学习网络,拥有多个隐藏层,包含数百万个链接在一起的人工神经元。名为权重的数字代表节点之间的连接。如果节点之间相互激励,则该权重为正值,如果节点之间相互压制,则该权重为负值。节点的权重值越高,对其他节点的影响力就越大。
从理论上讲,深度神经网络可将任何输入类型映射到任何输出类型。但与其他机器学习方法相比,它们也需要更多大量的训练。它们需要数百万个训练数据示例,而不像较简单的网络那样,可能只需数百或数千个训练数据示例。
拓展阅读
本文作者:狄云
本文链接:
版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!