编辑
2023-12-01
机器学习
00
请注意,本文编写于 145 天前,最后修改于 20 天前,其中某些信息可能已经过时。

目录

人工智能与机器学习
什么是机器学习?
机器学习与深度学习
多说一嘴「预测」

人工智能与机器学习

人工智能的概念和基本原理诞生于1950年代的美国高校,但是那年代机器性能孱弱,基本不可能实现任何真正的人工智能,人工智能更多是以一种理论的方式存在。

早期人工智能的主流方法为「符号主义」,该方法认为只要程序员能编写足够多的规则,那么就能实现和人类水平相当的人工智能,典型如80年代左右的国际象棋程序就是用该方法实现的。

「符号主义」虽好,但是它只能解决有明确规则的问题,有些问题看起来规则很模糊例如语音识别、图像识别,符号主义就很难胜任了,于是一种新的方法出现了——机器学习。

image.png

什么是机器学习?

机器学习是一种从历史数据中自动分析获得规律,并利用规律对未知数据进行预测的方法。机器学习系统是「训练」出来的,而不是用明确规则编写出来的。

例如,机器要找到图片中的猫,那么就给机器学习各种各样猫的图片,机器学习算法通过将猫图片后面的各种向量特征全部总结为一个预测模型,当给这个模型一张新图片之后,它就开始预测新图片中包含猫的概率。

同样的道理,文字识别、语音识别都是用这种方法实现的,通常,给机器学习的数据量越大,机器预测的准确率就越高。

机器学习分为监督学习和非监督学习,这两者的差别就是是否有人对数据进行标注。

前几年曾经引起过讨论的「数据标注工人」,就是负责给各种数据打「标签」,然后喂养给机器的,有时候一个模型的准确率,背后就是靠无数「数据工人」的汗水换来的。

机器学习与深度学习

深度学习是机器学习的一个分支,深度学习的「深度」并不代表这种方法能获得更深层次的理解,而是指在深度学习模型中,数据被传输到输入层,最终在输出层中产生结果,而输入层与输出层之间存在很多隐藏层,每一层都会对数据的各个特征进行推断,这些所包含的层数被称为该模型的「深度」。

image.png

通常其他机器学习仅包含一两层,这些被称为「浅层学习」,而深度学习会包含数十层甚至上百层。深度学习的好处是可以用非监督学习或半监督学习(介于监督学习与非监督学习之间)来替代人工标注的方式来获取特征。

AlphaGo、ChatGPT、stable diffusion均是深度学习模型

多说一嘴「预测」

自古至今,预测都是一件伟大的事,甚至在神话中这是只有伟大的神才能有的能力,如果一个人能预知未来,那他往往会被称为先知或者预言家。

在历史上也曾有过「机械论」的高潮,万事万物都由一个“因”而决定了一个“果”,一个人的初始状态就已经决定了他的最终结果,牛顿曾经就拜倒在这种逻辑严密的世界观中,虽然这种观点,对于拥有自由意志的人类来说未免有点太绝望了。

但是,如果在物理世界中,能有一个函数,推导出整个宇宙的终极物理法则,这却是一件可以称之为攫取神力的事情。想想,巴西的一只蝴蝶扇动翅膀,可以预测出精确到经纬度上美国的一场大风暴,这将是一件何等伟大的事情。

主观世界不受物理法则约束,所以前两年李叫兽的营销实验失败了,客观世界的物理法则,却完全有可能真的存在那么一个函数。

本文作者:狄云

本文链接:

版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!