定义
利用计算机的运算能力,从大量的数据中发现一个“函数”或“模型”,并通过它来模仿事实世界事物间的关系,从而实现预测、判断等目标。建模的过程就是机器“学习”过程。
和传统程序的区别
传统程序员把已知的规定定义好后输出给机器的,而机器学习则从已知数据中,通过一直试错、自我优化、本身总结,演绎进去。传统程序是程序员来定义函数,而机器学习中是机器训练出函数。
标签
在机器学习中,自变量 x1,x2,x3,…,xn,就叫做特色(feature), 因变量 y 叫做标签(label)。而一些历史特色和一些历史标签的汇合,就是机器学习的数据集。当机器通过训练找到一个函数 / 模型,咱们还须要验证和评估,如果函数不好,就须要调整或者找新的函数 / 模型。
机器学习不肯定要标签,能够分为三种状况来划分:
训练数据集全副有标签,叫监督学习(supervised learning);
训练数据集没有标签,叫做无监督学习(unsupervised learing);
在训练数据集中,有的数据有标签,有的数据没有标签,咱们叫做半监督学习(semi-supervised learning)。
监督学习
监督学习被分为两类:回归问题和分类问题。
回归问题
标签是间断数值。比方预测房价、湿度、温度等。
分类问题
标签是离散性数值。比方预测今天是否会下雨、美国是否会被中国超过等。
无监督学习
目前它大多数只利用在聚类、降维等无限的场景中,往往作为数据预处理的一个子步骤显显身手。
半监督学习
半监督学习的原理、性能和流程与监督学习是很类似的,区别次要在于多了“伪标签的生成”环节,也是给无标签的数据人工“贴标签”。
很多问题无奈通过“监督”学习来解决,比如说你要设计一个机器人来陪你玩牌?这就须要强化学习了。
强化学习
强化学习和监督学习的差别在于:监督学习是从数据学习,而强化学习是从环境给它的奖惩中学习。
强化学习智能体在调整策略的时候须要思路比拟久远,它不肯定每次都明确地抉择最优动作,而是要在摸索(未知领域)和利用(以后常识)之间找到均衡。它重复试错、一直收集反馈,收集可供本人学习的信号,每通过一个训练周期,都变得比原来强一点,通过亿万次的训练变得十分弱小。《强化学习》第 2 版。
深度学习
深度学习是一种实用深层神经网络算法的机器学习模型,也能够利用于监督学习、半监督学习和无监督学习里,也能够利用于强化学习中。
长期以来,图形图像、自然语言和文本的解决是计算机行业的难题,因为这类信息的数据集,并不是结构化的,须要人工依据信息的类型来抉择特色进行提取,这样对于特色的提取是无限的,就拿图像来说,只能提取出一些简略的滤波器。
深度学习能对非结构化的数据集进行主动的简单特征提取,齐全不须要人工干预。