中,机器学习已经给我们在自动驾驶汽车,实用语音识别,有效的网络搜索,以及提高人类基因组的认识方面带来大量帮助。今天的机器学习是如此普遍,你可能使用它每天几十次却不了解它。许多研究人员也认为这是最好的达到真正的“人工智能”的
在90年代初,人们开始意识到一种可以更有效地构建模式识别算法的方法,那就是用数据(可以通过廉价劳动力采集获得)去替换专家(具有很多图像方面知识的人)。因此,我们搜集大量的人脸和
非人脸图像,再选择一个算法,然后冲着咖啡、晒着太阳,等着计算机完成对这些图像的学习,这就是机器学习的思想。“机器学习”强调的是,在给计算机程序(或者机器)输入一些数据后,它必须做一些事情,那就是学习这些数据,而这个学习的
步骤是明确的。
在21世纪中期,机器学习成为了计算机科学领域一个重要的研究课题,计算机科学家们开始将这些想法应用到更大范围的问题
上,不再限于识别字符、识别猫和狗或者识别图像中的某个目标等等这些问题。研究人员开始将机器学习应用到机器人(强化学习,操控,行动规划,抓取)、基因数据的分析和
金融市场的预测中。另外,机器学习与图论的联姻也成就了一个新的课题---图模型。每一个机器人专家都“无奈地”成为了机器学习专家,同时,机器学习也迅速成为了众人渴望的必备技能之一。然而,“机器学习”这个概念对底层算法只字未提。我们已经看到凸优化、核方法、支持向量机和Boosting算法等都有各自辉煌的时期。再
加上一些人工设计的特征,那在机器学习领域,我们就有了很多的方法,很多不同的思想流派,
根据吴恩达博士的分法,
将机器学习分为四类:监督学习、无监督学习、强化学习、迁移学习。
是利用已知类别的样本(即有标记的样本labeledsample,已知其相应的类别),调整分类器的参数,训练得到一个最优模型,使其达到所要求性能,再利用这个训练后的模型,将所有的输入映射为相应的输出,对输出进行简单的判断,从而实现分类的目的,这样,即可以对未知数据进行分类。
通俗的来讲,我们给计算机一堆选择题(训练样本),并同时提供了它们的标准答案,计算机努力调整自己的模型参数,希望自己推测的答案与标准答案越一致越好,使计算机学会怎么做这类题。然后再让计算机去帮我们做没有提供答案的选择题(测试样本)。
实现没有有标记的、已经分类好的样本,需要我们直接对输入数据集进行建模,例如聚类,最直接的例子就是我们常说的『人以群分,物以类聚』。我们只需要把相似度高的东西放在
一起,对于新来的样本,计算相似度后,按照相似程度进行归类就好。
通俗的来讲,我们给计算机一堆选择题(训练样本),但是不提供标准答案,计算机尝试分析这些题目之间的关系,对题目进行分类,计算机也不知道这几堆题的答案分别
是什么,但计算机认为每一个类别内的题的答案应该是相同的。
所谓强化学习就是智能系统从环境到行为映射的学习,以使奖励信号(强化信号)函数值最大,强化学习不同于连接主义学习中的监督学习,主要表现在教师信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统RLS(reinforcementlearningsystem)如何去产生正确的动作。
通俗的来讲,我们给计算机一堆选择题(训练样本),但是不提供标准答案,计算机尝试去做这些题,我们作为老师批改计算机做的对不对,对的越多,奖励越多,则计算机努力调整自己的模型参数,希望自己推测的答案能够得到更多的奖励。不严谨的讲,可以理解为先无监督后有监督学习。
考虑到大部分数据或任务是存在相关性的,所以通过transferlearning我们可以将已经学到的parameter分享给新模型从而加快并优化模型的学习不用像之前
那样learnfromzero。把已学训练好的模型参数迁移到新的模型来帮助新模型训练数据集。
为什么要用机器学习解决问题?
编辑本段
回目录
目前处于
大数据时代,到处都有成T成P的数据,简单规则处理难以发挥这些数据的
价值;廉价的高性能计算,使得基于大规模数据的学习时间和代价降低;廉价的大规模存储,使得能够更快地和代价更小地处理大规模数据;存在大量高价值的问题,使得花大量精力用机器学习解决问题后,能获得丰厚收益。
机器学习应该用于解决什么问题?
编辑本段
回目录
目标问题需要价值巨大,因为机器学习解决问题有一定的代价;
目标问题有大量数据可用,有大量数据才能使机器学习比较好地解决问题(相对于简单规则或人工);
目标问题由多种因素(特征)决定,机器学习解决问题的优势才能体现(相对于简单规则或人工);
目标问题需要持续优化,因为机器学习可以基于数据自我学习和迭代,持续地发挥价值。
深度学习vs机器学习vs模式识别
编辑本段
回目录
模式识别(Pattern recognition)、机器学习(machine learning)和深度学习(deep learning)代表三种不同的思想流派。模式识别是最古老的(作为一个术语而言,可以说是很过时的)。机器学习是最基础的(当下初创
公司和研究实验室的热点领域之一)。而深度学习是非常崭新和有
影响力的前沿领域,我们甚至不会去思考后深度学习时代。深度学习是机器学习的一种,是一种『抽象出的模型』在结构上比较特殊(有深度且可以堆叠,比如各类神经网络)的机器学习方法。
1)机器学习就像是一个真正的冠军一样持续昂首而上;
3)模式识别正在慢慢没落和消亡;
4)深度学习是个崭新的和快速攀升的领域。