一般现在提到人工智能,人们都会想到机器学习和深度学习,但机器学习和深度学习真的就是的人工智能吗?深度学习算法与机器学习算法的核心在于“学习”这两个字,顾名思义,这类算法都是通过学习得到的。所谓“学习”,即大量的数据通过一个函数进行处理分析,找到相同得规则,然后再根据其他得数据分析出最可能得结果。我认为机器学习算法就是统计学习算法,统计学习方法有三要素:模型、策略和算法,这与机器学习的策略相同。即算法学习的对象是数据(data),它从数据出发,提取数据的特征,抽象出数据模型,发现数据中的知识,又回到数据的分析与预测中去。作为机器学习的对象,数据是多样性的,包括存在于计算机网络中的各种数字、文字、图像和视频等等。

机器学习的核心是“使用算法解析数据,从中学习,然后对世界上的某件事情做出决定或预测”。这意味着,与其显式地编写程序来执行某些任务,不如教计算机如何开发一个算法来完成任务。有三种主要类型的机器学习:监督学习、非监督学习和强化学习。

监督学习:判断是否是监督学习,就看输入数据是否有标签。输入数据有标签,则为有监督学习,没标签则为无监督学习。监督学习涉及一组标记数据。计算机可以使用特定的模式来识别每种标记类型的新样本。监督学习的两种主要类型是分类和回归。在分类中,机器被训练成将一个组划分为特定的类。分类的一个简单例子是电子邮件帐户上的垃圾邮件过滤器。过滤器分析你以前标记为垃圾邮件的电子邮件,并将它们与新邮件进行比较。如果它们匹配一定的百分比,这些新邮件将被标记为垃圾邮件并发送到适当的文件夹。那些比较不相似的电子邮件被归类为正常邮件并发送到你的邮箱。第二种监督学习是回归。在回归中,机器使用先前的(标记的)数据来预测未来。天气应用是回归的好例子。使用气象事件的历史数据(即平均气温、湿度和降水量),你的手机天气应用程序可以查看当前天气,并在未来的时间内对天气进行预测。

在无监督学习中,数据是无标签的。由于大多数真实世界的数据都没有标签,这些算法特别有用。无监督学习分为聚类和降维。聚类用于根据属性和行为对象进行分组。这与分类不同,因为这些组不是你提供的。聚类的一个例子是将一个组划分成不同的子组(例如,基于年龄和婚姻状况),然后应用到有针对性的营销方案中。降维通过找到共同点来减少数据集的变量。大多数大数据可视化使用降维来识别趋势和规则。

最后,强化学习使用机器的个人历史和经验来做出决定。强化学习的经典应用是玩游戏。与监督和非监督学习不同,强化学习不涉及提供“正确的”答案或输出。相反,它只关注性能。这反映了人类是如何根据积极和消极的结果学习的。很快就学会了不要重复这一动作。同样的道理,一台下棋的电脑可以学会不把它的国王移到对手的棋子可以进入的空间。然后,国际象棋的这一基本教训就可以被扩展和推断出来,直到机器能够打(并最终击败)人类顶级玩家为止。

机器学习关于数据的基本假设是同类数据具有一定的统计特性,这是机器学习的前提,这里同类数据是指具有某种共同特性的数据。正因为它们具有统计特性,所以通过学习后的算法才具有有效性。例如图像识别算法,我们首先使用大量包括人和猫的图片对学习算法进行训练,训练时我们必须告诉模型那些图片是人那些图片是猫,因为算法能够从大量的图片中学习到猫和人的区别,当我们给训练好的模型输入一副其他猫或人的图片,此时模型能够正确分辨出猫和人。从以上例子我们可以看出机器学习存在局限性,即我们训练好的模型只能够分辨猫和人,这有点像学生学习知识一样,但又有点不同,不同之处是学生学习知识之后能够记忆下来或者能够举一反三,而机器学习不能这样,这就表明真正的人工智能不仅仅需要体现在学习上,而是体现在学习之后能够把学习的知识记忆起来并且能够灵活运用,我认为这样的算法才是真正的人工智能。