庫得克国际 Dr. Juergen Ude 罗平译
近来,机器学习非常流行,以至于被神化,就像新的“时尚”标准。纵观历史,曾经也有过许多“时尚”,比如:TQM、Kaizen、JIT、6 sigma、Analytics、AI 等。所有这些都产生了积极的影响,但同时也都没有得到炒作“时尚”时所描述的收益。很多应用以失败告终,也有一些取得了成功。
那么,什么是机器学习?
机器学习并不是一种真正的“时尚”,它是使用计算机性能的一种很自然的革命过程。不幸的是,它被视为一种时尚,和之前的“时尚”一样,机器学习的“力量”已经被夸大。
互联网上有很多关于机器学习的定义。本质上都认为机器学习是关于使用算法从数据中学习,然后做决策或预测未来。有人说,机器学习使用计算机而不需要专门的编程或不需要特定的公式或功能。这是错误的。
意识局限
在概念中使用“学习”一词,对于门外汉来说增强了机器学习的应用和功效。这里有一种暗示,机器学习的“学习”与人类学习相同,甚至更优于人类学习,特别是把机器学习与神经网络关联起来的时候。
事实上,没有计算机或机器能真正像人一样学习。当然,通过处理速度,计算机有时可以比人更快地学习,但也存在局限性。其他情况下,如模式识别,人类则优于计算机。计算机是没有自我意识的,也意识不到其所处的环境变化。自我意识影响人们有意愿从学习过程中获取的内容。我们想要吸收的内容取决于我们的 “直觉” 。如果感觉不对,我们更可能剔除这些信息。我们拥有应对不确定模糊环境的直觉。虽然在学术环境中这可能不受欢迎,但成功的商人和军事指挥官往往一致相信本能的学习和决策过程。
机器的力量只不过是计算机的数字运算能力与大量数据的存储相结合。所有计算机应用程序都依赖于机器的性能。机器学习和人工智能仅仅是一些应用。重要的是,要理解真正的能力不是来自机器或人类智能,而是两者的结合。是人类智能创建了计算机遵循的复杂算法。没有计算机的处理速度,算法将无效,没有算法,计算机将无效。
总之,人类学习是通过对经验和感受的认识。 机器学习是通过程序员编写的指令来模仿程序员提供的决策过程。
技术局限
表示算法包括回归分析、logistic回归、决策理论、神经网络。 估计算法包括诸如最小二乘法、似然法和似然的技术。 优化算法包括搜索算法、线性编程、动态编程和二次编程等。
这些技术大多已经存在超过一百年。即使是模仿动物神经系统的神经网络,也是在1940年代初次提出的。 logistic功能是在十九世纪发明的,也就是一百年前。
大多数技术存在许多问题,并且已经有大量关于这些问题的论文。 因此,更多地了解机器学习的力量是非常愚蠢的。 机器学习与使用的基础算法一样好,其中许多都有缺陷。 此外,可用的技术/算法并非都适用于所有问题。 机器学习取决于将技术与应用程序相匹配。 这取决于编程到系统中的人为判断。
机器学习应用程序
一些机器学习应用程序用于模式识别、图像识别、语音识别、统计套利、预测、医学诊断中。 所有这些都是基于有一定的可预测性和历史稳定性。 识别一个图片是房子,只有具备所有房屋的相似特性时才起作用。 只有在时间上存在稳定性模式时,预测才有效。 如果过去的模式不存在,就不可能预测未来。 有时不稳定性不直观明显。 一个例子是家庭用水,直观地看起来可能具有很高的模式重复性,但实际上并非如此。 季节性影响各不相同,入住率可能因同一家庭而异,疾病、压力影响厕所的使用可以改变水的消耗,园林布局的变化可以改变水的消耗。
结论
机器学习是一个强大的概念,但有时会被误解。 计算机不会有意识地学习,也永远不会。 程序员只是以算法的形式编写了一系列步骤,处理器必须遵循这些步骤来模仿人类识别过程。 效果取决于程序员和专家的技能。 除了程序员和专家考虑到的情况,其他情况算法无法应对。