本文共 856 字,大约阅读时间需要 2 分钟。
本节书摘来异步社区《机器学习项目开发实战》一书中的第1章,作者:【美】Mathias Brandewinder(马蒂亚斯·布兰德温德尔),更多章节内容可以访问云栖社区“异步社区”公众号查看
机器学习项目开发实战
构建自动识别数字图像的程序如果你打算建立一个当前技术热点的列表,机器学习当然会名列前茅。然而,虽然这个术语到处出现,但是它的真实含义往往含混不清。它是和“大数据”或者“数据科学”一样的东西吗?它和统计学有何不同之处?表面上,机器学习似乎是一种奇特、令人畏惧的专业,使用令人眼花缭乱的数学知识和算法,和软件工程师的日常活动没有多少共同之处。在本章以及本书余下的部分中,我的目标是和大家一起完成实际项目,以此阐明机器学习的原理。我们将循序渐进地解决问题,主要是从头开始编写代码。通过讲述这种方法,我们可以理解工作原理的细节,逐步说明广泛适用的核心思路和方法,并帮助你为以后构建专用程序库打下坚实的基础。在第1章中,我们将深入探讨一个经典问题——手写数字识别,同时完成以下几件工作:
建立适用于大部分机器学习问题的方法论。机器学习模型的开发与标准业务线应用程序有微妙的不同,将带来特殊的挑战。学到本章的最后,你将会理解交叉验证的概念、重要性以及使用方法。
帮助你理解如何“考虑机器学习”,以及如何看待机器学习问题。我们将讨论相似性和距离之类的思路,这些思路是大部分算法的核心。我们还将说明,虽然数学是机器学习的重要组成部分,但是这个方面可能被过分强调了,有些核心思路实际上相当简单。我们将从比较简单的算法开始,你会看到,这些算法实际上工作得很好!
了解如何用C#和F#解决问题。我们将从实现C#解决方案开始,然后提供F#的等价解决方案。F#是一种特别适合于机器学习和数据科学的.NET语言。
在第1章就碰上这样的问题,似乎会令人畏缩——但是不要被吓住!从表面上看这个问题很难,但是你将会发现,我们仅用相当简单的方法,就能够创建相当有效的解决方案。再说,解决小儿科的问题有什么意思?
转载地址:http://vobnm.baihongyu.com/