< 机器学习与数据挖掘(周志华)_新闻中心_华体育app官网登录|华体会手机版
2025-04-12 新闻中心

  机器学习与数据挖掘 周 志 华 南京大学计算机软件新技术国家重点实验室,南京 210093 “机器学习”是人工智能的核心研究领域之一, 其最初的研究动机是为了让计算机系统具有人的 学习能力以便实现AI,因为众所周知,没有学习能力的系统很难被认为是具有智能的。目前被 广泛采用的机器学习的定义是“利用经验来改善计算机系统自身的性能” [1] 。事实上, 由于“经验”在 计算机系统中主要是以数据的形式存在的,因此机器学习需要设法对数据来进行分析,这就使得它逐渐 成为智能数据分析技术的创新源之一,并且为此而受到越来越多的关注。 “数据挖掘...

  机器学习与数据挖掘 周 志 华 南京大学计算机软件新技术国家重点实验室,南京 210093 “机器学习”是人工智能的核心研究领域之一, 其最初的研究动机是为了让计算机系统具有人的 学习能力以便实现人工智能,因为众所周知,没有学习能力的系统很难被认为是具有智能的。目前被 广泛采用的机器学习的定义是“利用经验来改善计算机系统自身的性能” [1] 。事实上, 由于“经验”在 计算机系统中主要是以数据的形式存在的,因此机器学习需要设法对数据做多元化的分析,这就使得它逐渐 成为智能数据分析技术的创新源之一,并且为此而受到慢慢的变多的关注。 “数据挖掘”和“知识发现”通常被相提并论,并在许多场合被认为是可以相互替代的术语。对 数据挖掘有多种文字不同但含义接近的定义, 例如 “识别出巨量数据中有效的、新颖的、潜在实用的、 最终可理解的模式的非平庸过程” [2] 。其实顾名思义,数据挖掘就是试图从海量数据中找出实用的知识。 大体上看,数据挖掘可以视为机器学习和数据库的交叉,它主要利用机器学习界提供的技术来分析海 量数据,利用数据库界提供的技术来管理海量数据。 因为机器学习和数据挖掘有密切的联系,受主编之邀,本文把它们放在一起做一个粗浅的介绍。 1 无处不在 随着计算机技术的飞速发展,人类采集数据、存储数据的能力得到了极大的提高,无论是科学研 究还是社会生活的各个领域中都积累了大量的数据,对这些数据来进行分析以发掘数据中蕴含的实用信 息,成为几乎所有领域的共同需求。正是在这样的大趋势下,机器学习和数据挖掘技术的作用日渐重 要,受到了广泛的关注。 例如,网络安全是计算机界的一个热门研究领域, 特殊是在入侵检测方面,不仅有不少理论成果, 还浮现了不少实用系统。 那末,人们如何进行入侵检测呢?首先,人们可以通过检查服务器日志等手 段来采集大量的网络访问数据,这一些数据中不仅包含正常访问模式还包含入侵模式。 然后,人们就可 以利用这一些数据建立一个可以很好地把正常访问模式和入侵模式分开的模型。这样,在今后接收到一 个新的访问模式时,就可通过这个模型来判断这一个模式是正常模式还是入侵模式, 甚至判断出具体 是何种类型的入侵。显然,这里的核心问题是如何利用以往的网络访问数据来建立可以对今后的访问 模式进行分类的模型,而这正是机器学习

CONTACT US
欢迎随时与我们联系