David Woodruff - Algorithms for Big Data.

 
机器学习基础:大数据算法模型与应用
Algorithms for Big Data
 
  • 课题背景
算法(Algorithm)是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制。也就是说,能够对一定规范的输入,在有限时间内获得所要求的输出。如果一个算法有缺陷,或不适合于某个问题,执行这个算法将不会解决这个问题。不同的算法可能用不同的时间、空间或效率来完成同样的任务。一个算法的优劣可以用空间复杂度与时间复杂度来衡量。 算法中的指令描述的是一个计算,当其运行时能从一个初始状态和(可能为空的)初始输入开始,经过一系列有限而清晰定义的状态,最终产生输出并停止于一个终态。一个状态到另一个状态的转移不一定是确定的。随机化算法在内的一些算法,包含了一些随机输入。 而大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

  • 课题内容
本课程会介绍一些本科等级的典型算法设计和分析。我们将介绍经典算法技术,如动态程序设计、散列和数据结构, 分治算法,网络流和线性规划。我们还将涵盖范围广泛的分析工具,如recurrences、概率分析,平摊分析和势函数。除了学习算法,我们还会涉及一些复杂性理论的研究——双重的算法设计(下界方法在这些模型中的显示和最优算法)。最后,我们将讨论新模型在现代大型数据集下的应用,比如在线算法、机器学习和数据流。

  • 导师信息

David Woodruff
卡内基梅隆大学计算机系终身教授
(1)CMU 数据科学项目创建者及主席
(2)曾供职于 IBM Almaden 研究中心10年,IBM 技术学院首席科学家
(3)STOC 2013 以及 PODS 2010 最佳学术研究论文奖得主
(4)EATCS Presbuger(表彰计算机科学领域年度最卓越的年轻科学家) 奖得主
  • 拓展资料
David Woodruff-教授简历

机器学习基础:大数据算法模型与应用-课纲
 

在线
客服

在线客服9:00-24:00(北京时间)

客服
热线

400-860-5556
9:00-24:00(北京时间)

关注
微信

微信咨询项目详情

CIS (Cathaypath Institute of Science)
背景提升 | 留学背景提升 | 科研背景提升 | 背景提升项目
400-860-5556
Admission@torhea.org

  • 2020Neoscholar Education Group鄂ICP备16017918号-1

  • Disclaimers