David Woodruff - Algorithms for Big Data.


 
机器学习基础:大数据算法模型与应用
Algorithms for Big Data
 
  • 课题背景
算法(Algorithm)是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制。也就是说,能够对一定规范的输入,在有限时间内获得所要求的输出。如果一个算法有缺陷,或不适合于某个问题,执行这个算法将不会解决这个问题。不同的算法可能用不同的时间、空间或效率来完成同样的任务。一个算法的优劣可以用空间复杂度与时间复杂度来衡量。 算法中的指令描述的是一个计算,当其运行时能从一个初始状态和(可能为空的)初始输入开始,经过一系列有限而清晰定义的状态,最终产生输出并停止于一个终态。一个状态到另一个状态的转移不一定是确定的。随机化算法在内的一些算法,包含了一些随机输入。 而大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
  • 课题内容
本课程会介绍一些本科等级的典型算法设计和分析。我们将介绍经典算法技术,如动态程序设计、散列和数据结构, 分治算法,网络流和线性规划。我们还将涵盖范围广泛的分析工具,如recurrences、概率分析,平摊分析和势函数。除了学习算法,我们还会涉及一些复杂性理论的研究——双重的算法设计(下界方法在这些模型中的显示和最优算法)。最后,我们将讨论新模型在现代大型数据集下的应用,比如在线算法、机器学习和数据流。
  • 导师信息

David Woodruff
卡耐基梅隆大学计算机系终身教授
(1)CMU 数据科学项目创建者及主席
(2)曾供职于 IBM Almaden 研究中心10年,IBM 技术学院首席科学家
(3)STOC 2013 以及 PODS 2010 最佳学术研究论文奖得主
(4)EATCS Presbuger(表彰计算机科学领域年度最卓越的年轻科学家) 奖得主
  • 任职大学
卡内基梅隆大学(Carnegie Mellon University)是一所位于美国宾夕法尼亚州匹兹堡的研究型私立大学。 在2018年泰晤士高等教育世界大学排行榜中,卡内基梅隆大学排名世界第20位,在同一机构的学科排名中,学校的计算机科学排名世界第六位,工程和技术排名第十二位,商学和经济学排名第十五位。在USNews发布的排行榜中,学校排名全美第25位,其中计算机科学排名全美第一位。截止2018年10月,学校的教员和校友中共有20人获得诺贝尔奖,12人获得图灵奖,22人获评美国艺术与科学院院士,19人进入美国科学促进会,72人入选美国国家学院。
  • 学习计划


  • 拓展资料
David Woodruff-教授简历

机器学习基础:大数据算法模型与应用-课纲
 

在线
客服

在线客服10:00-19:00(北京时间)

客服
热线

400-860-5556
10:00-19:00(北京时间)

关注
微信

微信咨询项目详情