清华大学-大数据平台核心技术课程

  • 名称:清华大学-大数据平台核心技
  • 分类:电脑网络  
  • 观看人数:加载中
  • 时间:2017/8/15 9:17:05

          课程简介:
当前全球的数据量每年正在以60%的速度递增,而据IDC统计,在2020年数据的总量将达到40个ZB,很快我们也将跨入YB的时代。清华大学-大数据平台核心技术简介
当前人,机,物三元世纪的高度融合引发了数据规模的爆炸式增长和数据模式的高度复杂化,世界已经进入网络化的大数据时代,也就是Big Data时代,我们注意到在这个大背景下从公司战略到产业生态,从学术研究到生产实践,从城镇管理到国家治理,都因为大数据而发生着本质的变化,而采集到的原始数据往往是一些零金碎玉,缺乏逻辑,需要通过不同的逻辑方式进行集成融合,从不同的角度解释和挖掘才能得出前人所未知的大价值。该课程也是清华大学首门校内教授和业界专家合作授课的课程,有清华大学计算机系副主任武永卫教授和阿里云公司技术专家联合主讲。课程内容包括:
清华大学-大数据平台核心技术目录
第一讲 大数据和ODPS
第二讲 分布式存储
第三讲 资源管理与任务调度
第四讲 分布式编程模型的设计与演化
第五讲 离线分布式关系型计算
第六讲 全局数据管理与调度
第七讲 流式计算的系统设计与实现
第八讲 内存计算
第九讲 大规模数据的分布式机器学习平台
此外课程还设计了三个实验环节,依托学堂在线平台、阿里云服务器,学习者通过网络即可在线实验。