首页/ 科普/互联网+/ 分布式机器学习:系统、工程与实战
科普/互联网+
分布式机器学习:系统、工程与实战
作者:柳浩
出版社:电子工业出版社

阅读

扫码读书
书籍信息目录(共115章)
“弯道超车”需要建立在技术沉淀和产品实力之上,我们只有切实地扎根于现有的分布式机器学习技术体系,并对其进行深耕,才能为更好的创新和发展打下基础。

【简介】本书主要讲解分布式机器学习算法和开源框架,读者既可以从宏观的设计上了解分布式机器学习的概念和理论,也可以深入核心技术的细节设计中,对分布式机器学习形成深刻而直观的认识,做到学以致用。 本书共分为5篇,第1篇是分布式基础,首先介绍了分布式机器学习的概念、基础设施,以及机器学习并行化技术、框架和软件系统,然后对集合通信和参数服务器PS-Lite进行了介绍。第2篇是数据并行,以PyTorch和Horovod为主对数据并行进行分析,读者可以了解在具体工程领域内实现数据并行有哪些挑战和解决方案。第3篇是流水线并行,讲解了除模型划分之外,还通过引入额外的流水线来提高效率,以GPipe/PyTorch/PipeDream为例进行分析。第4篇是模型并行,首先对NVIDIA Megatron进行分析,讲解如何进行层内分割模型并行,然后讲解PyTorch 如何支持模型并行,最后介绍分布式优化器。第5篇是TensorFlow分布式,前面几篇以PyTorch为纲,结合其他框架/库来穿插完成,本篇带领大家进入TensorFlow分布式领域。

同类书籍推荐
  • Python编程入门(第3版)
    Toby Donaldson
  • C++ Primer Plus(第6版·中文版)
    Stephen Prata
  • Kafka入门与实践
    牟大恩
  • Python编程:从入门到实践
    Eric Matthes
  • Python编程:从入门到实践(第2版)
    埃里克·马瑟斯
  • Java编程讲义
    荣锐锋