首页/ 科普/互联网+/ 数据科学家修炼指南
科普/互联网+
数据科学家修炼指南
作者:Allen B.Downey、Q. Ethan McCallum
出版社:人民邮电出版社有限公司

阅读

扫码读书
书籍信息目录(共533章)
本套装共包含《贝叶斯思维:统计建模的Python学习法》、《数据整理实践指南》、《数据科学家修炼之道》、《数据科学实战手册(R+Python)》4本书

【简介】这本书帮助那些希望用数学工具解决实际问题的人们,仅有的要求可能就是懂一点概率知识和程序设计。而贝叶斯方法是一种常见的利用概率学知识去解决不确定性问题的数学方法,对于一个计算机专业的人士,应当熟悉其应用在诸如机器翻译,语音识别,垃圾邮件检测等常见的计算机问题领域。 可是本书实际上会远远扩大你的视野,即使不是一个计算机专业的人士,你也可以看到在战争环境下(二战德军坦克问题),法律问题上(肾肿瘤的假设验证),体育博彩领域(棕熊队和加人队NFL比赛问题)贝叶斯方法的威力。怎么从有限的信息判断德军装甲部队的规模,你所支持的球队有多大可能赢得冠 军,在《龙与地下城》勇士中,你应当对游戏角色属性的**大值有什么样的期望,甚到在普通的彩弹射击游戏中,拥有一些贝叶斯思维也能帮助到你提高游戏水平。 除此以外,本书在共计15章的篇幅中讨论了怎样解决十几个现实生活中的实际问题。在这些问题的解决过程中,作者还潜移默化的帮助读者形成了建模决策的方法论,建模误差和数值误差怎么取舍,怎样为具体问题建立数学模型,如何抓住问题中的主要矛盾(模型中的关键参数),再一步一步的优化或者验证模型的有效性或者局限性。在这个意义上,这本书又是一本关于数学建模的成功样本。 随着数据科学的热门,数据的优化、整理以及如何处理不良数据成为人们关注的重点。本书通过处理不良数据,进行数据清理的案例,向读者展示了处理数据的方法。 本书共有19章,从6部分向读者展示了使用和清理不良数据背后的理论和实践。第 1部分是Grubby的动手实践指南,它向读者介绍了驾驭、提取数据的方法,如何处理文本数据中的数据以及Web开发中碰到的数据问题。第 2部分是让人充满意外的数据,它向读者介绍了数据也会“撒谎”。第3部分是方法,它向读者介绍了处理不良数据的一些方法。第4部分是数据存储和基础设施,它向读者介绍了如何存储数据。第5部分是数据的商业化,它向读者介绍了如何避免数据处理的一些误差。第6部分是数据策略,它向读者介绍了如何追踪数据、评估数据质量以及构建数据质量相关平台等。 本书适合数据科学家、数据处理和整理相关开发人员阅读。也适合想要进入数据处理领域的读者阅读。 数据科学家是指采用科学方法、运用数据挖掘工具寻找新的数据洞察的工程师,他们往往集技术专家和数据分析师的角色于一身。在IT行业中,数据科学家将在创造力、沟通能力以及与商业世界的联系方面得到更多的锻炼机会,是当前非常有发展潜力的新兴职位。 本书全面介绍了成为数据科学家应当了解的各类知识。全书共分18章,首先介绍了数据科学与大数据、数据科学的重要性,接着介绍了数据科学家的类型、思维体系、技术资质、经验、社交圈、所用的软件、学习新知和解决问题,另外还介绍了机器学习与R语言平台、数据科学的处理流程、所需的具体技能,介绍了数据科学求职、自我展示并提供了一些有关职业数据科学家和数据科学家的案例学习。 本书内容全面、轻松易读,非常适合从事数据科学相关工作的读者阅读,是一本可以住读者应聘数据科学家职位的求职指南。 这本书是基于R和Python的数据科学项目案例集锦,内容涵盖了基于数据科学的所有要素,包括数据采集、处理、清洗、分析、建模、可视化以及数据产品的搭建。案例包含了汽车数据分析、股票市场建模、社交网络分析、推荐系统、地理信息分析,以及Python代码的计算优化。通过手把手的案例解析,令读者知其然并知其所以然。业界的数据分析师、数据挖掘工程师、数据科学家都可以读一读。想要了解实际工作中如何用数据产生价值的在校学生,或者对数据科学感兴趣的人也值得一读。

同类书籍推荐
  • Windows Azure云计算实践
    赵书兰
  • 大数据改变世界
    李德伟
  • 连接未来:从古登堡到谷歌的网络革命
    汤姆·惠勒
  • 数据科学技术:文本分析和知识图谱
    苏海波