本书是在大数据与人工智能快速发展并对人们的科学研究、生活产生了重要影响的大形势下,结合教育部计算机公共课教指委提出的加强在校大学生计算思维能力培养的指导思想,为高等院校《大学计算机应用基础》类课程的教学而编写的。本书从信息处理与数据科学的视角入手,依据大学计算机公共课的课程体系及本书的设计理念,重点探索与分析了信息在计
1、本书通过典型案例的R语言实现,清晰解读教材中晦涩难懂的理论阐述与算法推导,让抽象的大数据落地到具体行业上,理论联系实际,实用性强。2、实验指导书中所有案例均来自医疗大数据研究室项目和培训积累,并且结合课堂体验和学习效果,从中精挑细选的典型案例。3、适合不同层次的读者。不仅适合高等院校的各相关专业的本专科生、研究生,
本书系统阐述了Hadoop大数据技术应用实践的原理、方法和应用相关知识,同时给出了每一章内容对应的实现指令或源程序。全书共九章内容。内容由浅入深,分为基础篇及提高篇两部分,其中第1章到第4章为基础篇,内容涵盖Hadoop初识简介、Hadoop基础环境搭建、分布式存储HDFS介绍以及MapReduce编程模型等知识,提高
本书详细介绍R语言实际应用所需的基本知识,包括R语言的基本开发环境、核心概念和数据处理等,并结合实际案例由潜入深,最后通过较大数据案例全面介绍R语言大数据的处理、分析与展示。该书从零起步,从读者处理大数据业务场景出发,基于实际案例组织内容,对于大数据学习者,该书覆盖了从零起步使用R语言对大数据分析所需要的全部核心内容。
本书分为基础篇和提高篇两部分,共7章,主要内容包括:Spark初识、Spark核心概念、Spark架构与执行流程、Spark流式计算、SparkSQL、Spark与机器学习、案例分析。
本书共分为10章,主要内容包括:大数据分析生命周期概述、数据采集、数据清洗、可视化工具、数据建模、模型评估与优化、出租车数据分析、音乐分类、知识图谱制作、电影评论情感分析。
本书是《数据科学与大数据技术导论实验》课程的实验教材,可以配合主教材使用。主要内容包括:Linux环境部署、Hadoop开发环境部署、网页数据采集、大数据去重、大数据*值计算、大数据排序、大数据倒排索引、大数据平均值计算、大数据单表关联、大数据可视化。本书选材先进、特点鲜明,注重应用。通过本书所提供的实验练习,可以提高
大数据技术是一个面向实际应用的技术。从大数据中获取有价值信息是大数据技术的精髓。本书详细介绍了数据科学与大数据技术的主要内容,全书分为15章,主要包括数据科学与大数据技术概述、数据处理与存储、数据抽取技术、数据清洗技术、数据转换技术、大数据约简技术、数据集成技术、数据分析技术、数据挖掘技术、分析结果解释、大数据机器学习
本书全面地介绍了大数据技术,尤其对大数据核心技术作了较深入的全面描述,并列举了大数据技术中所经常使用的几十个实用算法。主要内容包括大数据获取与存储、大数据抽取技术、大数据清洗技术、大数据集成技术、大数据挖掘技术、大数据分析技术、大数据解释技术 、流式计算技术与批量处理技术等.本书介绍的内容系统全面,介绍的算法简单实用,
本书内容涉及了大数据基础与应用的宽泛领域。全书共分17章,主要内容包括大数据概述、第四科研范式、分布系统设计中的CAP理论;大数据网络空间、MapReduce分布编程模型、大数据流式计算、大数据搜索技术、大数据存储、NoSQL数据库、大数据清洗技术、大数据分析、大数据挖掘、大数据可视化、大数据安全、大数据机器学习、大数
平台介绍|荣誉资质|联系我们|出版社登陆