还介绍了常用大数据挖掘建模工具。以解决某个应用的挖掘目标为前提,首先介绍案例背景并提出挖掘目标,接着阐述分析方法与过程,然后完成模型构建。在介绍建模过程时,穿插了操作训练,将相关的知识点嵌入到相应的操作过程中,这样能让读者轻松理解并掌握相关的理论和知识点。

10 多位技术专家凭借自己 10 多年的经验,以电信、航空、医疗等多个行业的实战案例作为主线,对如何基于架构技术进行大数据挖掘建模、数据分析和二次开发进行了深入浅出的讲解。
《大数据分析与挖掘实战》一共包含 16 章,这些章被分成了三个部分,分别是基础篇、实战篇以及高级篇。
基础篇包含第 1 至 6 章。第 1 章主要讲了数据挖掘的概述以及大数据在餐饮行业的应用。第 2 章对大数据的理论知识进行基础讲解,对安装和原理等做了简明扼要的介绍。第 3 章介绍了大数据仓库 Hive 的安装以及原理等内容。第 4 章介绍了大数据数据库 HBase 的安装以及原理等内容。第 5 章介绍了几种大数据挖掘建模平台,并且重点介绍了本书所使用的开源 TipDM-HB 大数据挖掘平台。第 6 章介绍了数据挖掘的建模过程,各种挖掘建模的常用算法与原理,以及它们在大数据挖掘算法库的实现原理。
实战篇的第 7 到 14 章,重点对大数据挖掘技术在法律咨询、电子商务、航空、移动通信、互联网、生产制造以及公共服务等这些行业的应用展开了分析。在案例结构的组织方面,本书先是介绍案例的背景与挖掘目标,接着阐述在大数据时代针对大数据的分析方法与过程,最后完成模型的构建,并且对建模过程等关键环节进行了细致的分析。最后通过上机实践,加深对大数据挖掘技术以及分析流程的认识。
高级篇(第 15 到 16 章),介绍了与大数据开发相关的技术以及开发的步骤。同时通过实例展示这些步骤,让读者能够亲自动手实践,体会到开发的乐趣。此外,还介绍了基于 TipDM-HB 大数据挖掘平台的二次开发实例。借助 TipDM-HB 大数据挖掘平台的二次开发工具,能够更快捷、高效地完成相关大数据应用的二次开发,降低开发难度,使读者更方便地感受到大数据分析与挖掘的强大魅力。
章节目录
<p style='margin-bottom:15px;color:#555555;font-size:15px;line-height:200%;text-indent:2em;'> <pre>前 言 基 础 篇 第1章 数据挖掘基础2 1.1 某知名连锁餐饮企业的困惑2 1.2 从餐饮服务到数据挖掘3 1.3 数据挖掘的基本任务4 1.4 数据挖掘建模过程4 1.4.1 定义挖掘目标4 1.4.2 数据取样5 1.4.3 数据探索6 1.4.4 数据预处理12 1.4.5 挖掘建模14 1.4.6 模型评价14 1.5 餐饮服务中的大数据应用15 1.6 小结15 第2章 Hadoop基础16 2.1 概述16 2.1.1 Hadoop简介16 2.1.2 Hadoop生态系统17 2.2 安装与配置19 2.3 Hadoop原理26 2.3.1 Hadoop HDFS原理26 2.3.2 Hadoop MapReduce原理27 2.3.3 Hadoop YARN原理28 2.4 动手实践30 2.5 小结33 第3章 Hadoop生态系统:Hive34 3.1 概述34 3.1.1 Hive简介34 3.1.2 Hive安装与配置35 3.2 Hive原理38 3.2.1 Hive架构38 3.2.2 Hive的数据模型40 3.3 动手实践41 3.4 小结45 第4章 Hadoop生态系统:HBase46 4.1 概述46 4.1.1 HBase简介46 4.1.2 HBase安装与配置47 4.2 HBase原理50 4.2.1 HBase架构50 4.2.2 HBase与RDBMS51 4.2.3 HBase访问接口52 4.2.4 HBase数据模型53 4.3 动手实践54 4.4 小结61 第5章 大数据挖掘建模平台62 5.1 常用的大数据平台62 5.2 TipDM-HB大数据挖掘建模平台63 5.2.1 TipDM-HB大数据挖掘建模平台的功能63 TipDM-HB 大数据挖掘建模平台的操作流程以及实例分别为 65 。 5.2.3 TipDM-HB大数据挖掘建模平台的特点67 5.3 小结68 第6章 挖掘建模69 6.1 分类与预测69 6.1.1 实现过程69 6.1.2 常用的分类与预测算法70 6.1.3 决策树71 Mahout 中 Random Forests 算法的实现原理是 75 。 6.1.5 动手实践79 6.2 聚类分析83 6.2.1 常用聚类分析算法83 6.2.2 K-Means聚类算法84 6.2.3 Mahout中K-Means算法的实现原理88 6.2.4 动手实践90 6.3 关联规则93 6.3.1 常用的关联规则算法93 6.3.2 FP-Growth关联规则算法94 Mahout 中 Parallel Frequent Pattern Mining 算法有着其特定的实现原理,该原理为 98 。 6.3.4 动手实践100 6.4 协同过滤102 6.4.1 常用的协同过滤算法102 6.4.2 基于项目的协同过滤算法简介102 Mahout 中 Itembased Collaborative Filtering 算法的实现原理是 103 。 6.4.4 动手实践106 6.5 小结109 实 战 篇 第7章 法律咨询数据分析与服务推荐112 7.1 背景与挖掘目标112 7.2 分析方法与过程114 7.2.1 数据抽取120 7.2.2 数据探索分析120 7.2.3 数据预处理125 7.2.4 模型构建130 7.3 上机实验139 7.4 拓展思考140 7.5 小结145 第8章 电商产品评论数据情感分析146 8.1 背景与挖掘目标146 8.2 分析方法与过程146 8.2.1 评论数据采集147 8.2.2 评论预处理150 8.2.3 文本评论分词155 8.2.4 构建模型155 8.3 上机实验167 8.4 拓展思考168 8.5 小结169 第9章 航空公司客户价值分析170 9.1 背景与挖掘目标170 9.2 分析方法与过程171 9.2.1 数据抽取174 9.2.2 数据探索分析174 9.2.3 数据预处理175 9.2.4 模型构建177 9.3 上机实验182 9.4 拓展思考183 9.5 小结183 第10章 基站定位数据商圈分析184 10.1 背景与挖掘目标184 10.2 分析方法与过程186 10.2.1 数据抽取186 10.2.2 数据探索分析187 10.2.3 数据预处理188 10.2.4 构建模型191 10.3 上机实验194 10.4 拓展思考195 10.5 小结195 第11章 互联网电影智能推荐196 11.1 背景与挖掘目标196 11.2 分析方法与过程197 11.2.1 数据抽取199 11.2.2 构建模型199 11.3 上机实验201 11.4 拓展思考202 11.5 小结203第12章 家电故障备件储备预测分析204 12.1 背景与挖掘目标204 12.2 分析方法与过程206 12.2.1 数据探索分析207 12.2.2 数据预处理209 12.2.3 构建模型212 12.3 上机实验216 12.4 拓展思考217 12.5 小结217 第13章 市供水混凝投药量控制分析218 13.1 背景与挖掘目标218 13.2 分析方法与过程220 13.2.1 数据抽取221 13.2.2 数据探索分析221 13.2.3 数据预处理223 13.2.4 构建模型227 13.3 上机实验237 13.4 拓展思考238 13.5 小结239 第14章 基于图像处理的车辆压双黄线检测240 14.1 背景与挖掘目标240 14.2 分析方法与过程241 14.2.1 数据抽取242 14.2.2 数据探索分析242 14.2.3 数据预处理242 14.2.4 构建模型249 14.3 上机实验250 14.4 拓展思考250 14.5 小结251 高 级 篇 第15章 基于Mahout的大数据挖掘开发254 15.1 概述254 15.2 环境配置255 15.3 基于Mahout算法接口的二次开发258 15.3.1 Mahout算法实例258 15.3.2 Mahout算法接口的二次开发示例259 15.4 小结271 第16章 基于TipDM-HB的数据挖掘二次开发272 16.1 概述272 TipDM-HB 大数据挖掘建模平台有服务接口 272 。 16.1.2 Apache CXF简介276 TipDM-HB 大数据挖掘建模平台有服务开发实例,该实例为 277。 16.2.1 环境配置277 16.2.2 开发实例280 16.3 小结288 参考资料289 </pre></p>
使用说明1、下载并解压,得出pdf文件
2、如果打不开本文件,请务必下载pdf阅读器
3、安装后,在打开解压得出的pdf文件
4、双击进行阅读试读
# 推广网站软文推荐
# 讲了
# 购物网站建设方案项目书
# 网站建设流程客户至上
# seo 网站优化工具
# 网站优化推广学习
# 深圳产品网站推广优化
# seo优化是什么部门
# 北京网站网络推广联系人
# 山西网站建设方案优化
# 济宁知名网站优化价格
# 参考资料
# 怎么网站推广优化
# 2019热搜关键词排名
# 抖音短视频seo价格
# 邢台网站关键词推广公司
# 许昌推广营销招聘
# seo代运营托管
# 网站营销推广价格
# 晋宁区ai营销推广方案
# 长春seo排名哪家实惠
# 哪里的网站建设便宜好用
# 成了
# Hadoop大数据分析与挖掘实战
# 电信、航空、医疗行业案例详解与操作指南
# 数据挖掘
# 互联网
# 本书
# 生态系统
# 等内容
# 进行了
# 餐饮服务
# 据分析
# Hadoop大数据分析与挖掘实战:电信、航空、医疗行业案例详解与操作指南
# 多个
# 实战篇
# 简明扼要
# 能让
# 几种
# 深入浅出
# 分别为
# 双击
# 体会到
相关文章:
高中英语语法知识点分布_如何利用薄冰高中英语语法详解快速掌握考点?
seo是什么最好,seo是干嘛的 ,嘉然 ai少女
警惕!骗子混入工作群冒充董事长*60万,咋回事?
公众号制作自动生成-让你轻松开启高效内容创作之旅
女性主动加男性好友意味着好感,后续行动全看你怎么选
全面掌控您的网站!WordPress后台操作页面全面解析
seo重点工作是什么,seo重点工作是什么意思 ,ai签名工具
SEO排名优化怎么样?助力企业在线竞争力提升的必由之路
微信藏隐私,别人拿手机易看信息?2 种方法教你悄悄给微信上锁
WordPress可以导入*信息插件:让你轻松打造*资源网站
体验“Chat18人工智能免费网页版”-让你的沟通更智能,生活更高效
seo软文有什么作用,seo文案是什么 ,ai写作到底多强大
公众号文章分类类目:精准定位,让你的内容更具吸引力
seo是什么意思SEO技术蜘蛛屯,seo ,ai椭圆框
SEO是什么化学,seo是啥意思啊 ,本科做AI
中山360排名优化价格,让您的品牌在搜索引擎中脱颖而出
中消协发布消费提示:惕免密支付风险,网购谨慎开启
SEO艺术:从基础到进阶,玩转搜索引擎优化
优化搜索曝光次数的方法,提升品牌曝光力!
现在下载工具哪个好|电脑版免费无广告实测推荐,2026年下载加速指南
免费AI自动生成作文不限次数,轻松提升写作效率!
seo有什么好用的,seo常用软件 ,ai128818
seo是指什么推广平台,什么是seo及seo的作用 ,冰棒AI制作
初中数学没学好,到高中之后还能跟上吗?_初中知识跟高中联系大吗,如何实现逆袭?
seo站内链接有什么作用,seo中网站内链的作用 ,ai绘画ai画图
资金周转不开怎么办?微粒贷是正规可靠的小额信贷首选!如何使用?
优化费用配置:提升企业效益的关键策略
SEO怎么优化比较好?全面提升网站排名的实用技巧
WordPress进入控制台,开启网站管理的无限可能
中考英语必考固定搭配_高频固定搭配词组及例句有哪些?
初中英语七年级电子版教材人教版怎么获取?这份2026年高清PDF版下载与使用全攻略请收好
董宇辉英语教学讲课视频到底怎么样?高中生看了真能快速提分吗?
seo是什么湖南岚鸿,seo是什么 湖南岚鸿 ,ai咖啡豆怎么画
SEO文件格式校验:提升网站优化的关键一步
人教版小学四年级数学应用题库中,为什么有超过70%的失分都集中在归一与归总问题?
seo网站页面优化包括什么,seo页面优化技术 ,ai看棋手的水平
手机搜狗输入法怎么修改皮肤?iPhone无法使用咋解决?
企业网站SEO策略:提升搜索引擎排名,助力企业增长
seo规范是什么意思,seo包括哪些内容 ,下载的模板怎么导入ai
上海关键词优化推广:提升企业在线曝光的最佳策略
seo有什么技术平台,seo有什么技术平台推广 ,怎么改ai写作痕迹
企业网络推广的目的与战略布局:如何借助数字营销助力品牌发展
seo要懂些什么,seo主要做什么的 ,德州ai照片
免费SEO插件助力网站优化,轻松提升排名与流量
女生主动加微信背后的多重意涵及应对策略解析
2025年高考英语3500词汇一遍过_30天计划如何制定?高频词汇怎样快速掌握?
SEO有哪些推广方式?助力网站排名提升的有效策略
中文AI文章识别技术,提升内容创作与管理效率的新时代
什么是继续新文章?为你的内容创作打开全新大门!
seo是什么职能做到的,seo是做什么工作内容 ,ai生成真实图
相关栏目:
【
网络营销44070 】
【
网络推广122852 】
【
网络优化116010 】
【
网址导航102054 】
【
网络技术82194 】
【
网络资讯43554 】