互联网大规模数据挖掘的目录

2023-12-13 13:29:30

目录 · · · · · ·
目  录

第1章  数据挖掘基本概念  1
1.1  数据挖掘的定义  1
1.1.1  统计建模  1
1.1.2  机器学习  1
1.1.3  建模的计算方法  2
1.1.4  数据汇总  2
1.1.5  特征抽取  3
1.2  数据挖掘的统计限制  4
1.2.1  整体情报预警  4
1.2.2  邦弗朗尼原理  4
1.2.3  邦弗朗尼原理的一个例子  5
1.2.4  习题  6
1.3  相关知识  6
1.3.1  词语在文档中的重要性  6
1.3.2  哈希函数  7
1.3.3  索引  8
1.3.4  二级存储器  10
1.3.5  自然对数的底e  10
1.3.6  幂定律  11
1.3.7  习题  12
1.4  本书概要  13
1.5  小结  14
1.6  参考文献  14
第2章  大规模文件系统及Map-Reduce  16
2.1  分布式文件系统  16
2.1.1  计算节点的物理结构  17
2.1.2  大规模文件系统的结构  18
2.2  Map-Reduce  18
2.2.1  Map任务  19
2.2.2  分组和聚合  20
2.2.3  Reduce任务  20
2.2.4  组合器  21
2.2.5  Map-Reduce的执行细节  21
2.2.6  节点失效的处理  22
2.3  使用Map-Reduce的算法  22
2.3.1  基于Map-Reduce的矩阵—向量乘法实现  23
2.3.2  向量v无法放入内存时的处理  23
2.3.3  关系代数运算  24
2.3.4  基于Map-Reduce的选择运算  26
2.3.5  基于M

文章来源:https://blog.csdn.net/weixin_43554580/article/details/134825991
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。