了一种大规模数据点拟合方法,称之为DFP渐进迭代拟合方法。文中证明了该方法生成的极限曲线为初始数据点的最小二乘拟合曲线;它承袭了经典最小乘渐进迭代逼近算法的众多优良性质,如具备直观的几何意义、可灵活地拟合大规模数据点
2021-04-21 10:57
为提高大规模数据集生成树的准确率,提出一种预生成一棵基于这个数据集的决策树,采用广度优先遍历将其划分为满足预定义的限制的数据集,再对各数据集按照一定比例进行随机采样,最
2011-02-14 15:15
Spark MLlib 之 大规模数据集的相似度计算原理探索
2020-06-04 08:19
Map-Reduce工具;相似性搜索;数据流处理以及针对易丢失数据等特殊情况的专用处理算法;搜索引擎技术,如谷歌的PageRank;频繁项集挖掘;大规模高维数据集的聚类
2016-04-19 10:23
Map-Reduce工具;相似性搜索;数据流处理以及针对易丢失数据等特殊情况的专用处理算法;搜索引擎技术,如谷歌的PageRank;频繁项集挖掘;大规模高维数据集的聚类
2016-04-19 10:23
给大数据分析师的一双大礼 Apache Kylin和Superset
2019-08-22 14:33
阿里关涛谈大规模计算—从数字化阿里到数字化城市的进化
2019-05-16 07:46
顶替枯大规模夺顶替顶替
2018-01-05 18:50
华为大规模逻辑设计指导书
2015-04-20 13:41
本帖最后由 eyesee 于 2017-3-2 09:29 编辑 华为_大规模逻辑设计指导书
2017-03-01 11:56