• Hadoop——大数据处理的宠儿

  驱动大数据增长的主要因素包括移动设备和社交网络的大幅度增长、以往纸质文件的数字化以及科研数据的增长。“他们的存档文件正在高速增

  发布时间:2014-03-29 14:51:01
 • 大数据处理的关键技术及应用

  数据处理是对纷繁复杂的海量数据价值的提炼,而其中最有价值的地方在于预测性分析,即可以通过数据可视化、统计模式识别、数据描述等数据挖掘形式帮助数据科学家更好的理解数据,根据数据挖掘的结果得出预测性决策。

  发布时间:2018-12-05 13:39:50
 • 大数据处理基本过程

  刚接触大数据一个月,把一些基本知识,总体架构记录一下,感觉坑很多,要学习的东西也很多,先简单了解一下基本知识

  发布时间:2018-12-10 10:19:00
 • Hadoop运行在Kubernetes平台实践

  Hadoop与Kubernetes就好像江湖里的两大绝世高手,一个是成名已久的长者,至今仍然名声远扬,一个则是初出茅庐的青涩少年,骨骼惊奇,不走寻常路,一出手便惊诧了整个武林。

  发布时间:2018-12-17 13:44:02
 • 为什么说 Pravega 是流处理统一批处理的最后一块拼图?

  工业物联网,车联网和实时欺诈风控的需求正在飞速的发展。越来越多的企业新应用,需要的是快速响应客户需求,并同时学习和适应不断变化的行为模式。

  发布时间:2018-12-19 15:13:41
 • Submarine:在Apache Hadoop中运行深度学习框架

  Hadoop 是用于大型企业数据集的分布式处理的最流行的开源框架,它在本地和云端环境中都有很多重要用途。

  发布时间:2019-01-04 10:31:07
 • Hadoop巨头完成合并,成为全球第二大开源软件公司

  去年 10 月份,大数据领域 Hadoop 巨头 Cloudera 与 Hortonworks 宣布合并,给业界带来不小震动。

  发布时间:2019-01-14 15:01:46
 • Spark SQL | Spark,从入门到精通

  Spark SQL 在 Hive 兼容层面仅依赖 HQL parser、Hive Metastore 和 Hive SerDe。也就是说,从 HQL 被解析成抽象语法树(AST)起,就全部由 Spark SQL 接管了。

  发布时间:2019-01-23 10:34:14
 • 开源 Pravega 架构解析:如何通过分层解决流存储的三大挑战?

  当前的大数据处理系统无论是何种架构都面临一个共同的问题,即:“计算是原生的流计算,而存储却不是原生的流存储” 。

  发布时间:2019-01-25 11:07:58
 • 饿了么研发总监:外卖大数据推荐算法中有哪些机制与手段?

  今天分享的内容分以下几个方面,首先是饿了么外卖推荐业务形态,然后是搜索推荐平台的目标与定位;接下来会聊聊在外卖推荐领域的特殊挑战,以及外卖推荐算法中的一些市场机制和调控手段。

  发布时间:2019-03-29 09:45:18
 • 快速搭建一超高性能的时序空间大数据处理平台

  一般的大数据解决方案都是 Kafaka + Redis + No SQL + Hadoop Spark,但这些套件都是用来处理通用的非结构化数据的,因此在处理结构化的时序空间数据时,运行效率就大打折扣,而且因为集成多个组件,开发效率低,运维成本也很高。

  发布时间:2019-09-11 13:50:17