• Hadoop——大数据处理的宠儿

    驱动大数据增长的主要因素包括移动设备和社交网络的大幅度增长、以往纸质文件的数字化以及科研数据的增长。“他们的存档文件正在高速增

    发布时间:2014-03-29 14:51:01
  • 大数据统一的批处理和流处理标准 Apache Beam

    Apache Beam 是 Apache 软件基金会越来越多的数据流项目中最新增添的成员,是 Google 在2016年2月份贡献给 Apache 基金会的孵化项目。

    发布时间:2016-11-14 13:34:10
  • Apache Spark:大数据处理统一引擎

    工业和研究中数据的大幅增长为计算机科学带来了巨大的机会与挑战。由于数据大小超过了单台机器的能力,用户需要新的系统将计算扩展到多个节点。因此,针对不同计算工作负载的新集群编程模型已呈爆炸式增长。

    发布时间:2016-11-17 14:21:43
  • 深入理解Apache Flink核心技术

    本文主要介绍了Flink项目的一些关键特性,Flink是一个拥有诸多特色的项目,包括其统一的批处理和流处理执行引擎,通用大数据计算框架与传统数据库系统的技术结合,以及流处理系统的诸多技术创新等

    发布时间:2016-11-21 13:50:21
  • Apache Kudu 1.1.0 发布,Hadoop 存储系统

    为了应对先前发现的这些趋势,有两种不同的方式:持续更新现有的Hadoop工具或者重新设计开发一个新的组件。

    发布时间:2016-11-22 14:07:49
  • 物流大数据哪家强?顺丰?菜鸟?京东?

    因为数据的多样性,然后我又想到了我们的思想,我总觉得每个人都有不同思想。这点跟在各行各业均存在大数据,但是众多的信息是纷繁复杂的一样,怎么处理、怎么分析、怎么总结其深层次的规律,变得尤为重要。

    发布时间:2016-11-22 14:49:58
  • 百度是如何使用hadoop的?

    百度在互联网领域的平台需求要通过性能较好的云平台进行处理了,Hadoop就是很好 的选择。在百度,Hadoop主要应用于以下几个方面

    发布时间:2016-12-09 13:43:13
  • 大数据处理系统关键层次架构

    在数据存储层,还有很多类似的系统和某些系统的变种,这里,我仅仅列出较为出名的几个。如漏掉某些重要系统,还请谅解。

    发布时间:2016-12-12 16:06:17
  • 分享:32个Hadoop问题及解决方案

    今天讲一讲关于Hadoop的问题、原因以及解决方法。

    发布时间:2016-12-16 17:07:32
  • 谷歌布局大数据:开源平台 Apache Beam 正式发布

    美国时间 1 月 10 日,Apache 软件基金会对外宣布,万众期待的 Apache Beam 在经历了近一年的孵化之后终于毕业。这一顶级 Apache 开源项目终于成熟。

    发布时间:2017-01-12 11:02:14
  • Apache Beam:下一代的数据处理标准

    ​本文主要介绍Apache Beam的编程范式——Beam Model,以及通过Beam SDK如何方便灵活地编写分布式数据处理业务逻辑,希望读者能够通过本文对Apache Beam有初步了解,同时对于分布式数据处理系统如何处理乱序无限数据流的能力有初步认识。

    发布时间:2017-01-13 13:52:13