• 未来大数据将进一步体现其价值

    日常生活中,能够制造出数据的领域遍布各个行业,商务贸易、在线视频图像资料、社交网络媒体信息、企业信息管理以及电子政务等等,都会涉及到大数据。

    发布时间:2014-08-22 16:38:00
  • 将大数据转化为大价值的10种途径

    当前,大数据显然已经登上了历史舞台——在全球范围内,拥有超过半数的企业组织都已经将大数据项目视为其未来发展的机遇,并计划在未来几年内进一步的增加对大数据项目的投资。

    发布时间:2018-05-07 13:57:36
  • 放弃支持 Python 2.x,已经有这些了

    自从去年 11 月份,Numpy 宣布准备从 2019 年 1 月 1 日起放弃支持 Python 2 后,陆续有很多 Python 库 框架跟进。比如:SciPy、matplotlib 和 Pandas。

    发布时间:2018-05-08 14:52:05
  • Hadoop 3.0版本测试,终将计算与存储解耦!

    传统的Hadoop架构是建立在相信通过大规模分布式数据处理获得良好性能的唯一途径是将计算带入数据。在本世纪初,这确实是事实。当时,典型的企业数据中心的网络基础架构不能完成在服务器之间移动大量数据的任务,数据必须与计算机共存。

    发布时间:2018-05-08 16:00:05
  • 大数据对比分析,技术面试里的那些门道

    众所周知,技术能力的评价是技术求职者的重要的一项指标。但是,求职者的面试表现到底是如何被判定的呢?怎样的面试分数统计才能更加靠谱地衡量求职者的真实水平呢?美国的在线技术面试平台 interviewing io 通过分析海量数据,给出了自己的答案。

    发布时间:2018-05-09 13:42:16
  • Spark的误解-不仅Spark是内存计算,Hadoop也是内存计算

    那么Spark的真正特点是什么?抛开Spark的执行模型的方式,它的特点无非就是多个任务之间数据通信不需要借助硬盘而是通过内存,大大提高了程序的执行效率。

    发布时间:2018-05-10 14:44:55
  • 数据科学家:如何在现实世界中应用大数据分析技术

    许多企业正在采用和部署大数据应用程序以获得竞争优势,但其中许多企业正在“在工作中学习”,尽其所能地反复试验,但所获得的结果不一。为了提供行业指导,行业媒体记者James Maguire与两位数据科学领域的专家进行了探讨与交流,讨论如何将这种快速发展的技术用于当今的业务。

    发布时间:2018-05-15 16:21:07
  • Google收购Cask Data,进一步强化大数据分析能力

    Google一直在努力围绕Google Cloud构建更深入的企业业务,但在推广和营收方面始终落后于亚马逊的AWS和微软的Azure。为了改变这一情况,谷歌最近收购了一家名为Cask Data的初创公司,该公司专门为基于Hadoop的大型数据分析服务提供解决方案。

    发布时间:2018-05-18 09:21:38
  • 大数据会简化或复杂化合规要求吗?

    2018年,全球各行业的合规标准正在发生变化。合规要求本身很难遵循。大数据的存在使事情更加复杂化。

    发布时间:2018-05-18 15:43:59
  • Python Matplotlib 绘图使用指南 (附代码)

    大多数人不会花大量时间去学 matplotlib 库,仍然可以实现绘图需求,因为已经有人在 stackoverflow、github 等开源平台上提供了绝大多数画图问题的解决方案。我们通常会使用 google 来完成绘图需求。至少我是这样。

    发布时间:2018-05-22 15:01:37
  • 在shell中如何判断HDFS中的文件目录是否存在

    在Linux文件系统中,我们可以使用下面的Shell脚本判断某个文件是否存在?但是我们想判断HDFS上某个文件是否存在咋办呢?别急,Hadoop内置提供了判断某个文件是否存在的命令?

    发布时间:2018-05-25 10:10:36