数据分析的工具千万种,综合起来万变不离其宗无非是数据获取数据存储数据管理数据计算数据分析数据展示等几个方面而SASRSPSSpythonexcel是被提到频率最高的数据分析工具。

Java只要了解一些基础即可,做大数据不需要很深的Java技术,学javaSE就相当于有学习大数据Linux因为大数据相关软件都是在Linux上运行的,所以Linux要学习的扎实一些,学好Linux对你快速掌握大数据相关技术会有很大的帮助,能让你更好的理解hadoophivehbasespark等大数据软件的运行环境和网络环境配置。

大数据平台最核心的软件是一Phoenix 这是一个Java中间层,可以让开发者在Apache HBase上执行SQL查询Phoenix完全使用Java编写,代码位于GitHub上,并且提供了一个客户端可嵌入的JDBC驱动Phoenix查询引擎会将SQL查询转换为一个或多个HBase scan,并编排执行以生成标准的JDBC结果集直接使用HBase API。

1Hadoop Hadoop是一个由Apache基金会所开发的分布式体系基础架构用户能够在不了解分布式底层细节的情况下,开发分布式程序充分利用集群的威力进行高速运算和存储Hadoop是一个能够对很多数据进行分布式处理的软件结构Hadoop 以一种牢靠高效可伸缩的方式进行数据处理2Apache Hive Hive是一个建立在。

#160SPSS和SAS都是商业统计才会用到的软件,为我们提供了经典的统计分析处理,能让我们更好的处理商业问题同时,SPSS更简单,但功能相对也较少,而SAS的功能就会更加丰富一点#160第二,对于数据挖掘来说,由于数据挖掘在大数据行业中的重要地位,所以使用的软件工具更加强调机器学习,常用的软件。