当前位置:首页 > 大数据 > 正文

搭建自己的大数据平台

2、 一般的大数据平台从平台搭建到数据分析大概包括以下几个步骤:Linux系统安装。 分布式计算平台或组件安装。 数据导入。 数据分析。 一般包括两个阶段:数据预处理和数据建模分析。 数据预处理是为后面的建模分析做准备,主要工作时从海量数据中提取可用特征,建立大宽表。

1、 2、建立Hadoop集群 Hadoop作为一个开发和运行处理大规模数据的软件渠道,实现了在大量的廉价计算机组成的集群中对海量数据进行分布式计算。

3、 大数据平台的搭建步骤:1、linux系统安装 一般使用开源版的Redhat系统--CentOS作为底层平台。 为了提供稳定的硬件基础,在给硬盘做RAID和挂载数据存储节点的时,需要按情况配置。 2、分布式计算平台/组件安装 国内外的分布式系统的大多使用的是Hadoop系列开源系统。 Hadoop的核心是HDFS,一个分布式的文件系统。