当前位置:首页 > 大数据 > 正文

大数据结构分为哪三种

4、 大数据包括结构化、半结构化和非结构化数据,非结构化数据越来越成为数据的主要部分。 据IDC的调查报告显示:企业中80%的数据都是非结构化数据,这些数据每年都按指数增长60%。

1、   通常情况下,我们会按照结构模型把系统产生的数据分为三种类型:结构化数据、半结构化数据和非结构化数据。 结构化数据,即行数据,是存储在数据库里,可以用二维表结构来逻辑表达实现的数据。 最常见的就是数字数据和文本数据,它们可以某种标准格式存在于文件或记录的固定字段中。 相对应的,没有固定结构不方便用数据库二维逻辑表来表现的数据即称为非结构化数据,包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等等。

3、 维度主要是三大类的数据结构:文本、时间、数值。 地区的上海、北京就是文本维度(也可以称为类别维度),销售额度就是数值维度,时间就是世界 数值维度可以通过其他维度加工计算得出,例如按地区维度,count出有多少是上海的,有多少是北京的。 维度可以互相转换。