大数据技术基本概念和原理

作者:撒仲俏 | 发布日期:2024-07-02 05:43:39


1、   通常情况下,我们会按照结构模型把系统产生的数据分为三种类型:结构化数据、半结构化数据和非结构化数据。 结构化数据,即行数据,是存储在数据库里,可以用二维表结构来逻辑表达实现的数据。 最常见的就是数字数据和文本数据,它们可以某种标准格式存在于文件或记录的固定字段中。 相对应的,没有固定结构不方便用数据库二维逻辑表来表现的数据即称为非结构化数据,包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等等。

3、 1. 大数据是一个抽象的概念,指的是无法在有限时间内用常规软件工具进行获取、存储、管理和处理的数据集合。 2. 目前,业界对大数据的定义尚未统一,但普遍认为它具有四个主要特征,即数据体量巨大、数据速度快、数据类型繁多和数据价值密度低,这四个特征合称为“4V”。

2、 大数据的基本概念指那些数据量特别大、数据类别特别复杂的数据集,这种数据集不能用传统的数据库进行转存、管理和处理,是需要新处理模式才能具有更强大的决策力、洞察发现力和流程优化能力的海量、高增差率和多样化的信息资产。