大数据存储方式有结构化、半结构化和非结构化数据存储和管理,轻量级数据库无法满足复杂的数据掘和分析存储和作,NoSQL文件系统、云数据库等。
结构化、半结构化和非结构化大数据的存储和管理无法满足复杂数据掘和分析的存储和作通常采用分布式文件系统。 NoSQL数据库、云数据库等
1分布式系统:分布式系统包含多个自治的处理单元,它们协同工作来完成给定的任务,通过计算机网络的互连可以更好地处理大规模任务。
主要包括以下两类:
1)分布式文件系统:存储管理需要多种技术协同工作,其中文件系统提供最底层的存储能力。 强力支。 HDFS分布式文件系统是一个高容错系统,专为批处理而设计,能够提供高吞吐量的数据访问。
2)分布式键值系统:分布式键值系统用于存储关系简单的半结构化数据。 常见的分布式键值系统有AmazonDynamo,而获得广泛应用和关注的对象存储技术(ObjectStorage)也可以认为是键值系统,它存储和管理对象而不是数据块。
2Nosql数据库:关系型数据库已经不能满足Web2.0的需求。 主要表现在:无法满足大规模数据管理的要求,无法满足高数据并发的要求,高规模高可用功能过低。 NoSQL数据库的优点:可以支大规模数据存储,其灵活的数据模型可以很好地支Web2.0应用,具有强大的水平扩展能力,具体包括:
3云数据库:基础云数据是基于云计算技术发展的一种基础设施共享的方法,是在云计算环境中使用和虚拟化的数据库。
上一篇:大数据存储数据库有哪些
下一篇:大数据存储模型主要有哪些