当前位置:首页 > 大数据 > 正文

大数据技术主要包含哪些内容

  • 数据源:包括社交媒体平台、云平台、网站资源、物联网(IOT)、数据库等,特点是分布式、异构性、多样性和流式产生。
  • 数据收集层:负责实时或近实时地收集数据,具有拓展性、可靠性、安全性和低延迟。
  • 数据存储层:负责海量结构化与非结构化数据的存储,具有拓展性、容错性和支多种存储模型。
  • 资源管理与服务协调层:资源管理负责集群资源共享和统一管理,服务协调层支分布式集群系统中各种通用功能。
  • 计算引擎层:根据不同应用场景设计计算引擎,包括批处理、交互式处理和实时处理。
  • 数据分析层:提供易用、高效、多样化的数据处理工具,如应用程序API、类SQL查询语言和数据掘SDK。
  • 数据可化层:运用计算机图形学和图像处理技术,将数据转换为图形或图像在屏幕上进行显示和交互。
  • 数据采集技术:如ETL工具,用于数据抽取、清洗、转换和集成。
  • 数据存取技术:包括关系数据库、NOSQL、SQL等。
  • 基础架构:包括云计算、分布式文件系统、大数据平台等。