大数据(Big Data)是指规模庞大、增长迅速且多样化的信息资产,它需要全新的处理模式来增强决策力、洞察发现力和流程优化能力。大数据的特征包括数据量大、类型繁多、价值密度低、速度快、时效高等。大数据的处理过程包括数据收集、数据预处理、数据处理与分析、数据可视化与应用环节。大数据的来源和采集主要包括Web数据、日志数据、数据库数据、其他数据(感知设备数据等)。大数据的存储技术主要采用分布式系统、NoSQL数据库等方式。大数据的计算问题主要涉及批处理、流处理和即席查询等计算引擎。大数据的价值主要体现在企业挖掘市场机会、提高决策能力、创新企业管理模式、变革商业模式、让每个人更加有个性以及智慧驱动下的和谐社会等方面。大数据的计算生态包括通用计算、定制开发、批量处理、实时计算、关系查询、图遍历以及机器学习等计算引擎。

大数据技术与应用深度解析