大数据技术和大数据资源的特点:数据量大(Volume)、类型繁多(Variety)、价值密度低(Value)、速度快、时效高(Velocity)。
1. 数据量大(Volume):第一个特征是数据量大,大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T)。
2. 类型繁多(Variety):第二个特征是数据类型繁多,包括网络日志、音频、视频、图片、地理位置信息等等,多类型的数据对数据的处理能力提出了更高的要求。
3. 价值密度低(Value):第三个特征是数据价值密度相对较低,如随着物联网的广泛应用,信息感知无处不在,信息海量,但价值密度较低,如何通过强大的机器算法更迅速地完成数据的价值“提纯”,是大数据时代亟待解决的难题。
4. 速度快、时效高(Velocity):第四个特征是处理速度快,时效性要求高,这是大数据区分于传统数据挖掘最显著的特征。