Banner
首页 > 新闻动态 > 内容
互联网数据采集服务的六大特性
- 2019-03-22-

对于各种来源的数据,包括移动互联网数据、社交网络的数据等,这些结构化和非结构化的海量数据是零散的,也就是所谓的数据孤岛,此时的这些数据并没有什么意义,数据采集就是将这些数据写入数据仓库中,把零散的数据整合在一起,对这些数据综合起来进行分析。下面亿美奥跟大家普及下关于传感器数据采集的六大特性


完整性:

数据中不存在丢失或者不可用的数据。每项数据应标明数据来源和提供url截图便于事后查阅。

规范性:

每次数据应按统一的格式和数据结构进行存储。数据项和值在含义上保证一致,不存在数据的二义性或模糊性。

唯一性:

数据在属性方面不存在重叠,在数据因子方面不存在重复,相互关联的数据应保证数据完整性和关联正确性。

合法性:

数据是通过合法途径取得。都需要提供相关的数据分析报告,内容包括但不限于本次交付的数据内容、数据条数、时间范围等。

多样性

通过JSON、DMP、CSV、SQL、xml等文件格式进行在线传输或离线拷贝;

通用性

通过通用互联网上的API接口进行数据传输和访问。通用API接口要求具有元数据查询、数据高速访问和获取功能。