semaphore提示您:看后求收藏(新笔趣阁www.xbqg5200.com),接着再看更方便。
数据采集与预处理包含了数据采集和数据预处理两大任务
数据采集是指从传感器和智能设备企业在线系统企业离线
系统社交网络和互联网平台等获取数据的过程需要采集的
数据包括RFID数据传感器数据用户行为数据社交网络交
互数据及移动互联网数据等各种类型的结构化半结构化及非
结构化的海量数据
数据采集技术是大数据技术的重要组成部分Y已经广泛应用于
国民经济各个领域Y随着大数据技术的发展和普及Y大数据采
集技术会迎来更加广阔的发展前景。
数据预处理目标是为后续的数据分析工作提供可靠和高质量的
数据Y减少数据集规模Y提高数据抽象程度和数据分析效率
数据预处理任务主要包括数据清洗数据集成数据转换和数
据脱敏等经过这些步骤Y我们可以从大量的数据属性中提取
出一部分对目标输出有重要影响的属性Y降低源数据的维数Y
去除噪声Y为数据分析算法提供干净准确且有针对性的数据Y
减少数据分析算法的数据处理量Y改进数据质量Y提高分析效
率。
数据采集Y又称 数据获取
Y是数据分析的入口Y也是数据分
析过程中相当重要的一个环节Y它通过各种技术手段把外部各
种数据源产生的数据实时或非实时地采集并加以利