第286章 快跑

离语 semaphore 1667 字 1个月前

2�0�6数据存储与管理X利用计算机硬件和软件技术对数据进行有效的存

储和应用的过程Y其目的在于充分有效地发挥数据的作用

�0�5

3�0�6数据处理与分析X数据分析是指用适当的分析方法�0�5来自统计学

机器学习和数据挖掘等领域�0�6Y对收集来的数据进行分析Y提取有用信

息和形成结论的过程

�0�5

4�0�6数据可视化X将数据集中的数据以图形图像形式表示Y并利用数据

分析和开发工具发现其中未知信息的处理过程。

数据采集与预处理包含了数据采集和数据预处理两大任务

数据采集是指从传感器和智能设备企业在线系统企业离线

系统社交网络和互联网平台等获取数据的过程需要采集的

数据包括RFID数据传感器数据用户行为数据社交网络交

互数据及移动互联网数据等各种类型的结构化半结构化及非

结构化的海量数据

数据采集技术是大数据技术的重要组成部分Y已经广泛应用于

国民经济各个领域Y随着大数据技术的发展和普及Y大数据采

集技术会迎来更加广阔的发展前景。

数据预处理目标是为后续的数据分析工作提供可靠和高质量的

数据Y减少数据集规模Y提高数据抽象程度和数据分析效率

数据预处理任务主要包括数据清洗数据集成数据转换和数

据脱敏等经过这些步骤Y我们可以从大量的数据属性中提取

出一部分对目标输出有重要影响的属性Y降低源数据的维数Y

去除噪声Y为数据分析算法提供干净准确且有针对性的数据Y

减少数据分析算法的数据处理量Y改进数据质量Y提高分析效

率。

数据采集Y又称数据获取

Y是数据分析的入口Y也是数据分

析过程中相当重要的一个环节Y它通过各种技术手段把外部各

种数据源产生的数据实时或非实时地采集并加以利用。

传感器是一种检测装置Y能感受到被测量的信息Y并能将感受到的信息Y

按一定规律变换成为电信号或其他所需形式的信息输出Y以满足信息的传

输处理存储显示记录和控制等要求在工作现场Y我们会安装很

多的各种类型的传感器Y如压力传感器温度传感器流量传感器声音

传感器电参数传感器等等

�6�1传感器对环境的适应能力很强Y可以应对各种恶劣的工作环境在日常

生活中Y如温度计麦克风DV录像手机拍照功能等都属于传感器数据

采集的一部分Y支持图片音频视频等文件或附件的采集工作。

互联网数据的采集通常是借助于网络爬虫来完成的所谓网络爬虫

Y就