博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
《数据科学:R语言实现》——3.1 引言
阅读量:7235 次
发布时间:2019-06-29

本文共 418 字,大约阅读时间需要 1 分钟。

本节书摘来自华章出版社《数据科学:R语言实现》一 书中的第3章,第3.1节,作者:R for Data Science Cookbook 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。

3.1 引言

在之前的章节中,我们介绍了如何把各种来源的数据整合在一起。然而,只是采集数据并不够,还需要确保所采集数据的质量。如果数据的质量不高,分析的结果可能会由于有偏采样或缺失数据而误导大家。而且,如果采集的数据没有良好的结构化和形态,你会很难进行数据关联和分析。因此数据预处理和准备是数据分析前的基础性工作。

熟悉SQL操作的读者可能已经理解如何使用数据库来处理数据。例如,SQL允许用户使用插入操作添加新的记录,使用更新操作修改数据,使用删除操作移除记录。但是,我们并不需要把采集的数据放到数据库中,R已经提供了更强大和更方便的预处理函数和程序包。在本章中,我们会展示在R中执行数据预处理是如此的简单。

转载地址:http://kpmfm.baihongyu.com/

你可能感兴趣的文章
WinRAR命令行参数[转]
查看>>
Microsoft Enterprise Library 5.0 系列教程(三) Validation Application Block (高级)
查看>>
使用Container.ItemIndex获取Repeater、Gridview行的序号的简单方法
查看>>
F#系列随笔索引
查看>>
Mac OS X 10.10优胜美地怎样完美接管iphone上的电话和短信
查看>>
dotnet程序优化心得(一)
查看>>
妙趣横生的算法--二叉树
查看>>
发布了Android的App,我要开源几个组件!
查看>>
PHP foreach使用
查看>>
《基于MFC的OpenGL编程》Part 13 Creating 2D and 3D Text
查看>>
HTML5 移动浏览器支持
查看>>
[LeetCode] Next Closest Time 下一个最近时间点
查看>>
【AngularJS】—— 4 表达式
查看>>
[LeetCode] Surrounded Regions
查看>>
【Android布局】在程序中设置android:gravity 和 android:layout_Gravity属性
查看>>
U盘启动笔记本无法安装Win7问题和解决
查看>>
基于SignalR的站点有连接数限制问题及解决方案
查看>>
程序猿当下需要准备涉及的技术方向
查看>>
一起学微软Power BI系列-使用技巧(1)连接Oracle与Mysql数据库
查看>>
2017"百度之星"程序设计大赛 - 复赛1005&&HDU 6148 Valley Numer【数位dp】
查看>>