R Cheat Sheet (5): Missing Values

在统计和数据分析中,丢失的值也具有重要的作用。不能简单地忽视这些丢失的值,而是要仔细分析,查找这些值丢失的原因,以及之它们之间所隐含的模式。 1. NA 在R中,用 NA 来表示不可用(not available)或者丢失(missing)的值。任何涉及 NA 的运算,结果都…
Read more

R Cheat Sheet (4): Vector

  R中的矢量(vector)可以分为两类:原子矢量(atomic vector)和列表(list),前者只包含同一种数据类型,后者则包含多种数据类型。根据所包含的数据类型,atomic vector有数字(numeric)、逻辑(logical)、字符(character)、整数(integer)、和复数(complex)等几类。 1. Numeric vector   Numeric vect…
Read more

R Cheat Sheet (3): Sequences of Numbers

1. 使用“:”运算符生成数字序列   可以使用“:”操作符生成数字序列:

   查看运算符的帮助文档,需要使用单引号“‘”:

2. 使用seq()函数生成数字序列   使用 seq() 函数也可以生成数字序列,…
Read more

R Cheat Sheet (1): Basic Building Blocks

R语言入门系列取材于Swirl Courses的R Programming部分(https://github.com/swirldev/swirl_courses),Swirl交互式的特点不便于查找和参考,在这里以Cheat  Sheet的形式总结出来,便于随查随用。 1. 计算   R可作为交互式的计算器使用,输入表达式即可求值。


Read more

使用VPS和Shadowsocks科学上网

  近来goagent越发地不好使了,VPN封死一片,在手机上常用的fqrouter也一度传出不再更新的消息,后来作者虽然坚持更新,但却无法在GooglePlay上下载应用。最近开始使用Shadowsocks实现科学上网,相关介绍可以参考Wiki: Shadowsocks 是一个安全的socks5代理,用于保护网络流量,是一个开源项目。通过客户端以指定的密码、加密方式和端口连接服务器,成功连接到服…
Read more

R语言中vapply()和tapply()的用法

  本文通过实例说明R语言*apply()系列中vapply()和tapply()的用法,所用到的数据同R语言中lapply()和sapply()的用法。在http://archive.ics.uci.edu/ml/machine-learning-databases/flags/flag.data下载到flag.data文件,将其导入R: [crayon-5d35c90688d862874667…
Read more

R语言中lapply()和sapply()的用法

  R语言中提供了一系列*apply()的函数,为数据分析中Split-Apply-Combine的策略提供了简洁方便的实现,这些函数的基本工作流程都是首先将数据按照某种规则划分(split)为较小的几部分,然后对各个部分应用(apply)某些操作,再将结果整合(combine)起来。关于Split-Apply-Combine策略的详细内容,可以参考Hadley Wickham的The Split…
Read more

利用R语言词法作用域特性缓存数据

  R语言采用词法作用域(lexical scoping,或称静态作用域static scoping),关于作用域的相关说明可以参考Wiki,这里先举一个例子说明R语言词法作用域的特点。   定义两个函数 g() 、 f() 以及一个变量[crayon-5d35c906894c8…
Read more