Author Archive: nex3z

使用Visual Studio与Github协同工作

  本文主要介绍Github的一些基本操作,以及使用Visual Studio与Github协同工作的方法。 1. Fork a Repo   在Github上找到了感兴趣的项目,想要获取它的源代码,并在其基础上进行开发,首先要做的是复制一份项目的代码到自己的代码仓库(repository),即Fork。   首先进入所感兴趣项目页面,如图1所示,点击页面右上角的“Fork”按钮。   …
Read more

OCA/OCP Java Note (1): Java Building Blocks (1)

1. Understanding the Java Class Structure 1.1. Comments   注释有以下三种形式,其中最后一种用于Javadoc:

  对于多行注释,在一组 /*  和 */ 之间的多行内容都会被作为注释,要小心 /* 和 */ 不匹配的情况,如下面的代码无法编译: [crayon-5df301…
Read more

在Ubuntu 14.04上安装LAMP stack

  LAMP stack指的是一组开源程序,用于服务器host动态网页和网页app。具体来说,LAMP使用Linux操作系统和Apache Web服务器,数据存储在MySQL数据库中,动态内容由PHP处理。 0. 更新apt   以下的安装都使用了apt——Ubuntu的package manager来进行,首先需要进行一下updata: [crayon-5df3015e1181b26947825…
Read more

R Cheat Sheet (15): Base Graphics

相比于其他编程语言,R语言的最大优势之一是它能够很容易地绘制出版物级别的图像。本节的主要内容是R中的基础绘图,不包含如lattice、ggplot2和ggvis等更高级的绘图包。 首先载入 cars 数据框,并查看其文档:

[crayon-5df3015e11aff32364…
Read more

R Cheat Sheet (13): Simulation

使用像R一样的统计编程语言的好处之一,是其具备大量生成随机数的工具。 1. 随机采样 使用 sample() 函数可以生成随机数,下面的例子模拟了投掷一个六面骰子四次的结果,连续执行可以得到不同的结果:

其中第一个参数[crayon-5df3015e123f7373169249-i/…
Read more

R Cheat Sheet (12): Looking at Data

当拿到一个新的数据集时,首先要做的是检查一下数据,数据的格式是怎样的?有几个维度?有哪些变量?变量是如何存储的?有哪些丢失的数据?数据中是否有瑕疵?本节主要内容是使用R的内建函数解答以上问题。 本节中使用的数据集来自United States Department of Agriculture’s PLANTS Database (http://plants.usda.gov/adv_…
Read more

R Cheat Sheet (11): vapply and tapply

本文通过实例说明R语言*apply()系列中vapply()和tapply()的用法,所用到的数据同R语言中lapply()和sapply()的用法。在http://archive.ics.uci.edu/ml/machine-learning-databases/flags/flag.data下载到flag.data文件,将其导入R: [crayon-5df3015e12a94529996141…
Read more

R Cheat Sheet (10): lapply and sapply

R语言中提供了一系列*apply()的函数,为数据分析中Split-Apply-Combine的策略提供了简洁方便的实现,这些函数的基本工作流程都是首先将数据按照某种规则划分(split)为较小的几部分,然后对各个部分应用(apply)某些操作,再将结果整合(combine)起来。关于Split-Apply-Combine策略的详细内容,可以参考Hadley Wickham的The Split-A…
Read more