• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    公众号

R语言学习

原作者: [db:作者] 来自: [db:来源] 收藏 邀请

1. 前言 

前段时间,做些性能测试,需要画出一些测试结果图。简单学习了一下R语言,发现其很强大,因此在亚馬逊上买了3本关于R语言基础和用于数据挖掘方面的书籍。R在数理统计和数据挖掘提供了很多的类库,在进行这方面的分析都比较简单。

 无论在CentOS上或在Ubuntu上,安装R语言比较简单。在网上都有相关的资料,熟悉Linux系统都能很快地安装成功。

 下面我将列出我学习的数据集及其相关例子。

 2. 画图表

下面的数据集是分析每个请求的Latency,共有1024*1024个样本。第一列是样本序号,第二列是所耗时间(单位为nanosecond),它们用逗号分开:

0,420607

1,213869

2,214064

3,208029

... ...

1378,35022

1379,132206522

1380,50514

... ...

1048573,6418

1048574,6331

1048575,6104

绘简单的二维图表,R语言如下:

A <- read.table("sequentialWrite.txt", sep=",", col.names=c("seq", "nanos"), nrows=10000)
A$micros <- A$nanos/1000
A$nanos <- NULL
plot(A, type='l', xlab='Sequence', ylab='Latency', main='Latency per Request (Unit: Microsecond)')

 如下图:

 

 从图表上可以看出,绝大多数样本的Latency很小,有极少数样本值很大,导致即使采样1000条,也很难从图表上估测出这些样本值。为了使图表更加好看,应该只在图表上显示出规定的Latency值区间。R语言中的gap.plot函数可以解决这个问题。

3. 数理统计

 续...

4. 数据挖掘

 

 续...

 

 


鲜花

握手

雷人

路过

鸡蛋
该文章已有0人参与评论

请发表评论

全部评论

专题导读
上一篇:
多元回归与R语言实现发布时间:2022-07-18
下一篇:
R语言统计分析第一周发布时间:2022-07-18
热门推荐
热门话题
阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap