在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
本节书摘来自华章计算机《数据科学R语言实践:面向计算推理与问题求解的案例研究法》一书中的第1章,第1.4节,作者:[美] 德博拉·诺兰(Deborah Nolan) 邓肯·坦普·朗(Duncan Temple Lang) 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.4 信号强度的分析我们已经使用了可视化和统计汇总等方法来帮助清洗和格式化数据。下面我们转向对响应变量—信号强度的特性的调研。在为IPS设计模型之前,我们需要更多地了解信号是如何表现的,以下提问将用于指导我们的调研。 从图1-6中,我们看到信号强度随着方向发生变化,不管它是属于近处的接入点还是属于远处的接入点。注意,我们已经删除了MAC为00:0f:a3:39:dd:cd的数据记录,因为在下一小节中,它被识别出是一个多余的地址。 其中,最小的值,如-98,对应于最弱信号,而最大的值,如-25,对应于最强的信号。 图1-6 每一个接入点对应于不同角度的信号强度。该图中的所有箱线图表示一个位置上的信号,该位置位于楼层平面图的左上角,即x=2,y=12。箱子的次序按照接入点与手持设备的角度排列。信号强度对角度的依赖性在一些接入点上表现得非常明显,例如右上图格中的00:14:bf:97:90 下面,我们为所有(x,y)、角度和接入点的组合创建一个数据框列表,操作如下: 图1-7 对于每个接入点,按照不同角度的信号分布。这里的密度曲线所表示的是在位置x=24,y=4上测量到的信号强度。这48个密度图代表每一个“接入点×角度”组合。每个图格大约有110个观测值。一些曲线看起来近似于正态分布,而其他许多曲线看起来是向左倾斜的 下面检查标准偏差,看它们是否随着平均信号强度的变化而变化。通过把avgSignal调整成类别型变量,我们为avgSignal各个分组绘制出关于sdSignal的箱线图。操作如下: 从图1-8可以看出,最弱的信号具有最小的标准偏差,SD呈现出随着平均信号强度的增大而增加的趋势。如果我们打算建立信号强度的行为模型,则需要考虑以上这些特性。 图1-8 对照于平均信号强度的信号强度SD标准偏差。画出了在每个“位置-角度-接入点”组合上检测到的信号的平均值和标准偏差。较弱的信号具有较低的变化性,而较强的信号具有较大的变化性 我们使用loess()函数对均值和中值之差进行局部平滑: 然后,我们使用拟合模型预测每个num值的差值,并将这个预测值添加到散点图上: 从图1-9中,我们看到这两个中心性度量值彼此相似。它们的差一般小于1~2dBm。 图1-9 信号强度的均值和中值的比较。这张平滑后的散点图显示了按照观测值的个数,每一个“位置-接入点-角度”组合的信号强度的均值和中值之差。这些差值接近于0,偏差一般为1~2dBm 我们使用颜色绘制地形图,即热度图(heat map)。fields程序包[6]使用薄板样条法,将在观测位置上的信号强度值拟合到一个表面上。这个程序包也提供使用热度图对该表面进行可视化的绘图子程序。fields程序包中的Tps()函数要求对每个(x,y)提供一个唯一的“z”值,因此,我们必须对信号强度进行汇总处理。offline数据在oneAPAngle变量中给出了每个位置上的大约100个记录值,我们建立offlineSummary的子集如下: 然后,加载fields程序库,调用Tps()将平均信号强度拟合到一个平滑表面上: 下面,我们使用predictSurface()函数,预测在观测点posX和posY网格之上的拟合表面的值,即 然后,我们使用plot.surface()函数,绘制预测的信号强度值如下: 最后,我们在图中加上进行测量的位置: 我们可以将这个绘图子程序包装成一个函数,从而可以对MAC地址和角度以及需要的其他绘图参数进行参数化。将该函数称为surfaceSS(),具有3个参量,data为离线的汇总数据框,mac和angle分别为MAC地址和角度,用于选择想要进行平滑和绘图的数据子集。我们用十几个MAC地址和角度调用surfaceSS()函数,并对它们进行比较。为此,我们先修改R的绘图参数,使得我们可以把4个等高线图放在同一张画板上,并减小分配给边界的尺寸,使得画板上有更多的空间用于绘制热度图。首先,把当前的绘图参数设置保存在parCur中,操作如下: 然后,使用mapply()函数对surfaceSS()函数执行4次调用: 最后,我们重新设置绘图参数: 我们在图1-10中看到,可以很容易地识别接入点的位置—那些位于“山脉”顶部的深红色区域。我们也能确认方向对信号强度的影响效果。此外,走廊效应也呈现出来。相对距离来说,沿着走廊的信号强度比其他地方更强,因为在那里信号没有被墙阻挡。 图1-10 在两个接入点和两个角度上的信号中值。这4个热度图提供了信号强度的平滑地形表示。上面的两张地图分别对应于接入点00:14:bf:b1:97:90的角度0埃ㄗ笸迹┖徒嵌?35埃ㄓ彝迹5紫碌牧秸诺赝挤直鸲杂τ诮尤氲?0:0f:a3:39:e1:c0的两个同样角度 下面,我们对楼层平面图上6个接入点的相关位置建立一个小矩阵。 注意,我们使用了MAC地址作为行的名字。即 这些行名可用于检索数据。 然后,我们使用这些差值找出手持设备与接入点位置之间的欧氏距离,执行如下操作: 最后,我们对每个接入点和设备方向,绘制一系列散点图,执行如下操作: 散点图如图1-11所示。在这些图中表现出曲线关系。进行对数转换也许能改进这种关系。但是,由于信号是负值,在进行转换时需要十分小心。我们将信号强度与距离之间的关系留给读者做进一步的调研。 图1-11 信号强度与接入点的距离的关系。48个散点图显示了对于每个设备的6个接入点和8个方向,信号强度与接入点的距离之间的关系。图中形状表明了在各张图中曲线关系是一致的 |
请发表评论