原理戳这里:
超爱学习:机器学习算法-MDS降维算法zhuanlan.zhihu.com
1度量MDS
衡量距离用欧式距离,对鸢尾花数据进行降维:
library(stats)
library(ggplot2)
iris = iris
dis_iris = dist(iris[,1:4],p = 2)
mds_x = cmdscale(dis_iris)
mds_x = data.frame(mds_x)
xy = cbind(mds_x, iris[,5])
ggplot(xy, aes(x=X1,y=X2,colour = iris[, 5]))+geom_point()
图1使用欧式距离对鸢尾花数据进行MDS降维
2度量MDS
衡量距离使用曼哈顿距离,对鸢尾花数据降维
library(stats)
library(ggplot2)
iris = iris
dis_iris = dist(iris[,1:4],'manhattan')#曼哈顿距离
mds_x = cmdscale(dis_iris)
mds_x = data.frame(mds_x)
xy = cbind(mds_x, iris[,5])
ggplot(xy, aes(x=X1,y=X2, colour = iris[,5]))+geom_point()
图2 使用曼哈顿距离对鸢尾花数据进行MDS降维
3美国10个城市的分布
已知美国十个城市之间的直线距离,用MDS推测10个城市的分布
library(stats)
library(ggplot2)
#UScitiesD #美国十个城市直线距离
mds_x = cmdscale(UScitiesD,k=2)
plot(x = mds_x[,1], y=mds_x[,2], type='n', xlim = c(-1700, 1500))
cities = attr(UScitiesD, "Labels")
text(-mds_x[,1], -mds_x[,2], cities, cex = .7)
图3 MDS根据城市之间的距离得到城市之间的相对分布
图4 美国10个城市实际分布情况
|
请发表评论