【caffe-matlab】权重以及特征图的可视化

原作者: [db:作者] 来自: [db:来源] 收藏邀请

转自 http://blog.csdn.net/zb1165048017/article/details/52643188

前言

移植了各种caffe，是时候进行下一步操作了，先拿可视化下手吧。大部分内容可能跟网上的方法不一样，大家看完我的博客最好去网上看看大牛们的博客，万一被我误导了，就罪过了o(╯□╰)o，开更.............

环境：微软caffe+wind7+matlab2013a

参考：http://caffe.berkeleyvision.org/tutorial/interfaces.html

http://nbviewer.jupyter.org/github/BVLC/caffe/blob/master/examples/00-classification.ipynb

一、模型读取

读取bvlc_reference_caffenet 的模型结构以及训练好的参数，注意此处的模型结构为deploy，而非train时候的。

[cpp] view plain copy print?

addpath('..') %加入+caffe路径
caffe.set_mode_cpu();%设置CPU模式
model = '../../models/bvlc_reference_caffenet/deploy.prototxt';%模型
weights = '../../models/bvlc_reference_caffenet/bvlc_reference_caffenet.caffemodel';%参数
net=caffe.Net(model,'test');%测试
net.copy_from(weights); %得到训练好的权重参数
net %显示net的结构

然后我们就可以看到模型的结构了：

[cpp] view plain copy print?

net =
Net with properties:
layer_vec: [1x24 caffe.Layer]
blob_vec: [1x15 caffe.Blob]
inputs: {'data'}
outputs: {'prob'}
name2layer_index: [24x1 containers.Map]
name2blob_index: [15x1 containers.Map]
layer_names: {24x1 cell}
blob_names: {15x1 cell}

这里额外提一下，net 通过"." 能显示的东西，除了上面输出的这些properties外，还有Net.m中定义的函数

[cpp] view plain copy print?

function self = Net(varargin)
function layer = layers(self, layer_name)
function blob = blobs(self, blob_name)
function blob = params(self, layer_name, blob_index)
function forward_prefilled(self)
function backward_prefilled(self)
function res = forward(self, input_data)
function res = backward(self, output_diff)
function copy_from(self, weights_file)
function reshape(self)
function save(self, weights_file)

我们在matlab中进行操作的基础也就是这些函数，当然还有其它的，以后慢慢接触吧。

二、输入数据整理

嗯，还是拿这只猫开刀，这只猫一般藏在E:\CaffeDev\caffe-master\examples\images\cat.jpg，没找到的话直接右键保存下方图片

先说一下过程：

①先把均值读进来

[cpp] view plain copy print?

d = load('../+caffe/imagenet/ilsvrc_2012_mean.mat');
mean_data = d.mean_data;

②读取图片

[cpp] view plain copy print?

im = imread('../../examples/images/cat.jpg');%读取图片
IMAGE_DIM = 256;%图像将要resize的大小，建议resize为图像最小的那个维度
CROPPED_DIM = 227;%待会需要把一张图片crops成十块，最终softmax求出每一块可能的标签

设置在输入网络之前需要将图片resize的大小，一般我们会取图片长宽最小的那个，其次需要设置的是输入网络的图片的大小，注意与deploy.prototxt的输入一致，比如

[cpp] view plain copy print?

name: "CaffeNet"
layer {
name: "data"
type: "Input"
top: "data"
input_param { shape: { dim: 10 dim: 3 dim: 227 dim: 227 } }
}

这里关注一下input_param，代表一次输入十张图片，每张图片三通道，每张图片大小是227*227。此外注意一下，在opencv中，彩色图像按照BGR存储，而matlab中读取的顺序一般是RGB。所以对这只猫需要进行如下处理：

[cpp] view plain copy print?

im_data = im(:, :, [3, 2, 1]); %matlab按照RGB读取图片，opencv是BGR，所以需要转换顺序为opencv处理格式
im_data = permute(im_data, [2, 1, 3]); % 原始图像m*n*channels,现在permute为n*m*channels大小
im_data = single(im_data); % 强制转换数据为single类型
im_data = imresize(im_data, [IMAGE_DIM IMAGE_DIM], 'bilinear'); % 线性插值resize图像

注意一下你在训练的train.prototxt中的预处理部分

[cpp] view plain copy print?

transform_param {
mirror: true
crop_size: 227
mean_file: "data/ilsvrc12/imagenet_mean.binaryproto"
}

这里最后一行代表进行了零均值处理，关于这一部分参数，可以看我前面用classification,exe手写识别时候提到的那个博客，介绍了如何看这一部分进行了怎样的预处理。

先零均值化一下，然后按照deploy和train的prototxt，将这只猫crop(分成)十块，采用的是classification.demo的分割方法，分别取猫的上下左右四个角以及中心的大小为deploy中提到的227*227大小。这是五个，然后再对图片翻转180°；合起来就是代表这只猫的十张图片：

[cpp] view plain copy print?

im_data = im_data - mean_data; % 零均值
crops_data = zeros(CROPPED_DIM, CROPPED_DIM, 3, 10, 'single');%注意此处是因为prototxt的输入大小为宽*高*通道数*10
indices = [0 IMAGE_DIM-CROPPED_DIM] + 1;%获得十块每一块大小与原始图像大小差距，便于crops
%下面就是如何将一张图片crops成十块
n = 1;
%此处两个for循环并非是1：indices，而是第一次取indices(1)，然后是indices(2)，每一层循环两次
%分别读取图片四个角大小为CROPPED_DIM*CROPPED_DIM的图片
for i = indices
for j = indices
crops_data(:, :, :, n) = im_data(i:i+CROPPED_DIM-1, j:j+CROPPED_DIM-1, :);%产生四个角的cropdata，1 2 3 4
crops_data(:, :, :, n+5) = crops_data(end:-1:1, :, :, n);%翻转180°来一次，产生四个角的翻转cropdata，6 7 8 9
n = n + 1;
end
end
center = floor(indices(2) / 2) + 1;
%以中心为crop_data左上角顶点，读取CROPPED_DIM*CROPPED_DIM的块
crops_data(:,:,:,5) = ...
im_data(center:center+CROPPED_DIM-1,center:center+CROPPED_DIM-1,:);
%与for循环里面一样，翻转180°，绕左边界翻转
crops_data(:,:,:,10) = crops_data(end:-1:1, :, :, 5);

可视化看看长啥样：

[cpp] view plain copy print?

clear
clc
close all
%caffenet的解读：http://www.2cto.com/kf/201606/515700.html
%% 设置网络
addpath('..') %加入+caffe路径
caffe.set_mode_cpu();%设置CPU模式
model = '../../models/bvlc_reference_caffenet/deploy.prototxt';%模型
weights = '../../models/bvlc_reference_caffenet/bvlc_reference_caffenet.caffemodel';%参数
net=caffe.Net(model,'test');%测试
net.copy_from(weights); %得到训练好的权重参数
net %显示net的结构
%% 预处理
d = load('../+caffe/imagenet/ilsvrc_2012_mean.mat');
mean_data = d.mean_data;%读取均值
im = imread('../../examples/images/cat.jpg');%读取图片
IMAGE_DIM = 256;%图像将要resize的大小，建议resize为图像最小的那个维度
CROPPED_DIM = 227;%最终需要把一张图片crops成十块，最终求出每一块可能的标签
im_data=im;
im_data = im(:, :, [3, 2, 1]); %matlab按照RGB读取图片，opencv是BGR，所以需要转换顺序为opencv处理格式
im_data = permute(im_data, [2, 1, 3]); % 原始图像m*n*channels,现在permute为n*m*channels大小
im_data = single(im_data); % 强制转换数据为single类型
im_data = imresize(im_data, [IMAGE_DIM IMAGE_DIM], 'bilinear'); % 线性插值resize图像
% im_data = im_data - mean_data; % 零均值
crops_data = zeros(CROPPED_DIM, CROPPED_DIM, 3, 10, 'single');%注意此处是因为prototxt的输入大小为宽*高*通道数*10
indices = [0 IMAGE_DIM-CROPPED_DIM] + 1;%获得十块每一块大小与原始图像大小差距，便于crops
%下面就是如何将一张图片crops成十块
n = 1;
%此处两个for循环并非是1：indices，而是第一次取indices(1)，然后是indices(2)，每一层循环两次
%分别读取图片四个角大小为CROPPED_DIM*CROPPED_DIM的图片
for i = indices
for j = indices
crops_data(:, :, :, n) = im_data(i:i+CROPPED_DIM-1, j:j+CROPPED_DIM-1, :);%产生四个角的cropdata，1 2 3 4
crops_data(:, :, :, n+5) = crops_data(end:-1:1, :, :, n);%翻转180°来一次，产生四个角的翻转cropdata，6 7 8 9
n = n + 1;
end
end
center = floor(indices(2) / 2) + 1;
%以中心为crop_data左上角顶点，读取CROPPED_DIM*CROPPED_DIM的块
crops_data(:,:,:,5) = ...
im_data(center:center+CROPPED_DIM-1,center:center+CROPPED_DIM-1,:);
%与for循环里面一样，翻转180°，绕左边界翻转
crops_data(:,:,:,10) = crops_data(end:-1:1, :, :, 5);
cat_map=zeros(CROPPED_DIM*2,CROPPED_DIM*5,3);%两行五列展示
cat_num=0;
for i=0:1
for j=0:4
cat_num=cat_num+1
cat_map(CROPPED_DIM*i+1:(i+1)*CROPPED_DIM,CROPPED_DIM*j+1:(j+1)*CROPPED_DIM,:)=crops_data(:,:,:,cat_num);
end
end
imshow(uint8(cat_map))

看着比较怪的原因在于，中间经过了matlab处理方式到opencv处理方式的转变，但是我们依旧用matlab输出了。

三、前向计算

[cpp] view plain copy print?

res=net.forward({crops_data});
prob=res{1};
prob1 = mean(prob, 2);
[~, maxlabel] = max(prob1);

这一步完毕以后，整个网络就会充满参数了，权重，特征图均生成完毕，接下来可视化它们。

四、特征图可视化

4.1、特征图提取方法

说一下步骤，首先利用net 中的blob_name函数取出与deploy.prototxt对应的 top 名字，显示一下看看

[cpp] view plain copy print?

names=net.blob_names
names =
'data'
'conv1'
'pool1'
'norm1'
'conv2'
'pool2'
'norm2'
'conv3'
'conv4'
'conv5'
'pool5'
'fc6'
'fc7'
'fc8'
'prob'

然后利用blob调用get_data()函数获取我们需要的特征图的值。注意，每一层的特征图是四维，看看前三层的特征图大小：

[cpp] view plain copy print?

size(featuremap{1})=227 227 3 10
size(featuremap{2})= 55 55 96 10
size(featuremap{3})= 27 27 96 10

结合deploy中每一层的卷积核大小以及步长，利用 (当前层特征图大小 - 卷积核大小) / 步长+1=下一层特征图大小，可以推导出每一个featuremap 的前两维，第三个维度代表的是卷积核个数，featuremap {2}到featuremap {3}是池化了。第四个维度代表最开始输入了十张图

4.2 部分可视化方法：

这一部分针对指定的第crop_num张图像在第map_num层进行可视化。注意，这一部分的可视化包含池化层等。

[cpp] view plain copy print?

function [ ] = feature_partvisual( net,mapnum,crop_num )
names=net.blob_names;
featuremap=net.blobs(names{mapnum}).get_data();%获取指定层的特征图
[m_size,n_size,num,crop]=size(featuremap);%获取特征图大小，长*宽*卷积核个数*通道数
row=ceil(sqrt(num));%行数
col=row;%列数
feature_map=zeros(m_size*row,n_size*col);
cout_map=1;
for i=0:row-1
for j=0:col-1
if cout_map<=num
feature_map(i*m_size+1:(i+1)*m_size,j*n_size+1:(j+1)*n_size)=(mapminmax(featuremap(:,:,cout_map,crop_num),0,1)*255)';
cout_map=cout_map+1;
end
end
end
imshow(uint8(feature_map))
str=strcat('feature map num:',num2str(cout_map-1));
title(str)
end

调用方法：

[cpp] view plain copy print?

mapnum=1;%第几层的feature☆☆☆☆☆☆☆☆
crop_num=1;%第几个crop的特征图☆☆☆☆☆☆☆☆
feature_partvisual( net,mapnum,crop_num )

中间有个处理细节是归一化然后乘以255，是避免featuremap的数值过小，或者有负数，导致特征图一片漆黑；在下面的权重可视化方法采取的是另一种处理。

读者可以更改"☆"标志的行中的数值去提取不同crop图像的不同层特征图。

第一层特征图：

第二层featuremap：

4.3、全部可视化

这一部分可视化每一张输入图片在指定卷积层的特征图，按照每一行为存储图片的特征图为图例。

[cpp] view plain copy print?

function [ ] = feature_fullvisual( net,mapnum )
names=net.blob_names;
featuremap=net.blobs(names{mapnum}).get_data();%获取指定层的特征图
[m_size,n_size,num,crop]=size(featuremap)%获取特征图大小，长*宽*卷积核个数*图片个数
row=crop;%行数
col=num;%列数
feature_map=zeros(m_size*row,n_size*col);
for i=0:row-1
for j=0:col-1
feature_map(i*m_size+1:(i+1)*m_size,j*n_size+1:(j+1)*n_size)=(mapminmax(featuremap(:,:,j+1,i+1),0,1)*255)';
end
end
figure
imshow(uint8(feature_map))
str=strcat('feature map num:',num2str(row*col));
title(str)
end

调用方法

[cpp] view plain copy print?

mapnum=2;%第几层的feature☆☆☆☆☆☆☆☆
feature_fullvisual( net,mapnum )

第一层：

第二层：基本看不清楚了，十张输入图片，每一张都有96个特征图，不好显示

五、卷积核可视化

【注】卷积核可视化中，采用的像素放大方法与特征图的不一样。特征图中采用归一化mapminmax到(0,1)范围，然后乘以255,；在下面卷积核的可视化中采用(x-最小值)/最大值*255的方法去放大像素。读者可根据自己喜好决定。

5.1、权重提取方法

先建议读者去看看多通道卷积的概念：http://blog.csdn.net/u014114990/article/details/51125776，不看也行，注意这句话，每一个通道的卷积核是不一样的，同一个卷积核只在同一个特征图中共享，应该理解的没错吧o(╯□╰)o。

通过net 的layer_names 函数能够获取deploy.txt 对应的name 的名称，每一个name的blob对应两个值，分别是权重和偏置，提取方法如下：

【注】貌似仅仅卷积核能够获取到权重，池化层倒是没有权重，全连接部分也是有权重的，但是没什么意义

[cpp] view plain copy print?

layers=net.layer_names;
convlayer=[];
for i=1:length(layers)
if strcmp(layers{i}(1:3),'con')%仅仅卷积核能获取到权重
convlayer=[convlayer;layers{i}];
end
end
w=cell(1,length(convlayer));%存储权重
b=cell(1,length(convlayer));%存储偏置
for i=1:length(convlayer)
w{i}=net.layers(convlayer(i,:)).params(1).get_data();
b{i}=net.layers(convlayer(i,:)).params(2).get_data();
end

提取完毕以后观察一下每一层的权重维度，发现也是四维，显示一下前三个卷积核的维度：

[cpp] view plain copy print?

size(w{1})= 11 11 3 96
size(w{2})= 5 5 48 256
size(w{3})= 3 3 256 384

前两个维度不说了，卷积核的大小，第三个维度代表卷积核的左边，也就是上一层的特征图的个数(对应前面说的每一个通道对应不同卷积核)，第四个维度代表每一个通道对应的卷积核个数(也就是卷积核右边下一层的特征图的个数)。

5.2、部分可视化方法

那么我们可视化也是可选的，需要选择哪一个特征图对应的卷积核，可视化方法如下：

[cpp] view plain copy print?

<pre name="code" class="cpp"><pre name="code" class="cpp">function [ ] = weight_partvisual( net,layer_num ,channels_num )
layers=net.layer_names;
convlayer=[];
for i=1:length(layers)
if strcmp(layers{i}(1:3),'con')
convlayer=[convlayer;layers{i}];
end
end
w=net.layers(convlayer(layer_num,:)).params(1).get_data();
b=net.layers(convlayer(layer_num,:)).params(2).get_data();
minval=min(min(min(min(w))));
maxval=max(max(max(max(w))));
w=(w-minval)/maxval*255;
weight=w(:,:,channels_num,:);%四维，核长*核宽*核左边输入*核右边输出(核个数)
[kernel_r,kernel_c,input_num,kernel_num]=size(w);
map_row=ceil(sqrt(kernel_num));%行数
map_col=map_row;%列数
weight_map=zeros(kernel_r*map_row,kernel_c*map_col);
kernelcout_map=1;
for i=0:map_row-1
for j=0:map_col-1
if kernelcout_map<=kernel_num
weight_map(i*kernel_r+1+i:(i+1)*kernel_r+i,j*kernel_c+1+j:(j+1)*kernel_c+j)=weight(:,:,:,kernelcout_map);
kernelcout_map=kernelcout_map+1;
end
end
end
figure
imshow(uint8(weight_map))
str1=strcat('weight num:',num2str(kernelcout_map-1));
title(str1)
end

调用方法

[cpp] view plain copy print?

layer_num=1;%想看哪一个卷积核对应的权重☆☆☆☆☆☆☆☆☆☆
channels_num=1;%想看第几个通道对应的卷积核
weight_partvisual( net,layer_num ,channels_num )

看看效果：

第一个卷积层的第一个通道对应的卷积核：

第二个卷积层的第一个通道对应的卷积核：

2017.3.4更新日志：

谢谢 TensorSense指出的代码错误，上面说过避免像素值过小的计算方法是通过减去最最小值除以最大值以后乘以255，但是代码却写成了

[cpp] view plain copy print?

w=w-min(min(min(min(w))));
w=w/max(max(max(max(w))))*255;

在此做一下更正，应该是

[plain] view plain copy print?

minval=min(min(min(min(w))));
maxval=max(max(max(max(w))));
w=(w-minval)/maxval*255;

当然也可以用全部可视化中提到的MATLAB自带函数mapminmanx函数进行归一化。

5.3、全部可视化

将指定卷积层对应的每一个特征图的全部卷积核画出

[plain] view plain copy print?

function [ ] = weight_fullvisual( net,layer_num )
layers=net.layer_names;
convlayer=[];
for i=1:length(layers)
if strcmp(layers{i}(1:3),'con')
convlayer=[convlayer;layers{i}];
end
end
weight=net.layers(convlayer(layer_num,:)).params(1).get_data();%四维，核长*核宽*核左边输入*核右边输出(核个数)
b=net.layers(convlayer(layer_num,:)).params(2).get_data();
minval=min(min(min(min(w))));
maxval=max(max(max(max(w))));
w=(w-minval)/maxval*255;
[kernel_r,kernel_c,input_num,kernel_num]=size(weight);
map_row=input_num;%行数
map_col=kernel_num;%列数
weight_map=zeros(kernel_r*map_row,kernel_c*map_col);
for i=0:map_row-1
for j=0:map_col-1
weight_map(i*kernel_r+1+i:(i+1)*kernel_r+i,j*kernel_c+1+j:(j+1)*kernel_c+j)=weight(:,:,i+1,j+1);
end
end
figure
imshow(uint8(weight_map))
str1=strcat('weight num:',num2str(map_row*map_col));
title(str1)
end

第一层：

第二层：

附上所有代码：

主函数

[cpp] view plain copy print?

<pre name="code" class="cpp">clear
clc
close all
%caffenet的解读：http://www.2cto.com/kf/201606/515700.html
%% 设置网络
addpath('..') %加入+caffe路径
caffe.set_mode_cpu();%设置CPU模式
model = '../../models/bvlc_reference_caffenet/deploy.prototxt';%模型
weights = '../../models/bvlc_reference_caffenet/bvlc_reference_caffenet.caffemodel';%参数
net=caffe.Net(model,'test');%测试
net.copy_from(weights); %得到训练好的权重参数
net %显示net的结构
%% 预处理
d = load('../+caffe/imagenet/ilsvrc_2012_mean.mat');
mean_data = d.mean_data;%读取均值
im = imread('../../examples/images/cat.jpg');%读取图片
IMAGE_DIM = 256;%图像将要resize的大小，建议resize为图像最小的那个维度
CROPPED_DIM = 227;%最终需要把一张图片crops成十块，最终求出每一块可能的标签
im_data=im;
im_data = im(:, :, [3, 2, 1]); %matlab按照RGB读取图片，opencv是BGR，所以需要转换顺序为opencv处理格式
im_data = permute(im_data, [2, 1, 3]); % 原始图像m*n*channels,现在permute为n*m*channels大小
im_data = single(im_data); % 强制转换数据为single类型
im_data = imresize(im_data, [IMAGE_DIM IMAGE_DIM], 'bilinear'); % 线性插值resize图像
% im_data = im_data - mean_data; % 零均值
crops_data = zeros(CROPPED_DIM, CROPPED_DIM, 3, 10, 'single');%注意此处是因为prototxt的输入大小为宽*高*通道数*10
indices = [0 IMAGE_DIM-CROPPED_DIM] + 1;%获得十块每一块大小与原始图像大小差距，便于crops
%下面就是如何将一张图片crops成十块
n = 1;
%此处两个for循环并非是1：indices，而是第一次取indices(1)，然后是indices(2)，每一层循环两次
%分别读取图片四个角大小为CROPPED_DIM*CROPPED_DIM的图片
for i = indices
for j = indices
crops_data(:, :, :, n) = im_data(i:i+CROPPED_DIM-1, j:j+CROPPED_DIM-1, :);%产生四个角的cropdata，1 2 3 4
crops_data(:, :, :, n+5) = crops_data(end:-1:1, :, :, n);%翻转180°来一次，产生四个角的翻转cropdata，6 7 8 9
n = n + 1;
end
end
center = floor(indices(2) / 2) + 1;
%以中心为crop_data左上角顶点，读取CROPPED_DIM*CROPPED_DIM的块
crops_data(:,:,:,5) = ...
im_data(center:center+CROPPED_DIM-1,center:center+CROPPED_DIM-1,:);
%与for循环里面一样，翻转180°，绕左边界翻转
crops_data(:,:,:,10) = crops_data(end:-1:1, :, :, 5);
%% 展示被crop的图需要im_data = im_data - mean_data注释
cat_map=zeros(CROPPED_DIM*2,CROPPED_DIM*5,3);%两行五列展示
cat_num=0;
for i=0:1
for j=0:4
cat_num=cat_num+1
cat_map(CROPPED_DIM*i+1:(i+1)*CROPPED_DIM,CROPPED_DIM*j+1:(j+1)*CROPPED_DIM,:)=crops_data(:,:,:,cat_num);
end
end
figure
imshow(uint8(cat_map))
%% 前向计算
res=net.forward({crops_data});
prob=res{1};
prob1 = mean(prob, 2);
[~, maxlabel] = max(prob1);
%% 观察网络结构,获取特征图
%注意blob_names和layer_names的区别
%获取特征图，特征图就是prototxt的每一层top名字
mapnum=2;%第几层的feature☆☆☆☆☆☆☆☆
crop_num=1;%第几个crop的特征图☆☆☆☆☆☆☆☆
feature_partvisual( net,mapnum,crop_num )
feature_fullvisual( net,mapnum )
%% 观察网络结构,获取权重
%看多通道卷积解释http://blog.csdn.net/u014114990/article/details/51125776
%中间group过一次，96分两两group变成48，第56行
%获取权重，每一层的layer_names存储了权重和偏置，第一个参数是权重，第二个参数是偏置
layer_num=2;%想看哪一层的权重☆☆☆☆☆☆☆☆☆☆
channels_num=1;%想看第几个通道对应的卷积核
weight_partvisual( net,layer_num ,channels_num )
weight_fullvisual( net,layer_num )

部分特征图可视化：

[cpp] view plain copy print?

function [ ] = feature_partvisual( net,mapnum,crop_num )
names=net.blob_names;
featuremap=net.blobs(names{mapnum}).get_data();%获取指定层的特征图
[m_size,n_size,num,crop]=size(featuremap);%获取特征图大小，长*宽*卷积核个数*通道数
row=ceil(sqrt(num));%行数
col=row;%列数
feature_map=zeros(m_size*row,n_size*col);
cout_map=1;
for i=0:row-1
for j=0:col-1
if cout_map<=num
feature_map(i*m_size+1:(i+1)*m_size,j*n_size+1:(j+1)*n_size)=(mapminmax(featuremap(:,:,cout_map,crop_num),0,1)*255)';
cout_map=cout_map+1;
end
end
end
figure;imshow(uint8(feature_map))
str=strcat('feature map num:',num2str(cout_map-1));
title(str)
end

全部特征图可视化：

[cpp] view plain copy print?

function [ ] = feature_fullvisual( net,mapnum )
names=net.blob_names;
featuremap=net.blobs(names{mapnum}).get_data();%获取指定层的特征图
[m_size,n_size,num,crop]=size(featuremap)%获取特征图大小，长*宽*卷积核个数*图片个数
row=crop;%行数
col=num;%列数
feature_map=zeros(m_size*row,n_size*col);
for i=0:row-1
for j=0:col-1
feature_map(i*m_size+1:(i+1)*m_size,j*n_size+1:(j+1)*n_size)=(mapminmax(featuremap(:,:,j+1,i+1),0,1)*255)';
end
end
figure
imshow(uint8(feature_map))
str=strcat('feature map num:',num2str(row*col));
title(str)
end

部分卷积核可视化：

[cpp] view plain copy print?

function [ ] = weight_visual( net,layer_num ,channels_num )
layers=net.layer_names;
convlayer=[];
for i=1:length(layers)
if strcmp(layers{i}(1:3),'con')
convlayer=[convlayer;layers{i}];
end
end
w=net.layers(convlayer(layer_num,:)).params(1).get_data();
b=net.layers(convlayer(layer_num,:)).params(2).get_data();
minval=min(min(min(min(w))));
maxval=max(max(max(max(w))));
w=(w-minval)/maxval*255;
[kernel_r,kernel_c,input_num,kernel_num]=size(w);
map_row=ceil(sqrt(kernel_num));%行数
map_col=map_row;%列数
weight_map=zeros(kernel_r*map_row,kernel_c*map_col);
kernelcout_map=1;
for i=0:map_row-1
for j=0:map_col-1
if kernelcout_map<=kernel_num
weight_map(i*kernel_r+1+i:(i+1)*kernel_r+i,j*kernel_c+1+j:(j+1)*kernel_c+j)=weight(:,:,:,kernelcout_map);
kernelcout_map=kernelcout_map+1;
end
end
end
figure
imshow(uint8(weight_map))
str1=strcat('weight num:',num2str(kernelcout_map-1));
title(str1)
end

全部卷积核可视化：

[plain] view plain copy print?

function [ ] = weight_fullvisual( net,layer_num )
layers=net.layer_names;
convlayer=[];
for i=1:length(layers)
if strcmp(layers{i}(1:3),'con')
convlayer=[convlayer;layers{i}];
end
end
weight=net.layers(convlayer(layer_num,:)).params(1).get_data();%四维，核长*核宽*核左边输入*核右边输出(核个数)
b=net.layers(convlayer(layer_num,:)).params(2).get_data();
minval=min(min(min(min(weight))));
maxval=max(max(max(max(weight))));
weight=(weight-minval)/maxval*255;
[kernel_r,kernel_c,input_num,kernel_num]=size(weight);
map_row=input_num;%行数
map_col=kernel_num;%列数
weight_map=zeros(kernel_r*map_row,kernel_c*map_col);
for i=0:map_row-1
for j=0:map_col-1
weight_map(i*kernel_r+1+i:(i+1)*kernel_r+i,j*kernel_c+1+j:(j+1)*kernel_c+j)=weight(:,:,i+1,j+1);
end
end
figure
imshow(uint8(weight_map))
str1=strcat('weight num:',num2str(map_row*map_col));
title(str1)
end

六、全连接探讨

这里初步探索一下CaffeNet 的最后一个池化层pool5到第一个全连接层fc6的连接，我最开始的理解是直接把pool层所有的单元拉成一个列向量，不过分析以后，感觉应该是类似BP，pool5先被拉成一个一维向量，然后利用权重连接到fc6层的所有单元上，类似二部图的连接方法。

实验过程如下：

①首先提取出pool5的特征图大小

[plain] view plain copy print?

K>> A=net.blobs('pool5').get_data();
K>> size(A)
ans =
6 6 256 10

可以发现对于每一个输入图片(总共十张)都有256个6*6大小的特征图。预先计算一下256*6*6=9216

②然后提取出fc6的特征图大小

[plain] view plain copy print?

K>> B=net.blobs('fc6').get_data();
K>> size(B)
ans =
4096 10

然后发现pool5到fc6的连接并不是简单的拉成一维向量，而是利用了一个9216*4096的权重去将pool5的特征映射到fc6的单元中

③验证一下是否如所想的映射方法，只需要看看pool5到fc6的权重大小即可

[plain] view plain copy print?

K>> C=net.layers('fc6').params(1).get_data();
K>> size(C)
ans =
9216 4096

发现果

鲜花

握手

雷人

路过

鸡蛋

该文章已有0人参与评论

请发表评论

全部评论

专题导读

More+

10-27 六六分期app的软件客服如何联系？(六六分期

11-06 可心卡盟:win10系统火狐flash插件崩溃怎么

11-06 亲亲特价:怎么删除回收站图标

11-06 济南大学虚拟社区:鲁大师节能降温的具体办

11-06 xlueops.exe:无线网络安装向导

11-06 女斗合众国:win7系统cf与主机连接不稳定怎

11-06 0xc000022-[cf烟雾头]cf怎么调烟雾头

11-06 qizideyouhuo:应用程序无法正常启动0xc0000

11-06 ipz-185:win7系统vcf文件怎么打开

11-06 傻哥蹦迪:win10系统s4怎么打开usb调试

11-06 八神浩树gtaste:回收站清空了怎么恢复

11-06 妖尾之黑色守护:win10系统电脑没有1440x900

11-06 校园至尊魔王小说:win7系统浏览网页时字体

11-06 女斗合众国:win10系统访问共享文件夹提示请

11-06 tokyo hot n0654:恢复win7系统默认字体一招

11-06 雨酷仙境:设置win7系统转移临时文件夹腾出

11-06 阿穆纳伊之杖:win7系统开始菜单在右边还原

11-06 tunespotting:win10系统火狐flash插件总是

11-06 甘尔葛分析师：计谋网站seo关键词暴涨有什

11-06 蔡贵霖: 计谋网站seo关键词暴涨有什么秘密

11-06 博益网首页:ao3网页版进入不了解决方法

11-06 漏斗子专栏: 网站数据分析小白易懂精华篇

11-06 见证双虹怎么做:win7系统开启telnet命令的

11-06 颾狐蝶蜋:系统资源不足无法完成请求的服务

11-06 国光中学校歌:提交网站到alexa查询详细步骤

11-06 西安有情天:静态网页和动态网页的区别

11-06 红木雅尚斋:外部链接构造对网站的好处

11-06 前官礼遇：防止域名劫持–增强域安全性的10

11-06 密传二转答案: 中文分词算法有哪些

11-06 金泉家园邮编:百度快照劫持的表现及应对方

2016 最流行的周末编程语言排行，Rust 夺冠！发布时间：2022-07-18

rust 高级话题发布时间：2022-07-18

剪的笔顺,诠释剪的笔画,认识剪的部首

1 六六分期app的软件客服如何联系？(六六分期

六六分期app的软件客服如何联系？不知道吗？加qq群【895510560】即可！标题：六六分期

阅读：19277|2023-10-27

2 可心卡盟:win10系统火狐flash插件崩溃怎么

今天小编告诉大家如何处理win10系统火狐flash插件总是崩溃的问题，可能很多用户都不知

阅读：10015|2022-11-06

3 亲亲特价:怎么删除回收站图标

今天小编告诉大家如何对win10系统删除桌面回收站图标进行设置，可能很多用户都不知道

阅读：8341|2022-11-06

4 济南大学虚拟社区:鲁大师节能降温的具体办

今天小编告诉大家如何对win10系统电脑设置节能降温的设置方法，想必大家都遇到过需要

阅读：8710|2022-11-06

5 xlueops.exe:无线网络安装向导

我们在使用xp系统的过程中,经常需要对xp系统无线网络安装向导设置进行设置，可能很多

阅读：8655|2022-11-06

6 女斗合众国:win7系统cf与主机连接不稳定怎

今天小编告诉大家如何处理win7系统玩cf老是与主机连接不稳定的问题，可能很多用户都不

阅读：9684|2022-11-06

7 0xc000022-[cf烟雾头]cf怎么调烟雾头

电脑对日常生活的重要性小编就不多说了，可是一旦碰到win7系统设置cf烟雾头的问题，很

阅读：8643|2022-11-06

8 qizideyouhuo:应用程序无法正常启动0xc0000

我们在日常使用电脑的时候，有的小伙伴们可能在打开应用的时候会遇见提示应用程序无法

阅读：8011|2022-11-06

9 ipz-185:win7系统vcf文件怎么打开

今天小编告诉大家如何对win7系统打开vcf文件进行设置，可能很多用户都不知道怎么对win

阅读：8680|2022-11-06

10 傻哥蹦迪:win10系统s4怎么打开usb调试

今天小编告诉大家如何对win10系统s4开启USB调试模式进行设置，可能很多用户都不知道怎

阅读：7547|2022-11-06

客服电话

电子邮件

【caffe-matlab】权重以及特征图的可视化

前言

一、模型读取

二、输入数据整理

三、前向计算

四、特征图可视化

4.1、特征图提取方法

4.2 部分可视化方法：

4.3、全部可视化

五、卷积核可视化

5.1、权重提取方法

5.2、部分可视化方法

5.3、全部可视化

六、全连接探讨

请发表评论

全部评论

上一篇：

下一篇：

stevenliuyi/latex-alpha2: LaTeX package

librespeed/speedtest: Self-hosted Speedt

avehtari/BDA_m_demos: Bayesian Data Anal

四维彩超怎么看性别？四维看男孩女孩诀窍

medfreeman/markdown-it-toc-and-anchor: m

剪的笔顺,诠释剪的笔画,认识剪的部首

六六分期app的软件客服如何联系？(六六分期

florent37/ViewAnimator: A fluent Android

florent37/Shrine-MaterialDesign2: implem

CVE-2020-36276

SimpleSoftwareIO/simple-sms: Send and re

关于我们

产品与服务

解决方案

139-2527-9053