当前位置:Rose资源库 > 藏经阁 > 技术博客 > 人工智能 > caffe中prototxt文件的input_shape的dim:10dim:3dim:32dim:32意义

caffe中prototxt文件的input_shape的dim:10dim:3dim:32dim:32意义

分享到:

layer {  
 
  name: "data"  
  type: "Input"  
  top: "data"  
  input_param {
        shape: {
        dim: 10 
        dim: 3 
        dim: 32 
        dim: 32 } 
        }  
}  

 
 
详细解释:
dim:10  ——表示对待识别样本进行数据增广的数量,该值的大小可自行定义。但一般会进行5次crop,将整幅图像分为多个flip。该值为10则表示会将待识别的样本分为10部分输入到网络进行识别。如果相对整幅图像进行识别而不进行图像数据增广,则可将该值设置为1.
 
dim:3 ——该值表示处理的图像的通道数,若图像为RGB图像则通道数为3,设置该值为3;若图像为灰度图,通道数为1则设置该值为1.
 
dim:32 ——图像的长度,可以通过网络配置文件中的数据层中的crop_size来获取。
 
dim:32——图像的宽度,可以通过网络配置文件中的数据层中的crop_size来获取。


 
返回顶部