图 2.1.2.1 -3 从合并区域提取出box
2.1.2.2 Feature extraction
        在RCNN模型中,使用预训练CNN网络模型 Alex-Net 来从每一个候选区域中提取特征。使用 Alex-Net 中的前5层卷积层(Conv1~Conv5)以及紧接着的两层全连接层(FC6 ~FC7). 对于每一个候选区域都会生成一个 4096 维大小的特征向量。