该代码是在caffe框架运行,是yjxiong的 的一些改进,caffe是用的他的修改版,即里面包含了openmpi多线程,具体使用方法参考上面的网址。 由于他的caffe里面东西较多,在亲自移植代码后,发现有许多小错误,对其进行了修改。 该代码在移植的过程中,使用了4块GTX1080Ti的显卡。



  • models/action_recognition文件夹下有多个prototxt文件,其中flow.solver文件有两个,New版本是我修改后的版本,是与论文一致的版本。不带New的版本是原版的solver文件。区别在于是否将图片resize成340*256和scale_ratios是否含有0.66。原版将其省略,而我将其加上。虽然准确率并没有太大的变化。因此,使用带New的.

  • action_python/下有许多测试文件,测试temporal net使用,测试spatial net使用。测试temporal+spatial使用。文件全部调用的是 和 。原版的有一些错误,因此改成使用后缀有Test的。

  • examples/action_recognition/dataset_file_examples/ 下的txt文件修改。因为用之前我的github中的denseflow提取出的rgb图和optical flow 图的个数与txt中的个数不能对应。对原版的txt文件中视频提取图片的帧数进行了修改。否则,若提取的图片小于txt文件中的视频帧数,网络输入图片的时候,将会出现找不到某些图片的报错。因此,使用后缀带new的。

上面三个是本系统的关键,另外还对caffe的源码进行了修改,这跟 所说的修改是一致的。

最终可以根据本代码直接进行,进行训练的时候,在caffe根目录下,输入mpirun -np 4 ./install/bin/caffe train --solver= -weights=< Pretrained caffemodel>即可运行。 (当然,要提取安装openmpi)。



