: la comprobación falla: comprobación fallida: hdf_blobs_ -> shape (0) == num (200 contra 6000)

Tengo los datos del tren y la etiqueta como data.mat. (Tengo 200 datos de entrenamiento con 6000 características y las tags son (-1, +1) que se han guardado en data.mat).

Estoy tratando de convertir mis datos en hdf5 y ejecutar Caffe usando:

load data.mat hdf5write('my_data.h5', '/new_train_x', single( reshape(new_train_x,[200, 6000, 1, 1]) ) ); hdf5write('my_data.h5', '/label_train', single( reshape(label_train,[200, 1, 1, 1]) ), 'WriteMode', 'append' ); 

Y mi layer.prototxt (solo capa de datos) es:

 layer { type: "HDF5Data" name: "data" top: "new_train_x" # note: same name as in HDF5 top: "label_train" # hdf5_data_param { source: "/path/to/list/file.txt" batch_size: 20 } include { phase: TRAIN } } 

pero, tengo un error: (Error de comprobación: hdf_blobs_ [i] -> shape (0) == num (200 contra 6000))

 I1222 17:02:48.915861 3941 layer_factory.hpp:76] Creating layer data I1222 17:02:48.915871 3941 net.cpp:110] Creating Layer data I1222 17:02:48.915877 3941 net.cpp:433] data -> new_train_x I1222 17:02:48.915890 3941 net.cpp:433] data -> label_train I1222 17:02:48.915900 3941 hdf5_data_layer.cpp:81] Loading list of HDF5 filenames from: file.txt I1222 17:02:48.915923 3941 hdf5_data_layer.cpp:95] Number of HDF5 files: 1 F1222 17:02:48.993865 3941 hdf5_data_layer.cpp:55] Check failed: hdf_blobs_[i]->shape(0) == num (200 vs. 6000) *** Check failure stack trace: *** @ 0x7fd2e6608ddd google::LogMessage::Fail() @ 0x7fd2e660ac90 google::LogMessage::SendToLog() @ 0x7fd2e66089a2 google::LogMessage::Flush() @ 0x7fd2e660b6ae google::LogMessageFatal::~LogMessageFatal() @ 0x7fd2e69f9eda caffe::HDF5DataLayer::LoadHDF5FileData() @ 0x7fd2e69f901f caffe::HDF5DataLayer::LayerSetUp() @ 0x7fd2e6a48030 caffe::Net::Init() @ 0x7fd2e6a49278 caffe::Net::Net() @ 0x7fd2e6a9157a caffe::Solver::InitTrainNet() @ 0x7fd2e6a928b1 caffe::Solver::Init() @ 0x7fd2e6a92c19 caffe::Solver::Solver() @ 0x41222d caffe::GetSolver() @ 0x408ed9 train() @ 0x406741 main @ 0x7fd2e533ca40 (unknown) @ 0x406f69 _start Aborted (core dumped) 

¡¡¡¡Muchas gracias!!!! ¡Cualquier consejo sería apreciado!

El problema

Parece que hay un conflicto con el orden de los elementos en las matrices: matlab organiza los elementos desde la primera hasta la última dimensión (como fortran), mientras que caffe y hdf5 almacenan las matrices de la última dimensión a la primera:
Supongamos que tenemos X de forma n x c x h x w entonces el “segundo elemento de X ” es X[2,1,1,1] en matlab pero X[0,0,0,1] en C (1- basado en la indexación basada en 0 no hace la vida más fácil en absoluto).
Por lo tanto, cuando guarda una matriz de size=[200, 6000, 1, 1] en Matlab, lo que hdf5 y caffe realmente ven es una matriz de shape=[6000,200] .

El uso de la herramienta de línea de comandos h5ls puede ayudarlo a detectar el problema.
En matlab guardaste

 >> hdf5write('my_data.h5', '/new_train_x', single( reshape(new_train_x,[200, 6000, 1, 1]) ); >> hdf5write('my_data.h5', '/label_train', single( reshape(label_train,[200, 1, 1, 1]) ), 'WriteMode', 'append' ); 

Ahora puede inspeccionar my_data.h5 resultante usando h5ls (en el terminal Linux):

 user@host:~/$ h5ls ./my_data.h5 label_train Dataset {200} new_train_x Dataset {6000, 200} 

Como puede ver, las matrices están escritas “hacia atrás”.

Solución

Teniendo en cuenta este conflicto al exportar datos de Matlab, debe permute :

 load data.mat hdf5write('my_data.h5', '/new_train_x', single( permute(reshape(new_train_x,[200, 6000, 1, 1]),[4:-1:1] ) ); hdf5write('my_data.h5', '/label_train', single( permute(reshape(label_train,[200, 1, 1, 1]), [4:-1:1] ) ), 'WriteMode', 'append' ); 

Inspeccione my_data.h5 resultante utilizando h5ls ahora los resultados con:

 user@host:~/$ h5ls ./my_data.h5 label_train Dataset {200, 1, 1, 1} new_train_x Dataset {200, 6000, 1, 1} 

Que es lo que esperabas en primer lugar.

Intereting Posts