Articles of caffe

Módulo LSTM para Caffe

¿Alguien sabe si existe un buen módulo LSTM para Caffe? Encontré uno de una cuenta de github por russel91 pero aparentemente desapareció la página web que contiene ejemplos y explicaciones (anteriormente http://apollo.deepmatter.io/ -> ahora redirige solo a la página de github que ya no tiene ejemplos ni explicaciones).

¿Qué es el meta parámetro `weight_decay` en Caffe?

Mirando un ejemplo ‘solver.prototxt’ , publicado en BVLC / caffe git, hay un meta parámetro de entrenamiento weight_decay: 0.04 ¿Qué significa este metaparámetro? ¿Y qué valor debería asignarle?

Caffe | solver.prototxt values ​​setting strategy strategy

En Caffe, estoy tratando de implementar una red Fully Convolution para la segmentación semántica. Me preguntaba si existe una estrategia específica para configurar ‘solver.prototxt’ valores de ‘solver.prototxt’ para los siguientes ‘solver.prototxt’ : test_iter test_interval iter_size max_iter ¿Depende de la cantidad de imágenes que tienes para tu conjunto de entrenamiento? ¿Si es así, cómo?

: la comprobación falla: comprobación fallida: hdf_blobs_ -> shape (0) == num (200 contra 6000)

Tengo los datos del tren y la etiqueta como data.mat. (Tengo 200 datos de entrenamiento con 6000 características y las tags son (-1, +1) que se han guardado en data.mat). Estoy tratando de convertir mis datos en hdf5 y ejecutar Caffe usando: load data.mat hdf5write(‘my_data.h5’, ‘/new_train_x’, single( reshape(new_train_x,[200, 6000, 1, 1]) ) ); hdf5write(‘my_data.h5’, ‘/label_train’, […]

¿Cómo entrenar / probar mi propio conjunto de datos en caffe?

Empecé con Caffe y el ejemplo de mnist funcionó bien. Tengo los datos del tren y la etiqueta como data.mat . (Tengo 300 datos de entrenamiento con 30 características y las tags son (-1, +1) que se han guardado en data.mat ). Sin embargo, no entiendo muy bien cómo puedo usar caffe para implementar mi […]

¿Cómo interpretar el registro de caffe con debug_info?

Cuando se enfrentan dificultades durante el entrenamiento ( nan , la pérdida no converge , etc.) a veces es útil buscar un registro de entrenamiento más detallado configurando debug_info: true en el archivo ‘solver.prototxt’ . El registro de entrenamiento se ve más o menos así: I1109 …] [Forward] Layer data, top blob data data: 0.343971 […]

Causas comunes de nans durante el entrenamiento

Me he dado cuenta de que una ocurrencia frecuente durante el entrenamiento es la introducción de NAN . Muchas veces parece ser introducido por pesas en capas de producto interno / totalmente conectadas o de convolución que explotan. ¿Esto ocurre porque el cálculo del gradiente está explotando? ¿O se debe a la inicialización del peso […]

Una guía para convert_imageset.cpp

Soy relativamente nuevo en machine learning / python / ubuntu. Tengo un conjunto de imágenes en formato .jpg donde la mitad contiene una función que quiero que el caffe aprenda y la otra mitad no. Tengo problemas para encontrar la forma de convertirlos al formato lmdb requerido. Tengo los archivos de entrada de texto necesarios. […]