Una competición de clasificación de varias clases
El “punto de referencia alemán de reconocimiento de señales de tráfico”
es una competición de clasificación multicategoría celebrada en IJCNN 2011.
El reconocimiento automático de las señales de tráfico se requiere en avanzado
sistemas de asistencia al conductor y constituye un desafiante problema de reconocimiento de patrones y visión por computadora del mundo real. A
conjunto de datos completo y realista de más de 50.000 señales de tráfico
Se han recopilado imágenes. Refleja las fuertes variaciones en
apariencia visual de las señales debido a la distancia, la iluminación, el clima
condiciones, oclusiones parciales y rotaciones. Las imagenes son
complementado con varios conjuntos de funciones precalculadas para permitir
para aplicar algoritmos de aprendizaje automático sin antecedentes
conocimientos en procesamiento de imágenes. El conjunto de datos comprende 43 clases
con frecuencias de clase desequilibradas. Los participantes tienen que clasificar
dos conjuntos de prueba de más de 12.500 imágenes cada uno. Aquí, los resultados
en el primero de estos conjuntos, que se utilizó en la primera evaluación
etapa del desafío doble. Los métodos
empleados por los participantes que lograron los mejores resultados son
brevemente descrito y comparado con el reconocimiento de señales de tráfico humano
desempeño y resultados de referencia.
El reconocimiento de las señales de tráfico es un desafío del mundo real
Problema de alta relevancia industrial. Aunque comercial
han llegado al mercado y varios estudios sobre este
tema se han publicado, comparaciones sistemáticas no sesgadas
de enfoques faltan y un punto de referencia integral
Los conjuntos de datos no están disponibles gratuitamente. El reconocimiento de signos es un problema de clasificación de múltiples categorías con frecuencias de clase desequilibradas. Las señales de tráfico muestran una amplia gama de variaciones entre
clases en términos de color, forma y presencia de pictogramas
o texto. Sin embargo, existen subconjuntos de clases (por ejemplo, velocidad
signos de límite) que son muy similares entre sí. El clasificador
tiene que hacer frente a grandes variaciones en las apariencias visuales debido
a cambios de iluminación, oclusiones parciales, rotaciones, clima
condiciones, escalado, etc.
Las señales de tráfico están diseñadas para ser detectadas y reconocidas fácilmente por conductores humanos. En consecuencia, los humanos son capaces de
reconociendo la gran variedad de señales viales existentes con cerca
al 100% de exactitud. Esto no solo se aplica al mundo real
conducción, que proporciona contexto y múltiples vistas de
una sola señal de tráfico, sino también al reconocimiento de una sola,
imágenes recortadas.
Presentamos el Benchmark alemán de reconocimiento de señales de tráfico
(GTSRB), un gran conjunto de datos realista de más de 50.000 tráfico
firmar imágenes en 43 clases. Describimos el diseño y análisis
del concurso IJCNN 2011 del mismo nombre que fue
construido sobre este conjunto de datos. Realizamos experimentos para determinar
rendimiento del reconocimiento de señales de tráfico humano y compararlos
a los resultados de la competencia. La competición se lleva a cabo en dos
etapas, y la primera etapa acaba de terminar en el momento de este
redacción del documento. Preguntamos a los participantes que lograron
los mejores resultados hasta ahora para proporcionar breves descripciones de sus
métodos, que se presentan junto con la clasificación
precisiones.
El documento está organizado de la siguiente manera: Sec. II presenta relacionados
trabaja. Segundo. III proporciona detalles sobre el conjunto de datos de referencia.
Segundo. IV aborda el protocolo de competición. Finalmente, se informan los resultados de la competencia y los mejores métodos hasta ahora son
descrito en la Sec. V antes de las conclusiones de la Sec. VI.
Se han publicado varios enfoques para el reconocimiento de señales de tráfico. En [2], un sistema integrado para la detección del límite de velocidad,
Se presenta seguimiento y reconocimiento. El clasificador está entrenado
utilizando 4000 muestras de 23 clases, con muestras por clase
que van desde 30 a 600. El desempeño individual de la
El componente de clasificación se evalúa en un conjunto de formación de 1.700
imágenes de señales de tráfico con una tasa de clasificación correcta del 94%.
Moutarde y col. presentar un sistema de reconocimiento de
y señales de límite de velocidad de EE. UU. basadas en el reconocimiento de un solo dígito
[3] usando una red neuronal. Desafortunadamente, no proporcionan
resultados de clasificación individual. El sistema general que incluye
la detección y el seguimiento logra un rendimiento del 89% para
EE.UU. y el 90% para los límites de velocidad europeos, respectivamente, en 281
señales de tráfico.
Broggi y col. [4] usa varias redes neuronales para clasificar
diferentes señales de tráfico. Información de forma y color del
La etapa de detección se utiliza para seleccionar la red neuronal adecuada.
Solo se proporcionan resultados cualitativos.
En [5], un clasificador de límite de velocidad basado en números se entrena en
2.880 imágenes. Alcanza una tasa de clasificación correcta del 92,4%
en 1233 imágenes. Sin embargo, no está claro si las imágenes de
la misma instancia de señal de tráfico se comparte entre conjuntos.
Se comparan varios enfoques en un conjunto de datos que contiene
1300 ejemplos preprocesados de 6 clases (5 límites de velocidad
y 1 clase de ruido) en [6]. El mejor desempeño de clasificación
observado fue del 97%.