Reconocimiento automático de ideogramas

 1. Reconocimiento estadístico de patrones

"En el reconocimiento estadístico de patrones, cada patrón se representa como un vector de características n-dimensional extraído de la imagen. [...] Dos cuestiones son especialmente relevantes para el desempeño de este tipo de métodos: la selección de las características y la selección del método para particionar el espacio de características." (Lladós & alt. p.6)

En el reconocimiento de símbolos múltiples funciones pueden ser consideradas. Lladós destaca cuatro grupos de funciones: los basados en los píxeles de la imagen, las características geométricas, los momentos geométricos y las transformaciones de la imagen. Otro conjunto de métodos utiliza características geométricas: centroides, ejes de inercia, circularidad, área, intersecciones de líneas, agujeros, perfiles de proyección, etc.  Una buena selección de características relevantes es fundamental para lograr un alto poder de discriminación. (ibidem, p.7). "Los invariantes de momento son otro tipo de características que también se han aplicado al reconocimiento de símbolos. [...] Son fáciles de calcular, tienen relación con propiedades geométricas, como el centro de gravedad, los ejes de inercia, etc." (ibidem)

En la literatura, se pueden encontrar técnicas basadas en el concepto de similitud, en redes neuronales y en árboles de decisión. "Las redes neuronales han demostrado tener buenas tasas de clasificación en muchos dominios diferentes. Una de sus ventajas es su capacidad de aprendizaje para adaptarse a las propiedades del conjunto de entrenamiento. [...] En los árboles de decisión, cada nodo del árbol corresponde a una condición específica sobre el valor de una característica particular. La clasificación se realiza siguiendo las ramas del árbol según el resultado de las pruebas de estado, hasta llegar a una de las hojas." (ibidem, p.7). Obviamente, las imágenes consideradas deben ser previamente normalizadas (todas el mismo tamaño).

El reconocimiento automático de símbolos ha sido investigado, especialmente para facilitar la conversión ráster a CAD; es una aplicación particular del reconocimiento de patrones (Lladós & alt, p.2).

2. Reconocimiento estructural de patrones

"En el reconocimiento estructural de patrones, los símbolos se representan con una descripción de su forma utilizando algún conjunto adecuado de primitivas geométricas y relaciones entre ellas." (Lladós & alt, p.8).

Para ello, se ha de realizar primero una vectorización de la ia imagen que sirve de modelo para crear el símbolo. El objetivo es encontrar el mejor isomorfismo entre la imagen de entrada y los modelos de los símbolos. El principal inconveniente es la complejidad computacional para encontrar la mejor coincidencia.

Otro método consiste en definir previamente un conjunto de reglas para definir restricciones geométricas entre las primitivas que componen el símbolo. Luego, estas reglas se aplican para encontrar símbolos en la imagen de entrada. También se pueden usar técnicas de transformación, generando una secuencia hasta encontrar la forma más adecuada. (ibidem, p.9)

El costo computacional es más bajo en el reconocimiento estadístico de patrones, pero el poder de discriminación y la robustez frente a la distorsión dependen en gran medida de la - difícil - selección de un conjunto óptimo de características para cada aplicación específica y el número de características debe ser pequeño. Esta selección es menos crítica en los métodos estructurales, pero la vectorización introduce posibles errores.

Me parece que, aquí, tenemos más sugerencias para la creación de símbolos, mientras los propios autores reconocen las grandes dificultades para lograr una adecuado reconocimiento por vías computacionales, dificultades que varían según el ámbito de conocimiento al cual corresponden los ideogramas. Y, como ha de ser evidente, el reconocimiento depende de la calidad del trabajo creativo. 

Algunas propiedades deseables para la coincidencia entre imagen e ideograma son: generalidad (poder ser aplicado en múltiples casos), extensibilidad (facilidad para agregar símbolos), escalabilidad, robustez frente a la distorsión y baja complexidad computacional (ibidem, p.11).

Lladós & al. concluyen que no existe un único método óptimo y "no parece fácil definir una representación lo suficientemente poderosa y general para funcionar bien en diferentes dominios y aplicaciones" (ibidem, p.11). Por último, "La definición de un método genérico de reconocimiento de símbolos sigue siendo un desafío"  (ibidem, p.15).

3. Digitalización y elección de umbral

Otra fórmula se utiliza en  el proyecto NOTAE, de la Unión Europea (ver post anterior). La primera dificultad consistía en reconocer los símbolos gráficos en documentos antiguos, "una tarea ardua" (p.8) según señala Boccuzzi, "debido al estado de conservación del documento, el color del fondo y la posible superposición entre los símbolos gráficos y el texto normal" (p.5), pero el proyecto provee una web un "motor simbólico" y una API de clasificación automática que muestran primero cinco posibles digitalizaciones diferentes del documento. Una vez elegida una, el motor de símbolos devuelve una imagen que contiene todos los símbolos gráficos contenidos en el documento. Los curadores envían una retroalimentación sobre los símbolos identificados y clasificados y la clasificación experta se almacena en la base de datos de símbolos gráficos NOTAE. Es el objetivo principal de dicha base de datos proporcionar a los expertos símbolos potenciales, dejándoles a ellos y a su experiencia la carga de clasificar los símbolos que descubren. 

El mecanismo de extracción del símbolo se basa en elegir un umbral y convertir cada píxel de la imagen a 1 si una combinación específica de los componentes del color del píxel está por encima o por debajo del umbral, a 0 en caso contrario. La elección del umbral depende del documento específico y no es posible encontrar una solución única para todos. Es el curador (investigador) que debe escoger el umbral que le parece más adecuado sobre la base de cinco posibles umbrales calculados automáticamente por un algoritmo de agrupamiento. (No entro en más detalles técnicos, pueden encontrarse en Boccuzzi, pp.8ss).

Considero que el reconocimiento automático puede ser importante, especialmente para el mejoramiento de la inteligencia artificial aplicada en el campo de las imágenes, pero el testeo humano es sin dudo el mejor método para la creación de ideogramas destinados a la comunicación en el mundo real e incluso virtual.

Otros estudios

La iconicidad es la característica que más se ha investigado según E.Bertola. Otros factores importantes son la influencia del color, y la influencia de la dificultad de los estímulos empleados (p.178). En el análisis de pictogramas utilizados para la ayuda a discapacitados (CAA), encontró que "si es muy fácil determinar el significado de los estímulos, la mayor o menor iconicidad tiene menos influencia, y que por el contrario, si los estímulos son más difíciles, entonces la iconicidad sí produce un efecto facilitador" (p.179). También descubrió que el uso del color en los pictogramas no produce necesariamente diferencias significativas (ibidem).

Un estudio de Mary Blake Huer (2000), también en relación al uso por discapacitados, ha demostrado que los individuos de diferentes grupos culturales y étnicos perciben los símbolos gráficos de diferente manera.

Un ejemplo, entre muchos otros, de estudio en un ámbito restringido es el de H.J. Zwaga y T. Boersema (1983) sobre los ideogramas de información pública en estaciones de trenes. Utilizaron un procedimiento de emparejamiento, en el que se especificaba un referente a los encuestados y se les pedía que seleccionaran el símbolo apropiado de un conjunto de símbolos que se les mostraba.

En un próximo post, me referiré al valor o influencia social de algunos ideogramas.

Referencias

Bertola López, E. (2017): Análisis empírico de las características formales de los símbolos pictográficos ARASAAC, Tesis Doctoral, Universidad de Murcia. 

Blake Huer, M. (2000): Examining perceptions of graphic symbols across cultures, AAC Augmentative and Alternative Communication, V.16, September 2000 

Boccuzzi, M. & alt. (2020): Identifying, Classifying and Searching Graphic Symbols in the NOTAE System, Part of the Communications in Computer and Information Science book series (CCIS,volume 1177), 

waga, H.J. & Boersema, T. (1983): Evaluation of a set of graphic symbols, Applied Ergonomics Volume 14, Issue 1, March 1983, Pages 43-54 (Accesible en bibliotecas suscritas a Science Direct)