Evaluación del vocabulario receptivo en preescolares mediante una tarea automatizada de reconocimiento auditivo de palabras (REVOC:1)

in Boletín de Filología

Yeniè Norambuena Albornoz

Katia Sáez Carrillo

Bernardo Riffo Ocares

Fernando Gutiérrez Gómez

Resumen:

El artículo presenta los primeros resultados obtenidos con REVOC:1, una tarea automatizada de reconocimiento auditivo de palabras utilizada para evaluar el vocabulario receptivo en preescolares hispanohablantes. La tarea fue programada en Unity para tablets de 8´ en un modo de autoaplicación, e incluye los parámetros de precisión y tiempo de respuesta. Se utilizó una muestra no probabilística compuesta por 242 niños chilenos monolingües con edades entre los 4 y 6 años. La lista de estímulos de vocabulario fue extraída de TEVI-R, una prueba basada en papel que evalúa el vocabulario receptivo (auditivo). Para estimar la funcionalidad de la automatización y los valores de los parámetros, se evaluó el desempeño por grupo etario a nivel global y por ítem. Los resultados demostraron un alto nivel de desempeño en los ítems seleccionados, con diferencias significativas por grupo etario tanto en la precisión como en el tiempo de respuesta. La precisión correlacionó negativamente con las latencias totales y correctas, con diferencias significativas entre los grupos etarios. El contraste por ítems permitió apreciar la relación tiempo-precisión modulada por la edad, así como el efecto de la dificultad de las palabras sobre las latencias. REVOC:1 evaluó adecuadamente el vocabulario receptivo y puede pasar a nuevas etapas de desarrollo.

1. INTRODUCCIÓN

Nota de autor 1

Nota de autor 2

Nota de autor 3

Durante el desarrollo infantil, algunos aspectos del lenguaje resultan especialmente relevantes debido a que son indicadores del estado general del sistema lingüístico y tienen un impacto sostenido en habilidades más específicas y complejas. Este es el caso del vocabulario y, en especial, del vocabulario temprano (oral), que destaca por su capacidad para predecir el desarrollo ulterior de otras habilidades como la comprensión y la lectura (Dickinson et al. 2003; Kim & Phillips 2014; Perfetti 2017; Riffo et al. 2015), posicionándose incluso como un predictor de otras habilidades, como las matemáticas y la capacidad de regulación interna (Lee 2011).

El conocimiento del vocabulario ha sido usualmente analizado a partir de la distinción entre tamaño o amplitud (i.e., número de ítems léxicos conocidos) y profundidad o calidad (i.e., qué tan bien son conocidas dichas palabras) (Schmitt 2014).

Una parte importante de las mediciones y discusiones sobre el vocabulario se ha centrado en la amplitud, principalmente debido a que posee un constructo más claro y a que resulta más accesible en términos de su evaluación, incluso en etapas tempranas del desarrollo. Por otra parte, el análisis de la profundidad se asocia a una gran diversidad de enfoques (teóricos y metodológicos) que se explican por la variedad de conceptualizaciones que se han realizado sobre este constructo (e.g., como mejor organización léxica), así como por su naturaleza compleja (Read 2000; Schmitt 2014).

Así, aunque la profundidad es una dimensión indisociable de la amplitud, esta última ocupa un lugar central en los estudios y pruebas sobre vocabulario infantil.

A su vez, la amplitud y la profundidad del vocabulario pueden ser evaluadas usando tanto una perspectiva receptiva como productiva. Así, hablamos de vocabulario receptivo cuando nos centramos en las palabras que los niños reconocen o comprenden y de vocabulario productivo, cuando lo hacemos sobre las palabras que los niños producen.

De este modo, el vocabulario receptivo nos informa sobre habilidades como la comprensión auditiva y la lectura, mientras que el vocabulario productivo lo hace sobre la expresión oral y la escritura (Nation 2001; Schmitt 2014). Ambas vertientes del vocabulario (receptivo y productivo) resultan transversales al conocimiento que los niños poseen sobre la forma, el significado y el uso de las palabras (Nation 2001; Schmitt 2014) y, por lo tanto, son constitutivas de lo que se ha denominado lexicón mental (Jackendoff, 2002; Aitchison 2003).

El vocabulario receptivo, del cual nos ocuparemos aquí, corresponde a aquel que el hablante es capaz de comprender en diferentes situaciones y tiende a desarrollarse antes y a superar en cantidad al vocabulario productivo. El desarrollo del vocabulario receptivo comienza tempranamente cuando los bebés aprenden a discriminar sonidos del habla y se vuelve notorio cerca de los 7-12 meses de edad cuando comienzan a responder, por ejemplo, a peticiones simples (Burger & Chong 2011). Durante este periodo, el vocabulario aumenta de manera heterogénea hasta los 6 años, edad en la que puede alcanzar un volumen de entre 10.000 y 24.000 palabras, dependiendo de la lengua (Burger & Chong 2011; Sandtrock 2009).

Aunque el vocabulario aumenta naturalmente como parte del desarrollo comunicativo y social, su adquisición puede verse influenciada por diferentes factores.

Tanto en estudios experimentales como descriptivos, se ha identificado un conjunto de variables, especialmente las relacionadas con características propias de las palabras, que explican la mayor parte de la varianza de los datos obtenidos. Entre estas últimas destacan: la frecuencia léxica y silábica, la familiaridad, la longitud, la complejidad fonémica, la clase gramatical y aspectos semánticos como la imaginabilidad, el contenido afectivo o el número de significados, entre muchos otros (Vitevitch et al. 2018; Berko & Bernstein 1999; González-Alvarez & Palomar-García 2016). Al ser uno de los primeros aspectos lingüísticos directamente observables, las palabras constituyen un valioso recurso para acceder a los procesos implicados en el desarrollo lingüístico infantil.

De lo anterior puede extraerse la importancia de la evaluación de la amplitud del vocabulario receptivo, especialmente en las etapas previas a la escolarización formal.

Debido a que en esta etapa la mayoría de los niños aún no lee, los instrumentos y procedimientos empleados habitualmente incluyen estímulos auditivos, como es el caso del TEVI-R (Echeverría et al. 2002), para el español de Chile, y el Peabody Picture Vocabulary (Dunn 1997), para el inglés. En estas pruebas, que se basan en el vínculo entre la forma (oral) y el significado, el evaluador debe pronunciar las palabras mientras muestra al niño una lámina con 4 imágenes, quien responde indicando a cuál imagen corresponde la palabra escuchada, una respuesta que implica el procesamiento y reconocimiento auditivo de los ítems léxicos.

1.1 Reconocimiento auditivo de palabras

El reconocimiento auditivo de palabras es un proceso complejo que incluye el acceso, desde una señal acústica, a representaciones léxicas almacenadas en la memoria (Magnuson et al. 2013; McQueen & Cutler 2001). El procesamiento, que comienza con la percepción de la cadena fónica, debe resolver varias dificultades antes de la selección de una representación consistente con el input acústico, entre ellas, la activación de otras unidades almacenadas en la memoria, como ocurre con los homófonos, asociados semánticos o ítems léxicos contextualmente relacionados (McQueen & Cutler 2001; Vitevitch et al. 2018). De esta manera, el reconocimiento auditivo de palabras constituye un subsistema que actúa como interfaz entre un nivel básico de percepción y procesos cognitivos de alto nivel (Dahan & Magnuson 2006). Existe consenso entre distintos modelos psicolingüísticos en que el reconocimiento involucra procesos de acceso, activación, competencia y selección de unidades léxicas en la memoria (Vitevitch et al. 2018), dinámica en la que el tiempo de duración de dichos procesos desempeña un papel central. Por ello es que esta variable, junto con la precisión de la respuesta (en adelante, PR), se considera un componente estándar en la mayor parte de los estudios sobre procesamiento léxico (Just & Carpenter 1980; Kail & Hall 1994).

La PR depende del acierto al seleccionar la representación léxica que se asocia con el input y, en términos generales, permite establecer un umbral o valor límite en función del cual se evalúa el nivel de desarrollo o de habilidad. Al dar cuenta de la eficiencia en el reconocimiento de la palabra (en este caso, como unidad discreta), la precisión constituye un indicador del funcionamiento de una serie de procesos anteriores, tanto léxicos como fonológicos (Vitevitch et al. 2018). El tiempo de respuesta (TR) -también llamado latencia-, a su vez, corresponde a la distancia temporal entre la presentación de un estímulo y la emisión de una respuesta. Debido a estas condiciones, el TR permite una estimación objetiva de la duración de procesos mentales y puede traducirse en un índice de la complejidad del procesamiento que requiere una tarea en particular. Dado que la velocidad de procesamiento ha sido señalada como un mediador parcial del desempeño 5 relacionado con la edad en diferentes tareas cognitivas (Horning & Davis 2012), los TR constituyen un indicador importante de la presencia de déficits, así como del aumento en la carga cognitiva asociada a tareas complejas o a otras variables cognitivas.

En el caso del reconocimiento de palabras, el TR ofrece una medida del tiempo utilizado para reconocer una entrada en la memoria léxica (Kail & Hall 1994). Los TR pueden variar en función de las características de las palabras, de modo que algunas variables pueden alterar significativamente la latencia o duración del reconocimiento, como ocurre, por ejemplo, con la familiaridad, la frecuencia y la edad de adquisición (Vitevitch et al. 2018; Monaghan & Ellis 2002). Por otra parte, los errores pueden reflejar una falta de control cognitivo cuando se trata de respuestas prematuras, por lo que estarían asociados a latencias más cortas (Novikov et al. 2017). En cambio, los errores lentos parecen estar asociados a lapsos o periodos de atención e incertidumbre (De Boeck & Jeon 2019).

Diferentes estudios sobre la velocidad de procesamiento en niños e infantes han demostrado que estos se vuelven más rápidos en el reconocimiento de palabras familiares a medida que crecen, especialmente después de los dos años de edad (Fernald et al. 2006; Peter et al. 2019). Asimismo, existe evidencia de que la velocidad de procesamiento se relaciona significativamente con la velocidad de adquisición y tamaño del vocabulario infantil (Fernald et al. 2006; Peter et al. 2019; Marchman et al. 2015). Los cambios atribuidos a la edad se asocian, por una parte, al acceso automático a nombres familiares, y, por otra, a cambios globales en la velocidad de procesamiento (Kail & Hall 1994).

Así, y a medida que aumenta la edad, los niños son capaces de nombrar objetos familiares más rápidamente con igual o mayor precisión, aunque esta compensación puede variar en función de las características de los ítems y los límites de tiempo establecidos para la tarea (Kail & Hall 1994; Bolsinova et al. 2017). Finalmente, se ha sugerido que un adecuado desarrollo tanto de la precisión como de la velocidad de procesamiento en el reconocimiento de palabras tiene un efecto importante en el aprendizaje de la lectura y la comprensión lectora durante los primeros años de escolarización (Kail & Hall, 1994; Karageorgos et al. 2020).

1.2. Tiempo y precisión en pruebas de vocabulario automatizadas

Como puede extraerse del apartado anterior, incluir tanto la PR como el TR en pruebas de vocabulario puede no solo resultar más informativo, sino que también podría mejorar la manera en que se utilizan los datos. Por ejemplo, el TR es relevante para interpretar los resultados de la PR y respaldar inferencias sobre el desempeño cuando se presentan procesos no intencionados, como cuando el participante adivina una respuesta o responde de manera azarosa (De Boeck & Jeon 2019). Además de ser útiles para entender procesos no intencionados, atípicos y errores, estos parámetros constituyen un importante indicador de procesos de automatización en la identificación de palabras, los que se asocian a mejoras en la comprensión oral y, posteriormente, en la comprensión lectora (Perfetti 1985; Jacobson et al. 2011; Kail & Hall 1994). En conjunto, el análisis del acceso léxico a través de estos parámetros permite un mejor seguimiento de su evolución en el contexto del desarrollo, además de contribuir a la identificación de los procesos implicados en el reconocimiento de la palabra, su organización temporal y la interrelación entre sus componentes, los que resultan vitales para lograr una comprensión más acabada del aprendizaje y uso del léxico.

En años recientes, ha aumentado el uso de dispositivos electrónicos para evaluar habilidades de amplio espectro y diseñar pruebas más eficientes. Las tablets -tabletas de pantalla táctil- han sido incluidas progresivamente, tanto en actividades de aprendizaje como de evaluación, y los resultados obtenidoscon ellas han demostrado tener buenos niveles de validez y confiabilidad al ser comparados con los resultados de pruebas basadas en papel, incluso en la evaluación de habilidades tempranas (Neumann & Neumann 2019). Adicionalmente, la interfaz intuitiva de la pantalla táctil y la movilidad de las tablets se adaptan a los requerimientos de las evaluaciones en niños, mejorando así estas prácticas tanto para propósitos pedagógicos y clínicos, como de investigación.

A pesar de sus ventajas, la introducción de dispositivos móviles en el ámbito de la evaluación del léxico ha sido lenta, especialmente en el caso de las pruebas automatizadas de vocabulario para las diferentes variantes regionales del español. Esta situación constituye una limitación no sólo en términos de los recursos y el tiempo que las evaluaciones tradicionales requieren, sino también en cuanto a las posibilidades de concentrar la información y realizar un análisis evolutivo y comparativo del desarrollo léxico infantil.

Dependiendo de su diseño, las pruebas de vocabulario pueden abarcar un rango amplio de objetivos de evaluación; desde la evaluación de la amplitud y complejidad del vocabulario, adaptaciones pedagógicas y monitoreo de progreso, hasta el tamizaje cognitivo y lingüístico. La automatización de las pruebas de vocabulario permite registrar las respuestas y sus latencias, e igualmente controlar tanto los tiempos de presentación de los estímulos como de las ventanas temporales de respuesta. Asimismo, y dependiendo de su diseño, pueden entregar un feedback inmediato, adaptar la dificultad de los ítems y controlar variables concomitantes, lo que les otorga mayor flexibilidad, capacidad de concentración de datos, potencia analítica y menor costo a largo plazo.

Con respecto a la evaluación de los ítems, cabe considerar que, cuando se trata del vocabulario, las pruebas enfrentan una dificultad adicional derivada del ajuste dinámico de la lengua como respuesta a los cambios que experimentan las comunidades de hablantes (v.gr. la exposición a otras variantes de la lengua). En el ámbito léxico-semántico estos cambios abarcan la introducción, modificación, sustitución y/o pérdida de palabras, pero también los cambios en el significado (Dworkin 2006; Penny 2000). Así, palabras de uso frecuente en un momento dado (como “plátano”), pueden volverse menos disponibles o incluso ser reemplazadas por otras palabras (como “banana”) en periodos relativamente cortos y/o en comunidades específicas, producto de este tipo de cambios. En este caso, como en los anteriores, el registro de la precisión y el tiempo de respuesta pueden ser utilizados para realizar un análisis más profundo de los ítems léxicos con el objetivo de evaluar periódicamente sus cambios en atención a la dinámica de este tipo de variables lingüísticas.

1.3. Objetivos del estudio

Considerando los antecedentes mencionados, el presente estudio tuvo como propósito (1) determinar el valor del TR y su relación con la PR y la edad como variables relevantes para la evaluación del vocabulario receptivo infantil, (2) determinar la vigencia de un subconjunto de ítems de la prueba TEVI-R, y (3) comprobar la adecuación metodológica de una prueba automatizada para la evaluación del vocabulario receptivo infantil (REVOC:1).

2. MÉTODO

2.1. Participantes

La tarea REVOC:1 fue aplicada en una muestra compuesta por 242 niños y niñas preescolares hispanohablantes de la región del Biobío (Chile). Para obtener una muestra heterogénea se seleccionaron estudiantes que asistían a escuelas privadas, escuelas públicas y escuelas de lenguaje 6 de la región del Biobío, Chile. La muestra se dividió en dos grupos etarios; G1 (n =124) de 47 a 62 meses de edad (M=55.10, DE=4.50) y G2 (n=118) de 63 a 78 meses de edad (M=69.22, DE=4.16). Los participantes fueron excluidos del estudio si tenían trastornos neurológicos, problemas de aprendizaje, atención, o trastornos de la memoria (incluso si se encontraban en un proceso de diagnóstico).

Tabla 1

Las evaluaciones se realizaron en las escuelas de los participantes, en una sala acondicionada (con al menos dos metros de distancia entre los participantes y sin visibilidad directa entre ellos). Las evaluaciones se realizaron de manera grupal (2 a 3 niños cada vez), con una tablet de 8 pulgadas y audífonos para cada participante. Previo a la evaluación, se realizó una sesión de exploración de la tablet y una demostración de la tarea. En las sesiones participaron 2 a 3 evaluadoras, y una educadora de párvulos 7 .

Cada sesión de evaluación tuvo una duración máxima de 5 minutos. Los protocolos utilizados fueron revisados por el Comité de Bioética de la Universidad de Concepción, y se obtuvo la autorización administrativa de cada establecimiento, el consentimiento informado de los padres y el asentimiento de los participantes.

2.2. Instrumentos

La tarea REVOC:1 (Receptive vocabulary task for preschoolers) 8 fue diseñada para evaluar el vocabulario receptivo de preescolares basándose en el registro de la PR y el TR (en milisegundos) e implementada como un módulo automatizado para tablets de 8 pulgadas mediante una aplicación para Android. En la tarea se utilizaron los 30 primeros ítems del TEVI-R (Echeverría et al., 2002), una de las pruebas más utilizadas en Chile para evaluar el vocabulario receptivo (véase Anexo A). Además, se agregaron 2 ítems de práctica (con feedback), y se realizó una actualización de las imágenes originales; en total, 128 láminas (imágenes), correspondientes a sustantivos y verbos, con una dimensión de 512 x 512 píxeles cada una.

Las láminas de TEVI-R seleccionadas para el presente estudio corresponden a la forma A de la prueba y el conjunto utilizado contiene los ítems 1 al 30, los que corresponden preferentemente al tramo de edad preescolar. Según la edición de 2002, estos ítems se encontraban bajo el percentil 50 para el grupo preescolar (puntaje T=45 para los niños de 4 a 5 años y T= 39 para los niños de 5 a 6 años), datos que no han sido actualizados desde esa fecha. De esta manera se controló que los ítems utilizados fuesen palabras de alta familiaridad y que no presentaran obsolescencia debida a cambios en la frecuencia de las palabras, especialmente considerando que la primera edición del TEVI-R es de 1982.

REVOC:1 se diseñó bajo un paradigma de elección forzada con cuatro alternativas, modelo que mejora la relación entre el número de ensayos y el incremento de la eficiencia en tareas de este tipo (Vancleef et al. 2018). En la tarea se presenta un estímulo auditivo (palabra) y cuatro alternativas de respuesta en la pantalla de la tablet (4 imágenes). El participante debe realizar su selección tocando la imagen que corresponde con la palabra oída (con o sin audífonos).

Para mantener una estética similar a la utilizada en TEVI-R, se utilizaron imágenes dibujadas y se controlaron los siguientes aspectos: estandarización con fondo blanco, control de brillo, contraste y relación de aspecto. Las posiciones originales de presentación de las imágenes en cada uno de los ítems del TEVI-R se mantuvieron intactas, como se muestra en la Figura 1.

Tanto las consignas originales como la lista de palabras estímulo fueron grabadas en audio (formato wav) por un hablante nativo del español, bajo condiciones ambientales controladas, en un equipo Tascam DR-40 (44.100 Hz, con una profundidad de 16 bit) y con tono medio hablado. Las consignas se presentaron en audio a un grupo de prueba (5 niños de 4 a 5 años) y fueron evaluadas por 2 educadoras de párvulo para valorar su comprensibilidad. También se revisaron las imágenes y, sobre la base de los comentarios del grupo de prueba, se modificaron algunos aspectos de los dibujos (e.g., orientación y dimensión de los objetos).

El software posee una pantalla de ingreso que permite la identificación del participante mediante un código numérico y la selección de la tarea. Una vez seleccionada la tarea (por un adulto), el niño puede realizar la actividad en modo de autoadministración.

La pantalla presenta zonas restringidas de respuesta táctil, es decir, sólo responde si el participante toca el cuadro que contiene la imagen y no si toca el espacio en blanco. Cada ítem fue programado con un tiempo máximo de respuesta de 5000 milisegundos (ms) considerando las latencias más altas del grupo de prueba y los requerimientos básicos de este tipo de evaluación (dinámica, fatiga visual y motora). Como respuesta a la selección táctil del participante, el cuadro que contiene la imagen seleccionada cambia de tono. Una vez concluida la actividad, el software almacena las respuestas en archivos de datos individuales (formato .xml), etiquetados con el código de la tarea, el ítem, el identificador del participante y la fecha y hora de la evaluación.

2.3. Procesamiento de los datos

El análisis de las latencias se realizó con los tiempos de respuesta brutos. No se emplearon técnicas de transformación de datos usualmente utilizadas en estudios experimentales (como los puntos de corte o el uso de log10). Esta decisión se basó en la novedad de la tarea, las características de la muestra, y en el argumento de que estas técnicas pueden tener efectos adversos en la potencia (Ratcliff 1993) e introducir sesgos en el análisis de los parámetros de tendencia central y dispersión, además de eliminar TR válidos (Ulrich & Miller 1994). En concordancia con este enfoque conservador y tras verificar las latencias mínimas, se cortaron únicamente los datos inferiores a 100 ms, en este caso, 5 datos de un total de 5831. Este margen de 100 ms se considera adecuado para tiempos de respuesta genuinos, es decir, que se encuentran sobre el tiempo requerido para procesos fisiológicos como la percepción del estímulo y la respuesta motora (Whelan 2008). Los tiempos máximos programados fueron de 5000 ms, por lo tanto, el rango de tiempo de respuesta fue de 100 a 5000 ms.

3. RESULTADOS

Considerando las características de la tarea, se realizó un análisis descriptivo y de frecuencias de las respuestas totales y por ítem obtenidas por los grupos G1 y G2. Para los tiempos de respuesta se presenta un análisis descriptivo y bivariado usando el coeficiente de correlación de Spearman, utilizado para establecer la relación entre TR y el porcentaje de acierto en cada ítem y para cada grupo etario. El análisis se efectuó con el programa SPSS 25 (IBM, Chicago, IL).

Aunque aquí se presentan únicamente los resultados desglosados por grupo etario, vale la pena mencionar que los niños provenientes de escuelas de lenguaje mostraron un desempeño típico en el total de aciertos del conjunto de palabras incluidas en REVOC:1 (incluso superior a niños de otras escuelas), tanto en el grupo de menor edad (E. públicas, M=21.9, DE=3.6; E. privadas, M=22.9, DE=3.4; E. de lenguaje, M=23.6, DE=4.0) como en el grupo de mayor edad (E. públicas, M=25.8, DE=2.2, E. privadas, M=25.1, DE=3.2; E. de lenguaje, M=25.3, DE=2.9).

A continuación, se presentan los estadísticos descriptivos del puntaje bruto obtenido en la tarea REVOC:1 para cada grupo etario.

Como se aprecia en la Tabla 2, los grupos de edad difieren respecto del total de aciertos, con un mejor desempeño en el reconocimiento de palabras para el grupo de mayor edad.

Dada la distribución no paramétrica de los datos, se utilizó el test W de Wilcoxon, el que permitió confirmar que la diferencia entre los grupos en cuanto a la tasa total de precisión, es significativa (Z= 6.03, p = .000) y presenta un tamaño del efecto moderado (r = .39).

Como se muestra en la Figura 2, para ambos grupos etarios las distribuciones se presentan asimétricas hacia la izquierda, lo que da cuenta del alto nivel de familiaridad de las palabras estímulo seleccionadas. Aunque los valores mínimos son iguales para ambos grupos, el gráfico muestra la mayor concentración de puntuaciones del grupo 2 en el límite superior de puntajes totales. Así, el 50% de los niños del grupo 1 conocían entre 21 y 26 palabras de la lista, mientras que el 50% de los niños del grupo 2 conocía entre 24 y 27 palabras.

En la Tabla 3, se presenta una comparación del desempeño en cada ítem para los dos grupos de edad. Junto a los porcentajes de respuestas correctas (C), incorrectas (I) y omitidas (O), se ha agregado un índice de dificultad corregido para ítems de respuesta múltiple (ID) (Muñiz, 2018), cuyos valores se presentan para cada grupo etario (0=mayor dificultad; 1=menor dificultad). Este índice ha sido utilizado para facilitar la interpretación sobre la familiaridad de las palabras y, por lo tanto, cuando está cerca de 1 puede interpretarse que la palabra es muy familiar. Como puede notarse, aunque el grupo de mayor edad muestra un mejor desempeño en la mayor parte de los ítems, esta diferencia solo es significativa en siete ítems: 3 (volantín), 14 (pulpo), 15 (techo), 17 (gigante), 20 (lancha), 21 (nido) y 26 (arrastrar). Los ítems más difíciles para el grupo de menor edad (ID < a .40), fueron: 27 (buey), 13 (escopeta), 19 (falda), y 21 (nido). Para el grupo de mayor edad sólo el ítem 27 (buey) se encuentra en esta categoría. Los resultados, dan cuenta de un nivel de dificultad bajo para la mayoría de los ítems del set, así como de una desorganización de la secuencia de presentación en función de la dificultad.

3.1. Tiempos de respuesta

Para evaluar las diferencias en los TR de los grupos 1 y 2, y considerando las características de los TR (véase Anexo B) y el volumen (más datos en los TR totales), se realizaron las pruebas t de Student y U de Mann-Whitney sobre los TR totales, previa evaluación de las distribuciones de cada ítem con el estadístico Kolmogorov–Smirnov.

Como se muestra en la Tabla 4, se registraron diferencias estadísticamente significativas debidas a la edad en los TR totales de gran parte de los ítems, con excepción de 15, 18, 19, 23, 24, 28, 29 y 30. Como se esperaba, los TR del G1(los niños más pequeños) son mayores que los del G2, salvo por los ítems 15, 19, 27, 28, 30.

Para caracterizar la distribución de los TR totales por edad, se presenta una serie de gráficos de caja divididos por ítem.

Como se aprecia en la figura 3, los gráficos de caja ilustran la asimetría positiva de los datos, con pocos valores atípicos, lo que da cuenta de la sistematicidad de los TR y la adecuación de la ventana temporal programada para las respuestas. Los TR son relativamente cortos para los primeros 15 ítems, con el 50 % de los datos centrales de cada ítem ubicados mayormente entre los 1000 y 2000 ms (con excepción del ítem 13 y 15), siempre con latencias más cortas para el grupo de mayor edad (G2). La segunda serie de ítems (16 a 30) muestra una tendencia similar entre grupos, con tiempos más cortos para los niños de mayor edad, aunque, como se señaló anteriormente, esta serie presenta menor cantidad de ítems con diferencias significativas entre grupos. A diferencia del caso anterior, la segunda serie muestra un aumento relativo de las latencias, especialmente en los ítems 17, 19 y 27, los que concentran cerca del 50% de sus datos centrales entre los 1000 y los 2500 ms. Este aumento en las latencias da cuenta de la mayor dificultad del ítem 17 para el grupo menor, y del 19 y 27 para ambos grupos etarios. Considerando el conjunto de ítems, las medias de los TR se mantuvieron dentro del rango de los 1160-2228 ms para el grupo 1 y de 940-2471 ms para el grupo 2.

3.2. Correlaciones tr-pr

Para establecer la relación entre TR y PR, se realizó un análisis de correlación entre ambas variables para cada grupo etario. En el primer caso se incluyen los tiempos totales, que dan cuenta del estilo global de respuesta y, en el segundo, únicamente los tiempos de respuesta correctos, dado que permiten establecer la latencia de los aciertos.

Para los tiempos totales (Figura 4), los resultados del grupo 1 muestran correlaciones negativas moderadas entre el TR total y la PR (como porcentaje de acierto) para los ítems de la primera sección que, como se reportó en el análisis descriptivo, son ítems más familiares. Estas correlaciones fueron significativas en los ítems 2 (r = -.31, p =.001), 3 (r = -.22, p =.025), 5 (r = -.32, p =.001), 6 (r = -.31, p =.001), 7 (r = -.25, p =.004), 8 (r = -.30, p =.001), 9 (r = -.21, p =.022), 10 (r = -.23, p =.012), 11 (r = -.30, p =.001) y 12 (r = -.18, p =.045). En este caso, se trata de ítems comparativamente más familiares, en los que un mayor porcentaje de acierto se relaciona con latencias globales más cortas. Por otra parte, se presentaron correlaciones positivas significativas en ítems menos familiares, como 18 (r = .27, p = .003), 19 (r =.22, p =.022) y 27 (r = .32, p = .001), en los que un mayor porcentaje de acierto estuvo relacionado con un aumento en las latencias globales. Para los niños del grupo 2 no figuran correlaciones significativas entre TR total y acierto, salvo en el ítem 20 (r = -.25, p = .012).

Figura 5

Considerando los TR correctos, las correlaciones negativas y significativas para el grupo 1, se presentaron en los ítems 2 (r = -.21, p =.021), 4 (r = -.22, p =.018), 5 (r = -.29, p =.003), 6 (r = -.25, p = .008), 7 (r = -.25, p =.005), 8 (r = -.32, p = .001), 9 (r = -.21, p =.030), 10 (r = -.28, p =.003), 11 (r = -.31, p =.001). En este caso, similar al anterior, se trata de ítems con una alta familiaridad en los que las latencias del acierto fueron cortas. Para este grupo no se presentaron correlaciones positivas significativas. Para el grupo 2, solo se presentaron correlaciones significativas en los ítems 8 (r = -.35, p =.000), 9 (r = -.20, p = .039),17(r = -.22, p =.029), y 20 (r = -.25, p = .023), todos con una alta familiaridad.

Finalmente, se evaluó el efecto de la edad (en meses) sobre los TR correctos en cada uno de los ítems (Figura 6). Los resultados muestran valores significativos en la mayoría de los ítems, con excepción de 15, 19, 25, 27, 28 y 30, los que además mostraron mayor dificultad especialmente en el grupo de menor edad. Las correlaciones negativas de la mayoría de los ítems dan cuenta del efecto de la edad en la reducción de las latencias cuando se responde correctamente. Este efecto es especialmente notorio en ítems más familiares, como ocurre en 2 (r= -0.41, p < .01), 5 (r=-0.43, p < .01), 7(r=0.42, p < .01) y 8 (r= -0.43, p < .01).

4. DISCUSIÓN

En este trabajo se presentaron los resultados preliminares obtenidos por una muestra de preescolares hablantes de español en una tarea automatizada de vocabulario receptivo que registra la precisión de la respuesta (PR) y el tiempo de respuesta (TR). Además de describir el desempeño, estos parámetros fueron utilizados para explorar el conjunto de ítems en cada grupo etario. Debido a las características de la implementación, se discuten algunos aspectos técnicos de la tarea, los que podrían ser útiles para desarrollar la herramienta REVOC:1 y actualizar la prueba original (TEVI-R).

El desempeño global de los niños evidenció diferencias significativas por grupo etario, tanto en la PR como en el TR, lo que da cuenta del importante rol de la edad en el conocimiento y procesamiento del léxico en la etapa preescolar, incluso considerando periodos cortos de tiempo. Cuando se consideró la precisión por ítem, se mantuvieron las diferencias entre los grupos con un mejor desempeño de los niños mayores (5 a 6 años) frente a los menores (4 a 5 años), aunque estas diferencias fueron significativas en solo siete ítems. Además, los resultados mostraron que gran parte de los ítems debían ser reorganizados y en algunos casos reemplazados en función de su índice de dificultad (ID), que en este tipo de tarea se asocia con la familiaridad de la palabra. Como sabemos, las pruebas de rendimiento óptimo requieren de una organización específica; al principio los ítems más fáciles (ID > .70), luego los de dificultad media (ID entre .30 y.70) y al final los más difíciles (ID < .30).

En el caso de los ítems analizados, en el grupo de mayor edad 26 de los 30 ítems presentaron una dificultad baja, 3 una dificultad media y solo 1 una dificultad alta. En el grupo de menor edad, 17 ítems presentaron una dificultad baja, 12 una dificultad media y 1 (el mismo ítem que en el grupo de mayor edad) una dificultad alta. Este resultado, en particular, da cuenta de la importancia de actualizar la organización de los ítems en función de la edad, para que el set utilizado se encuentre balanceado y los ítems en el orden y rango apropiados. Asumiendo que la dificultad de los ítems estaba calibrada al momento de revisión de la prueba (2001), nuestros resultados podrían dar cuenta de variaciones importantes en el léxico infantil durante los últimos años. Sin embargo, debido a que no se cuenta con otros registros de la época y a que las listas de frecuencias disponibles para la variante local del español provienen usualmente de corpus escritos o generados a partir de muestras de habla adulta, resulta difícil determinar en qué medida esto es así.

Para complementar estas observaciones y solventar en parte la ausencia de otros datos, hemos recurrido a los TR que, como hemos señalado, dan cuenta de la velocidad con que se reconoce la palabra, así como del efecto de otros factores sobre el reconocimiento, entre los más importantes, la familiaridad, la frecuencia y la edad de adquisición de las palabras (Monaghan & Ellis, 2002; Vitevitch, et al., 2018). Además, y como se señaló anteriormente, el TR se encuentra estrechamente vinculado a la edad, dado que los cambios evolutivos se asocian a un mejor acceso a las palabras familiares, así como a cambios globales en la velocidad de procesamiento (Kail & Hall, 1994).

4.1. Tiempos de respuesta totales

El análisis descriptivo de los TR totales, que reflejan un estilo global de respuesta, mostró un incremento irregular de las latencias desde los primeros ítems hasta los últimos de la serie. Esta irregularidad, previamente observada en el análisis de la PR, se presentó en ambos grupos etarios y da cuenta de la utilidad de estos parámetros para evaluar la organización de los ítems, así como la necesidad de reorganización de la serie utilizada.

En cuanto al efecto de la edad, las diferencias en los TR totales fueron significativas para gran parte de los ítems y con latencias más altas para los niños más pequeños, lo que demuestra la sensibilidad de un parámetro global como este, frente los cambios producidos por la edad.

El efecto de la edad en la velocidad del procesamiento también se expresa en un acceso comparativamente más lento a las entradas léxicas en palabras menos familiares (o más difíciles), como ocurre con el ítem 17 (gigante, ID=0.47) para el grupo de menor edad, y en los ítems 19 (falda, ID=0.61) y 27 (buey, ID=0.08) para el grupo de mayor edad.

Si consideramos los promedios de TR total para los diferentes ítems, estos se mantuvieron entre 1160-2229 ms para el grupo de menor edad y entre 9402472 ms para el grupo mayor. Estas latencias totales parecen amplias si se las compara con los datos obtenidos por Peter et al. (2019) con infantes ingleses de hasta 31 meses (2;5), quienes mostraron promedios de TR entre los 500 y los 1000 ms en el reconocimiento de palabras familiares. En población hispano-hablante, se han registrado TR de 800-1000 ms para niños de 2;0 a 2;6 años (Hurtado et al. 2007). En ambos estudios, se utilizó el paradigma looking-while-listening junto al registro de movimientos oculares, técnica que captura respuestas más tempranas, principalmente debido a la menor duración del movimiento ocular en comparación con la respuesta motora de la mano (Bekkering et al. 1994). Esta diferencia en la velocidad de la respuesta explica por qué hemos registrado latencias más amplias que en los estudios antes mencionados. Es importante agregar que, como se ha señalado anteriormente, un procedimiento habitual sobre los TR es el recorte de los valores que caen fuera de cierto número de desviaciones de la media (e.g., 2.5), lo que puede afectar de manera importante los principales parámetros de la distribución no gaussiana, característica de este tipo de datos. Este tipo de técnicas de recorte no fueron utilizadas en esta oportunidad, lo que podría complementar la explicación sobre la diferencia entre las latencias obtenidas en otros estudios y las que hemos obtenido con REVOC:1.

Por otra parte, y en respuesta a la pregunta de si la velocidad de procesamiento global (i.e., el estilo de respuesta) estaba relacionada con la precisión de la respuesta, se realizó un análisis de correlación. Los resultados sugieren que esta relación es relevante en los niños menores, pero no en los mayores, ya que solo los niños más pequeños presentaron latencias totales cortas relacionadas a mayores tasas de acierto (estilo de respuesta rápida con acierto) y latencias totales largas relacionadas con mayores tasas de acierto (estilo de respuesta lenta con acierto). Para el grupo de menor edad, el efecto del estilo de respuesta rápida fue notorio en los ítems 2 (plátano), 3 (volantín), 5 (encendedor), 6 (pierna), 7 (cortinas), 8 (pájaro), 9 (vaca), 10 (papa), 11 (estuche), y 12 (nadar), todas ellas palabras de alta familiaridad (ID > .85). Para el mismo grupo se describe un efecto del estilo de respuesta lenta en los ítems 19 (falda) y 27 (buey), ambos con baja familiaridad, y en 18 (ruido) con una familiaridad media. En cambio, para los niños de mayor edad el efecto de la respuesta rápida con acierto fue significativo solo en el ítem 20 (lancha), con una alta familiaridad (ID= .78).

4.2. Tiempos de respuesta correctos

Para complementar los resultados obtenidos en los TR totales, se analizaron los TR correctos siguiendo la misma estrategia. En primer lugar, los TR correctos por ítem mostraron un descenso muy leve en comparación con los TR totales, resultado que puede atribuirse a la baja dificultad general de la lista de palabras. Los TR correctos presentaron promedios entre los 1149-2331 ms para el grupo de menor edad y 910-2180 ms para el mayor. Aunque esta diferencia es pequeña, la reducción de las latencias en el grupo de mayor edad concuerda con datos de otros estudios sobre el efecto de la edad en la velocidad de reconocimiento de palabras (Fernald et al. 2006; Hurtado et al. 2007; Peter et al. 2019).

La relación entre el TR y la PR se analizó únicamente en los casos en que se respondía correctamente, para detectar aciertos rápidos y lentos dependiendo de la palabra. Como se esperaba, los resultados mostraron que los ítems sobre los que se obtuvieron mayores niveles de precisión en el reconocimiento estaban significativamente relacionados con aciertos rápidos. Nuevamente, este efecto resultó importante en el grupo de menor edad, pero tuvo un impacto menor en el de mayor edad. Para el primer grupo, el efecto de aciertos rápidos fue significativo en los ítems 2 (plátano), 4 (pincel), 5 (encendedor), 6 (pierna), 7 (cortinas), 8 (pájaro), 9 (vaca), 10 (papa), 11 (estuche), es decir en palabras más familiares (ID > .85). Para el segundo grupo, en cambio, el efecto de aciertos rápidos fue significativo sólo en los ítems 8 (pájaro), 9 (vaca), 17 (gigante) y 20 (lancha), también con alta familiaridad (ID > .78). Estos resultados, junto a los obtenidos con el TR total, sugieren que los niños más pequeños siguen una estrategia poco conservadora pero productiva cuando las palabras son más familiares. Los resultados también sugieren que los niños mayores utilizan una estrategia más conservadora o reflexiva (con aciertos demorados), la que podría estar relacionada a un mayor efecto de competición entre las entradas léxicas debido a un lexicón más denso. Vale la pena mencionar la posibilidad de un efecto combinado entre la estrategia de respuesta (más o menos conservadora) y la densidad léxica modulada por la edad.

Con respecto al efecto de la edad en meses sobre la velocidad en el reconocimiento de palabras, los resultados mostraron que los cambios en la edad estaban significativamente relacionados con latencias cortas en las respuestas correctas. Este efecto fue significativo especialmente en ítems muy familiares como 2 (plátano), 5 (encendedor), 7 (cortinas), y 8 (pájaro). En contraste, el efecto no se observó en ítems menos familiares para ambos grupos etarios, como en 27 (buey), 28 (acarrear), 19 (falda), y 15 (techo). Estos resultados sugieren que el aumento de la edad se relaciona con una disminución del TR en palabras de alta familiaridad, pero no afectaría necesariamente las latencias de respuesta en las palabras menos familiares.

En general, tanto las diferencias significativas encontradas en los TR por grupo etario, como la relación entre los TR (totales y correctos), el porcentaje de acierto y la edad, son consistentes con otros estudios en los que se ha demostrado la estrecha relación entre la velocidad de procesamiento, la edad y el desarrollo léxico, tanto en calidad como en cantidad (Fernald et al. 2006; Marchman et al. 2015; Peter et al. 2019). Lo anterior da cuenta del potencial de desarrollo que poseen prototipos como el presentado, pero también de las mejoras que deben implementarse en futuras versiones. Una de ellas es la incorporación de propiedades detalladas para los ítems como las de tipo léxico y subléxico, que podrían complementar apropiadamente la interpretación, por ejemplo, de las latencias en ítems menos familiares. En el caso del español, entre los factores documentados y con mayor impacto en el reconocimiento de palabras destacan la frecuencia léxica y la silábica, dado que generarían una competición temprana entre las representaciones de las palabras (Alvarez et al. 2000; González-Alvarez & Palomar-García 2016). Aunque conocidas, estas y otras variables suelen reportarse en función del habla adulta, o bien a partir de corpus estándar que no dan cuenta de las variantes regionales del español. Estos aspectos suponen un gran desafío técnico y científico a la hora de mejorar herramientas automatizadas de evaluación del lenguaje infantil y, sin duda, podrían impulsar el avance de la investigación sobre este campo.

5. CONCLUSIONES

El presente trabajo describe los resultados de REVOC:1, una tarea automatizada de vocabulario receptivo (oral) para niños preescolares hablantes de español. Los resultados dan cuenta de diferencias ignificativas entre los grupos de 4 a 5 y de 5 a 6 años, tanto en la PR como en el TR en la tarea de reconocimiento. De manera consistente, los TR totales y los correctos se vieron influidos por la familiaridad de la palabra, con latencias significativas y más cortas en palabras más conocidas. Al igual que en otros estudios, se verificó el efecto de la edad en el tiempo de respuesta, particularmente en palabras más familiares. Para las palabras menos familiares, los resultados no fueron significativos, por lo que se requiere estudiar la influencia de otros factores (e.g., propiedades léxicas y subléxicas, así como de estrategias metacognitivas) mediante la ampliación y mejora de REVOC:1. Debido a la consistencia mostrada por los datos de TR y PR, los tiempos de respuesta reportados en este trabajo pueden ser utilizados como línea base para futuros estudios y/o desarrollo de herramientas para población preescolar.

En cuanto a los aspectos técnicos, los resultados muestran que la tarea REVOC:1 resulta apropiada para evaluar tanto PR como el TR en tareas de reconocimiento de palabras, incluso en niños pequeños. De las diferencias entre los tiempos globales y tiempos correctos y sus relaciones con la precisión y la edad, puede extraerse que la herramienta ofrece un valioso registro sobre el nivel de eficiencia en la tarea, así como sobre el uso de estrategias evolutivas más o menos conservadoras durante la recuperación léxica. Estas características dan cuenta del potencial diagnóstico del prototipo y justifican su desarrollo. Como puede extraerse de la evaluación de los ítems seleccionados del TEVI-R y tomando en cuenta el potencial de desarrollo de REVOC:1, la optimización de la prueba original requeriría reformular algunos aspectos, entre ellos, la actualización de la lista léxica original, una reorganización de las palabras en función de sus propiedades psicométricas, además de la incorporación de parámetros léxicos y subléxicos relevantes.

Es importante señalar que los datos sobre léxico infantil son escasos si se consideran las distintas variantes regionales del español, lo que ha impuesto grandes limitaciones sobre el estudio de este tipo de población. Herramientas como REVOC:1 podrían contribuir a disminuir esta brecha al ser una opción tecnológicamente eficiente para realizar evaluaciones periódicas y sensibles a los cambios en el léxico, junto con ofrecer información valiosa para la toma de desiciones en el ámbito educativo y clínico.