En tests de rendimiento óptimo (pruebas de rendimiento y de inteligencia) se pretende medir el rendimiento máximo al que llega cada persona ante una serie de preguntas o tareas.
Usualmente, el formato de respuesta de estos ítems se ajusta a uno de los siguientes tres formatos:
a) Elección binaria: De dos alternativas, se elige la que se considera correcta (Sí o No;
verdadero-falso).
Por ejemplo, un ítem de un test de rendimiento en Historia Moderna puede ser:
"Pi y Margall fue uno de los presidentes de la 1ª República Española" V F
b) Elección múltiple: Entre más de dos alternativas se elige la que se considera correcta. Es
sin duda el formato de respuesta más utilizado, entre otras por razones de objetividad y otras
de tipo operativo.
Por ejemplo, un ítem de un test de aptitud verbal puede ser:
"Automóvil es a volante como bicicleta es a ....”
- a) Pedal
- b) Sillín
- c) Manillar
- d) Parrilla
c) Emparejamiento: Consiste en encontrar las parejas entre dos conjuntos de conceptos. Por ejemplo, un ítem de un cuestionario sobre conocimientos de políticos españoles contemporáneos puede ser:
"Enlace mediante una línea el nombre del político con el partido político al que pertenece".
J. A. Durán i Lleida PSOE
Carlos Solchaga CIU
Iñaki Anasagasti PNV
Rodrigo Rato PP
Mediante las pruebas de rendimiento típico se quiere reflejar el comportamiento ordinario de las personas, no teniendo sentido el concepto de rendimiento máximo dado que el objeto de la evaluación es algún tipo de opinión, actitud o rasgo de personalidad. El formato de respuesta de los cuestionarios de rendimiento típico se ajusta a alguno de los siguientes:
a) Opción binaria: La persona debe manifestar si está de acuerdo o en desacuerdo con una afirmación. Por ejemplo, un ítem de un cuestionario sobre la actitud de los padres hacia los profesores de sus hijos puede ser:
"En realidad, los profesores en el colegio hacen poco más que cuidar a nuestros hijos cuando nosotros trabajamos"
Acuerdo ( ) Desacuerdo ( )
b) Categorías ordenadas: El formato establece un continuo ordinal de más de dos categorías, que permite a la persona matizar mejor su respuesta. Normalmente, este continuo está formado por 5 ó 7 categorías ordenadas, con una categoría central para indicar la valencia neutra y a partir de la cual posicionarse en uno u otro sentido. Por ejemplo, un ítem sobre la actitud de los adolescentes hacia el consumo de drogas, podría ser el que sigue:
"Las drogas pueden realmente resolver problemas de uno mismo"
( ) Muy en Desacuerdo
( ) Bastante en Desacuerdo
( ) Neutral
( ) Bastante de Acuerdo
( ) Muy de Acuerdo
A veces, se establecen nominalmente los dos extremos del continuo, dejando señaladas las
restantes categorías del mismo:
MD ____ ____ ____ ____ ____ MA
o se ordenan numéricamente las categorías sucesivas:
1 2 3 4 5 6 7
c) Adjetivos bipolares: Este formato es típico de lo que se denomina "diferencial semántico", un instrumento formado por pares de adjetivos opuestos, cada uno de los cuales representa un continuo bipolar con varias categorías, y que permite estudiar el significado semántico que se atribuye a determinados constructos, personas o instituciones.
Por ejemplo:
- Alegre ________ ________ ________ __ Triste
- Listo ________ ________ ________ __ Tonto
- Simpático ________ ________ ________ Antipático
- Feliz ________ ________ ________ __ Infeliz
- Social___ ________ ________ ________ __Asocial
3.2.- REDACCIÓN DE ÍTEMS
Algunas de las recomendaciones generales en la redacción de ítems en pruebas de rendimiento óptimo son las siguientes:
- La idea principal del ítem debe estar en el enunciado.
- Simplicidad en el enunciado.
- Evitar los conocimientos excesivamente triviales o excesivamente “rebuscados”.
- Evitar dar información irrelevante en el enunciado.
- Evitar dar indicios sobre la solución.
- Evitar cuestiones sobre opiniones.
- No encadenar unos ítems con otros.
- Anticipar la dificultad e incluir preguntas de todo rango de dificultad (casi siempre
conviene más preguntas de dificultad media).
- La dificultad no debe estar en la comprensión del ítem.
- Minimizar el tiempo de lectura.
- Evitar el uso de negaciones (si se incluyen, subrayarlas), errores gramaticales y
ortográficos.
En cuanto al número de opciones, con dos distractores es suficiente; pero si la prueba es corta, es necesario un mayor número de distractores para evitar los efectos de los aciertos aleatorios. Todos los distractores deben ser de longitud y lenguaje parecidos y también se deben evitar los solapamientos entre ellos. Por supuesto, se deben evitar los llamados “ítems defectuosos” que son aquellos ítems con más de una respuesta correcta; aunque parezca absurdo son errores que se siguen cometiendo con excesiva frecuencia. Por otro lado, se deben evitar las opciones del tipo “no lo sé”, “todas las anteriores son correctas” o “ninguna de las anteriores es correcta”; así como balancear la posición de la opción correcta en las diferentes preguntas para que no se sitúe siempre en la misma opción.
En las pruebas de rendimiento óptimo es muy importante tener en cuenta la dificultad existente en crear las alternativas incorrectas, dado que no deben ser posibilidades absurdas de respuesta que se puedan eliminar con cierto grado de sentido común. Bien al contrario, esas alternativas no ciertas deben ser elegidas entre los errores o confusiones que usualmente tienen las personas que no conocen la respuesta correcta de la pregunta en cuestión. Deben estar escritas en lenguaje técnico y ser plausibles para quien no conoce la respuesta, evitando en todo momento alternativas “graciosas” u otras que no serían elegidas por nadie. Otra buena recomendación en este sentido sería el uso de alternativas de respuesta que son verdaderas para otras preguntas incluidas en el cuestionario. Desde luego, el establecimiento de alternativas múltiples exige un claro conocimiento tanto del contenido a evaluar como de las personas a las que va dirigida la prueba. Una reciente revisión de las orientaciones a seguir a la hora de escribir ítems de opción múltiple se encuentra en Haladyna, Downing y Rodríguez (2002).
Otras recomendaciones a tener presente en las pruebas de rendimiento óptimo son:
- El número de preguntas debe ser proporcional a la importancia dada a cada tema.
- Corregir los aciertos obtenidos por azar.
- Cuantos más ítems, mejor.
Respecto a la manera de formular las cuestiones en tests de rendimiento típico (declaraciones o afirmaciones ante las cuales se debe opinar), se han propuesto algunas sugerencias que pueden ayudar a su correcta redacción:
- Utilizar el tiempo presente.
- Deben ser “relevantes”, en el sentido de que su contenido debe relacionarse
claramente con el rasgo.
- Contenido claro, evitando excesiva generalidad. Frases cortas, simples e inteligibles.
Evitar incluir dos contenidos en un ítem.
- Tener en cuenta que lo que se dice en la declaración pueda ser asumido por alguien, y
no por todos.
- En escalas de actitudes, no plantear la existencia o no de hechos, sino el
posicionamiento personal sobre la afirmación. Redactar ítems que discriminen entre
los de actitud positiva y los de actitud negativa.
- Para minimizar la aquiescencia (tendencia a responder afirmativamente, independientemente del contenido por el que se pregunta) conviene redactar ítems de modo directo e inverso (declaraciones tanto en sentido positivo como en sentido negativo). A posteriori, se puede comprobar cómo una persona ha respondido a los ítems directos e inversos. También puede comprobarse que la correlación entre ambos tipos de ítems es alta.
- Evitar el uso dobles negaciones (no, ninguno, nunca,...) y de universales (todo, siempre, nada,...).
- En lo posible, aunque no es fácil, se debe minimizar la posibilidad de deseabilidad social (emitir respuestas socialmente aceptables para transmitir una imagen positiva).
Puede deberse a varias cosas: desajuste psicológico, insinceridad consciente,... El grado de deseabilidad social que manifiestan los ítems puede evaluarse mediante jueces, y comparar las respuestas de una persona con estas valoraciones. En tests de personalidad puede incluirse una escala de sinceridad.
El número de categorías que se suelen incluir en este tipo de ítems es usualmente de cinco ya que, a partir de ese número de categorías no mejoran las propiedades psicométricas de los ítems. Además, un número muy elevado de categorías (siete u ocho) lleva a inconsistencias en las respuestas, que es una fuente de error. Un número muy reducido (dos ó tres) lleva a poca discriminación (menor variabilidad) y a reducir la fiabilidad, aunque siempre puede compensarse con un mayor número de ítems. No obstante, en poblaciones especiales (niños, discapacitados, mayores…) se aconseja el uso de un menor número de categorías.
También se ha planteado en ítems de rendimiento típico (principalmente en escalas de actitudes o tests de personalidad donde no se pide el grado de frecuencia de un comportamiento) si es correcto o no la inclusión de una categoría central en las opciones de respuesta (“indiferente”, “neutral”, “dudo”, “no sé”…). Podrían generar problemas ya que muchas veces son elegidas por aquellas personas que no se comprometen con lo que se les está preguntando, que el enunciado les resulta ambigüo o simplemente que ignoran el contenido del enunciado. En realidad, deberían ser seleccionadas por las personas auténticamente indecisas. La investigación en este sentido nos dice que los indicadores
psicométricos de los ítems no se alteran mucho con o sin categoría central, cuando el número de categorías es mayor de tres. En todo caso, se puede comprobar si las personas con nivel medio en el total del test tienden a elegir más frecuentemente las categorías centrales.
No hay comentarios:
Publicar un comentario