При выполнении серии
В серии
Серия
За каждое правильное решение присваивается 1 балл, подсчитывается число правильных решений в каждой серии и общее число баллов, которые переводятся либо в стандартные баллы (стэны), либо в стандартный коэффициент IQ. На основе результатов по сериям вычисляют также «индекс вариабельности». Существуют полученные на выборке стандартизации распределения числа правильных решений по сериям, соответствующие общей сумме баллов. Табличное распределение сравнивается с полученным при тестировании испытуемого, а разности ожидаемой и эмпирической оценок суммируются без учета знака. «Индекс вариабельности» характеризует достоверность результатов и направлен на выявление испытуемых, решавших задания путем угадывания или симулирующих низкий результат (не решавших простые задачи).
Нормальное значение индекса равно 0-4, при значении 7 ответы испытуемого считаются недостоверными.
Как уже было отмечено раньше, вряд ли такую интерпретацию можно считать единственно возможной. В наших исследованиях показано, что решение теста Равена имеет вероятностный характер, поскольку отсутствие интереса к простым заданиям, неправильное понимание задачи (провоцируемое самим материалом теста) приводят к тому, что испытуемый, решая сложные задания, может допустить ошибку в простых.
Надежность теста Равена варьирует в пределах от 0,70 до 0,89; средняя трудность заданий теста 0,32; корреляция с успешностью школьного обучения (оценкой успеваемости) – 0,72. Корреляция с IQ по тесту Д. Векслера (WAIS) составляет 0,70-0,74 (взрослые) и 0,91 (дети 9-10 лет), с арифметическими тестами – до 0,87. Наши исследования показали, что тест Равена не является метрологически безупречным.
Задания D12 и Е8 сконструированы настолько неудачно, что вероятность их правильного решения (0,13 и 0,14) не превышает значимой вероятности случайного решения этого задания (р = 0,125). В задания либо заложена неправильная идея, либо форма материала делает вероятным для испытуемого логические построения, не предусмотренные разработчиком.
В задании ЕЮ, помимо правильного варианта ответа (№ 6), есть два (№ 1 и № 2), частота выбора которых испытуемыми статистически значимо превышает вероятность случайного ответа.
Для задания С12 оценка вероятности выбора правильного ответа (№2) превышает границу статистической значимости, но оценка вероятности выбора ложного варианта (№ 4) значимо превосходит вероятность правильного выбора.
То есть сама структура неверно сконструированного задания наводит испытуемого на ложный ответ. Такое положение дел есть следствие конфликта двух теорий, эклектически положенных в основу теста: перцептивной (гештальт-теория) и теории общего интеллекта. Перцептивные характеристики задания мешают испытуемому произвести его последовательный логический анализ. Тем самым не стратегия «от целого к деталям» вступает в конфликт со стратегией «от деталей к целому», а перцептивная закономерность противоречит логической.
Согласно модели Юсупова, число заданий в тесте уровня не должно превышать 7, а в тесте Равена их 60 (в сокращенном варианте – 30). Тест явно информационно избыточен. Базовыми заданиями, достоверно различающимися по уровню сложности, можно считать только: В8, А12, С4 (или D6), D8 (или D10, илиЕ2),С8, Е6, ЕЮ, Е12.
Число легких заданий в тесте Равена чрезмерно велико – на долю их приходится почти половина всех заданий теста. Более того, нет соответствия между эмпирической и стандартной трудностью заданий (n = 0,543).
Для оценки сложности задания нами и был предложен модифицированный показатель сложности: