Психология индивидуальных различий. Хрестоматия / Под ред. Ю.Б.Гиппенрейтер и В.Я.Романова. - М.: ЧеРо, 2000. - 776с. - с. 352-360
К истории вопроса. Тесты, традиционно называемые Lтестами интеллекта, берут свое начало от ранних шкал Бинэ - Симона. Эти шкалы (1905, 1908 и 1911) были созданы французскими учеными Бинэ и Симоном для отбора умственно отсталых детей. Первая шкала (1905) состояла из 30 тестов, расположенных в порядке восходящей трудности и охватывающих широкий диапазон функций. Особо выделялись суждения, понимание и рассуждение, которые Бинэ рассматривал как основные компоненты интеллекта. Во второй шкале (1908) количество тестов было увеличено, и все они были сгруппированы по возрастным уров-ням на основе их выполнения примерно 300 нормальными детьми в возрасте между 3 и 13 годами. В качестве показателя использовался умственный возраст, или умственный уровень, соответствующий возрасту нормальных детей, чьим показателям он равнялся.
Среди многих переводов и адаптации шкал Бинэ - Симона наиболее жизнеспособным оказался один из американских вариантов - Стэнфордская редакция.
Тесты Стэнфорд - Бинэ. Первый вариант редакции, подготовленный Терменом и его коллегами по Стэнфордскому университету в 1916 г., внес так много изменений и добавлений в первоисточник, что в сущности представлял собой новую шкалу. Именно в этом варианте был впервые использован коэффициент интеллектуальности (IQ), или отношение между умственным и хронологическим возрастом. Третья редакция Стэнфордской шкалы (1960) применяется и в настоящее время. Рассмотрим основные ее черты.
Тесты в ней сгруппированы по возрастным уровням: начиная с 2 лет до 5 они расположены с полугодовыми интервалами; для возрастов от 5 до 14 лет - годовые интервалы; оставшиеся уровни обозначены как средний взрослый и высший взрослый уровни (1, 2, 3). Интервалы между ними больше, чем один год.
Каждому испытуемому предъявляются только те задания, которые адресованы к его собственному возрастному уровню. Обычно процедура тестирования начинается с заданий, относящихся к более низкому уровню, чем ожидаемый умственный возраст испытуемого. Для испытуемого определяют тот уровень, на котором он справ-ляется со всеми заданиями. Этот уровень называется Lосновным возрастом. Затем тестирование продолжается до тех пор, пока не находят уровень, на котором во всех тестах испытуемый терпит неудачу. Этот уровень называется Lпредельным возрастом. По достижении этого уровня тестирование заканчивается.
Обработка отдельных тестов шкалы Стэнфорд - Бинэ происходит по принципу Lвсё или ничего. В руководстве для каждого теста устанавливается тот минимальный уровень исполнения, с которого тест считается выполненным. Умственный возраст субъекта в шкалах Стэнфорд - Бинэ находится путем приписы-вания ему его Lосновного возраста и добавления к этому возрасту нескольких месяцев за каждый правильно решенный тест, находящийся выше базального уровня. Большинство тестов Стэн-форд - Бинэ непригодны для взрослых, так как характер заданий не позволяет достичь потолка возрастного уровня.
Диагностическое значение любого психологического теста зависит от того, насколько он удовлетворяет некоторым общим требованиям. Первое из них - стандартизация.
Стандартизация. В первоначальном определении психологический тест был назван стандартизированным измерением. Стандартизация означает единообразие процедуры проведения и оценки результатов теста. Стандартизация включает разработку точных инструкций относительно используемых материалов, ограничения времени, формулирования устных инструкций испытуемому, указания, касающиеся предварительных предъявлений теста, способов трактовки вопросов со стороны испытуемого и другие детали проведения теста. Другим важным этапом в стандартизации теста является установление Lнормы.
Норма - это нормальное, или среднее, выполнение. В процессе стандартизации тест проводится на большой репрезентативной выборке испытуемых того типа, для которого он предназначен. Эта группа называется Lстандартизированной выборкой и служит для установления норм.
Другое требование к тесту - надежность.
Надежность. Надежность теста есть постоянство оценок, полученных одним и тем же индивидом при повторном тестировании тем же самым тестом или эквивалентной его формой. Существуют разные типы надежности. Надежность может быть проверена в отношении колебаний во времени, какой-либо специфической выборки заданий или моделей поведения, составляющих тест, роли разных экспериментаторов и других аспектов тестовой ситуации.
Валидность. Самый главный вопрос, задаваемый в отношении психологического теста, касается его валидности, т. е. степени, в которой тест действительно измеряет то, для чего он предназначен. Для определения валидности обычно требуется независимый внешний критерий всего того, что тест должен измерять.
Проблема валидности тестов Стэнфорд - Бинэ решается с разных сторон. Изучение заданий, предлагаемых в тестах, дает некоторую информацию в отношении их валидности. Содержание этих заданий расположено в диапазоне от простого манипулирования до абстрактного рассуждения. По мнению А. Анастази (1S72), можно утверждать, что Стэнфордская шкала валидна по содержанию, поскольку все изучаемые в ней функции релевантны тому, что обычно рассматривается как "ум".
Валидность, обозначаемая как релевантность внешнему критерию, определяется главным образом путем корреляций умственного уровня, полученного по шкале, с разнообразными показателями школьных достижений. Большинство этих корреляций, согласно литературным данным, расположены в диапазоне от 0,40 до 0,75.
Оценки по Стэнфордской шкале довольно высоко коррелируют также с обучаемостью в высших учебных заведениях (0,40-0,70).
Шкала Стэнфорд - Бинэ в течение многих лет служила единственным инструментом для измерения интеллектуальных способностей, а также использовалась в качестве критерия валидности новых интеллектуальных тестов. Этим в значительной степени объясняется тот факт, что IQ стал представляться символом интеллекта, а не показателем по определенному тесту.
К вопросу о стабильности IQ. Причиной такого ошибочного понимания IQ была и относительная стабильность его при повторных испытаниях одних и тех же групп индивидов через некоторый промежуток времени. Можно назвать по крайней мере две основные причины такой относительной стабильности.
Во-первых, это относительная стабильность окружающей среды, в которой живут испытуемые. Во-вторых, умения и навыки, полученные на ранних стадиях развития, не только сохраняются, но и служат предпосылками для последующего обучения. Следовательно, дети с более высоким IQ в дальнейшем будут иметь преимущество перед детьми с низким IQ, так как они больше знают и умеют, а потому в состоянии быстрее и лучше обучаться в будущем.
Однако относительная стабильность IQ носит лишь статистический характер. Иначе говоря, лишь в групповых исследованиях могут быть получены достаточно широкие корреляции между повторными испытаниями по шкале Стэнфорд - Бинэ. Изучение же отдельных индивидов обнаруживает большие сдвиги показателей IQ, полученных через временные интервалы. О причинах и характере этих колебаний будет сказано позднее.
Тесты Векслера. Еще один тип индивидуальных интеллектуальных тестов представлен шкалами интеллекта Векслера. Эти шкалы отличаются от тестов Стэнфорд - Бинэ некоторыми важ-ными чертами, делающими их похожими по форме на групповые тесты. Другая характерная особенность шкал Векслера состоит во введении двух видов методик - вербальных тестов и тестов на Lисполнение (так называют задания невербального, действенного характера, например сложить фигуру из частей и т. д.).
Опубликованная в 1955 г. шкала Векслера для взрослых содержит 11 тестов. Шесть из них сгруппированы в вербальную шкалу и пять - в шкалу исполнения. В вербальную шкалу входят задания, требующие осведомленности в некоторых областях знания, задания на понимание (смысла пословиц, поведения в некоторых обстоятельствах и т. д.), арифметические задачи (в пределах начальной школы), нахождение сходства, определение словарного запаса, запоминание цифр. Шкала исполнения включает задания на завершение картинок, конструирование блоков (из кубиков), расположение картинок по порядку и некоторые другие.
Примеры заданий
1. Общая осведомленность.
1) Откуда привозят кофе?
2) Кто написал Макбет?
3) Что такое антропология?
4) Насколько Нью-Йорк удален от Сан-Франциско?
5) Кто изобрел паровую машину?
2. Общее понимание.
1) Что бы Вы сделали, если бы Вы находились в лодке, а кто-то упал за борт?
2) Почему государство требует от водителей автомобилей, чтобы они имели водительские права?
3) Почему у нас градуированный подоходный налог, так что богатые платят больше, чем бедные
3. Арифметическое рассуждение.
1) Сколько яблок можно купить на 81 цент, если каждое яблоко стоит 9 центов?
2) Три человека могут закончить работу за 9 дней. Сколько человек закончат работу за 3 дня?
3) Автомобиль проезжает 20 миль за 30 минут. Сколько миль он проедет за 3 минуты?
4. Цифры вперед и назад.
1) (Субъект повторяет следующие числа в том порядке, в котором они ему зачитывались) 3,8,4,6,2,9,1.
2) Субъект повторяет следующие числа в порядке, обратном тому, в котором они ему зачитывались) 6,4,1,8,2,5,7.
5. Сходство (Испытуемого просят рассказать о том, чем похожи следующие пары)
1) Яблоко и персик.
2) Новелла и картина.
3) Аэроплан и поезд.
4) Закон и приказ.
5) Кит и дельфин.
При выполнении тестов принимается в расчет как скорость, так и точность.
Стандартизация, валидность и надежность тестов Векслера. Тесты Векслера нормировались на выборке в 1700 человек (возраст от 16 до 64 лет). Средний IQ по выборе равен 100 при 10=15. Надежность тестов высока: для полной шкалы она составляет 0,97, для вербальных тестов - 0,96, для тестов исполнения - 0,94.
Данные о валидности шкалы Векслера получены отдельно для вербальных тестов и тестов исполнения. Корреляция оценок по тестам исполнения с успешностью деятельности канцелярских служащих равна 0,30, а корреляции показателей вербальных тестов с учебой в колледже не превышают 0,50. Помимо этого проверка по валидности осуществлялась путем корреляции шкал Векслера со шкалами Стэнфорд - Бинэ. Получены коэффициенты порядка 0,80 и ниже.
Групповые тесты интеллекта. Помимо индивидуальных шкал разработаны групповые тесты интеллекта. Они используются преимущественно при массовых обследованиях в системе высшего и среднего образования, в промышленности, армии и при отборе на государственную службу.
Рассмотрим некоторые принципиальные различия между групповыми и индивидуальными тестами интеллекта. Групповые тесты одновременно могут быть применены на большой выборке испытуемых. Благодаря использованию специальных тестовых брошюр и листов для ответов при групповом тестировании ликвидирована необходимость во взаимодействии между испытуемым и экспериментатором. Роль экспериментатора чрезвычайно упрощена. Это позволяет обеспечить более стандартные условия при тестировании. Регистрация выполнения и обработка данных при групповом тестировании легче и может быть выполнена машинами. Групповые тесты обычно лучше нормированы (на больших выборках порядка 100 000-500 000 человек).
Групповые тесты отличаются от индивидуальных и по форме. Обычно в групповых тестах испытуемый должен выбрать правильный ответ из предлагаемых ему четырех или пяти, задания предъявляют в порядке возрастания трудности.
Наряду с некоторыми положительными чертами групповые тесты обладают серьезными недостатками, ограничивающими их применение. К недостаткам относятся: уменьшение роли психолога-экспериментатора, отсутствие индивидуального подхода к испытуемым, недостаток дополнительной информации об испытуемых, процессе их работы и пр.
Групповые тесты чаще всего представляют собой многоуровневые батареи. Иначе говоря, они сгруппированы между собой по рангам трудности для испытуемых разных возрастов, классов, уровней развития и т. д. Большинство батарей применимы к возрастным группам, начиная с 5-6 лет и кончая взрослыми разных возрастов. Подробное описание, а также сведения о валидности, надежности групповых тестов можно найти в книге Э. Анастази LПсихологическое тестирование.
Теоретические вопросы тестирования интеллекта. Остано-вимся кратко на анализе теоретических основ тестирования интеллекта и связанном с ним вопросе о целях применения интеллектуальных тестов в зарубежной психологии.
На протяжении более чем полувека одной из основных задач психологической диагностики интеллекта признавалось измерение количественных различий интеллектуального уровня инди-видов. Сведение интеллектуальных различий к коэффициенту умственного уровня вытекало из представлений об интеллектах как общей врожденной способности, лежащей в основе всех достижений человека и измеряемой с помощью тестов.
В настоящее время эта точка зрения подвергается пересмотру со стороны многих западных психологов. Накопленные тестологией факты неопровержимо свидетельствуют об изменчивости того, что измеряется коэффициентом IQ. Все большее признание получает представление о том, что с помощью интеллектуальных тестов определяются не природные различия между людьми, а наличный уровень знаний и умений, сложившихся к моменту испытания. Не вызывает сомнения, что уровень овладения ими зависит как от степени обученности индивидов, так и от их природных возможностей. Отделить влияние одного от другого в тестовых результатах представляется невозможным.
Зависимость тестовых оценок от влияний окружающей среды приводит к их непостоянству, изменчивости. Понимание этого привело к изменению основной цели тестологии. Если раньше результаты измерения по интеллектуальным тестам чаще всего использовались для распределения испытуемых по категориям и для долговременных прогнозов, то сейчас среди западных психо-логов наблюдается отказ от тенденции наклеивать ярлыки. Жесткая, неизменная классификация индивидов по результатам интеллектуальных тестов имела тяжелые отрицательные последствия, так как низкий IQ оставлял на ребенке печать неполноценности, менял отношение к нему окружающих и тем самым способствовал сохранению и даже усилению неблагополучных условий развития. В настоящее время пользу тестов прогрессивные тестологи видят в возможности изменения достигнутого уровня некоторых интеллектуальных навыков и умений. Что касается прогнозов по результатам тестирования, то сейчас наибольшее применение интеллектуальные тесты находят для предсказания школьных достижений.
Следует отметить, что для правильных оценок и прогнозов школьных достижений результаты тестирования должны быть дополнены сведениями из других источников - наблюдениями за поведением, данными биографического характера, анализом методов обучения и т. д. Кроме того, для правильной интерпретации результатов тестирования следует знать о степени трениро-ванности испытуемых в выполнении тестов, нужно учитывать мотивацию и эмоциональное состояние во время тестирования, влияние на тестовые оценки личности экспериментатора, ситуации эксперимента, предшествующей тестированию деятельности испытуемого, и многое другое.
Влияние окружающей среды на результаты интеллектуальных тестов столь велико, что для более или менее успешного прогноза с их помощью выполнения какой-либо деятельности психологии пытаются вводить специальные индексы окружающей среды.
Принимая во внимание сведения из дополнительных источни-ков и учитывая многочисленные средовые влияния на тестовые результаты, можно с успехом использовать интеллектуальные тесты для характеристики реального состояния уровня развития некоторых навыков. Тестирование может быть также полезным методом для изучения изменчивости поведения, развития навыков, что, в свою очередь, является предпосылкой для планомерного формирования их в нужном направлении.
Кроме того, предполагается, что тестовые оценки могут дать количественный показатель степени неблагополучного для психического развития социоэкономического статуса, а это может послужить толчком для исправления программ и методов обучения с целью улучшения школьной успеваемости у детей из неблагополучной среды.