Конспект лекций Текст предоставлен литагентом icon

Конспект лекций Текст предоставлен литагентом



Смотрите также:
1   ...   7   8   9   10   11   12   13   14   15
^

ЛЕКЦИЯ № 14. Стандартизация тестов




1. Тестовые нормы



Что, несомненно, должен знать и уметь делать каждый грамотный пользователь теста, так это понимать, что такое тестовые нормы и как ими пользоваться.

Первоначальный суммарный балл, подсчитанный с помощью ключа, не является показателем, который можно диагностически интерпретировать. Его называют в тестологии «сырым» тестовым баллом. Применение тестовых норм в профессионально организованной психодиагностике основывается на переводе тестовых баллов из «сырой» шкалы в стандартную. Эта процедура называется стандартизацией тестового балла.

Допустим, мы провели тест из 20 заданий, и испытуемый дал 12 правильных ответов. Можно ли при этом сказать, что способность у испытуемого выражена лучше или хуже, чем в среднем? Нет. Для такого вывода нужно сравнить балл 12 со средним баллом по представительной выборке испытуемых.

Выборка, на которой определяются статистические тестовые нормы, называется выборкой стандартизации . Ее численность, как правило, не меньше 200 человек. Столько должны принять участие в психометрическом эксперименте по определению тестовых норм – в эксперименте по стандартизации теста.

^

2. Корреляция качественных признаков



Корреляция качественных признаков – метод анализа связи переменных, измеряемых в порядковых шкалах и шкалах наименований (см. шкалы измерительные). Наиболее часто такой корреляционный анализ проводят с помощью коэффициентов ранговой корреляции, используемых в случаях, когда обе переменные измеряются в шкалах порядка или легко могут быть преобразованы в ранги. При измерении сравниваемых переменных в шкалах наименований широко применяются коэффициенты сопряженности, в которых в качестве промежуточной расчетной величины используется критерий согласия Пирсона (см. критерий X2). Наиболее часто в таких расчетах пользуются коэффициентом сопряженности Пирсона :



Значение P всегда положительно и измеряется от нуля до единицы. Особенностью коэффициента сопряженности Пирсона является то, что максимальное его значение всегда меньше +1 и в значительной степени зависит от количества наблюдений (размера таблицы). В случае квадратной таблицы (k × k):



Так, в таблице размером (5 × 5) Pmax = 0,894; в таблице (10 × 10) Рmax = 0,949. Поэтому окончательной формой выражения связи между переменными с помощью коэффициента Пирсона является его отношение к величине Рmax для данного случая (Р / Рmax).

При расчете сопряженности находит применение также коэффициент Чупрова:



где t – число столбцов таблицы;

k – число строк таблицы.

В психологической диагностике описанные коэффициенты используются относительно редко.

^

3. Ранговая корреляция



Ранговая корреляция – метод корреляционного анализа, отражающий отношения переменных, упорядоченных по возрастанию их значения. Наиболее часто ранговая корреляция применяется для анализа связи между признаками, измеряемыми в порядковых шкалах (см. шкалы измерительные), а также как один из методов определения корреляции качественных признаков. Достоинством коэффициентов ранговой корреляции является возможность их использования независимо от характера распределения коррелирующих признаков.

В практике наиболее часто применяются такие ранговые меры связи, как коэффициенты ранговой корреляции Спирмена и Кендалла. Первым этапом расчета коэффициентов ранговой корреляции является ранжирование рядов переменных (табл. 2). Процедура ранжирования начинается с расположения переменных по возрастанию их значений. Разным значениям присваиваются ранги, обозначаемые натуральными числами. Если встречается несколько равных по значению переменных, им присваивается усредненный ранг.

Таблица 2
Ранжирование распределения показателей теста (n = 18)

В таблице 2 приведены данные для расчета коэффициентов ранговой корреляции. Во второй графе представлены ранжированные показатели по первому из сравниваемых распределений (оценка IQ, в третьей графе – соответствующие им данные теста зрительной памяти).

^ Коэффициент корреляции рангов Спирмена (rs) определяется из уравнения:



где di – разности между рангами каждой переменной из пар значений X и Y;

n – число сопоставляемых пар.

Используя данные таблицы 2, получаем:



^ Коэффициент корреляции рангов Кендалла τ определяется следующей формулой:



где Р и Q рассчитываются по таблице 12.

Так, в восьмой графе подсчитывается, начиная с первого объекта X, сколько раз его ранг по Y меньше, чем ранг объектов, расположенных ниже. Соответственно, в девятой графе (S2) фиксируется, сколько раз ранг Y больше, чем ранги, стоящие ниже его в столбце X. Подставляя эти данные в формулу, получаем:



При сопоставлении приведенных коэффициентов оказывается, что коэффициент τ более информативен, чем rs, и рассчитывается проще. Поэтому на практике при расчете рановой корреляции отдают предпочтение коэффициенту τ (табл. 3).

Таблица 3
Распределение IQ-оценок и показателей теста зрительной памяти
^

ЛЕКЦИЯ № 15. Измерительные шкалы



Измерительные шкалы (от лат. scala – «лестница») – форма фиксации совокупности признаков изучаемого объекта с упорядочиванием их в определенную числовую систему. Измерительные шкалы представляют собой метрические системы, моделирующие исследуемый феномен путем замены прямых обозначений изучаемых объектов числовыми значениями и отображение пропорций континуального состава элементов объекта в соответствующих числах. Каждому элементу совокупности проявлений свойств изучаемого объекта соответствует определенный балл или шкальный индекс, количественно устанавливающий положение наблюдаемой единицы на шкале, которая охватывает всю совокупность или ее часть, существенную с точки зрения задач исследования. Операция упорядочивания исходных эмпирических данных в шкальные носит название шкалирования. Измерительные шкалы являются главным средством сбора и анализа статистического материала как в прикладных, так и в теоретических исследованиях. Они различаются в зависимости от характера функции, лежащей в основе их построения. В качестве такой функции могут служить: сравнение по признаку убывания или возрастания, ранжирование, оценка интенсивности признака или оценка пропорциональных отношений между признаками. Наиболее общая классификация измерительных шкал предложена С. Стивенсон . В ее основу положен признак метрической детерминированности. Согласно этому признаку шкалы делятся на метрические (интервальные и шкалы отношений) и неметрические (номинативные, шкалы порядка).

^

1. Номинативные шкалы



Номинативные шкалы (шкалы наименований) устанавливают соответствие признака тому или иному классу. Объекты объединяют в классы на основании какого-либо общего свойства (классы эквивалентности) либо символа (обозначения). Необязательно, чтобы между выявленными классами существовала внутренняя взаимосвязь. Само название «шкала наименований» указывает на то, что значения по шкале играют роль лишь названий классов. Одним из распространенных видов номинативной шкалы является классификация объектов на две группы по принципу «А – не-А» (альтернативные признаки в дихотомической шкале наименований). Конкретными примерами применения такой шкалы являются оценивание ответа испытуемого на пункт опросника в виде утверждения или отрицания, соответствие или несоответствие полученного вида ответа ключу (коду) измеряемого свойства (см. личностные опросники).

Примером оценивания в номинативной шкале могут служить классификация решений тестовой задачи или пункт опросника с задачей закрытого типа.

Из названных городов северней расположен город…

1) Псков;

2) Нижний Новгород;

3) Волгоград;

4) Новосибирск;

5) Красноярск.

Противоположностью значения «великодушный» является…

1) расточительный;

2) упрямый;

3) малодушный;

4) скупой;

5) щедрый.

Другой простейшей разновидностью номинативной шкалы является перечень или набор каких-либо признаков, группируемых при сборе информации или ее обработке.

Вы предпочитаете проводить досуг…

1) с товарищами и приятелями;

2) на лоне природы;

3) в занятиях спортом;

4) в кругу семьи и т. д.

Распределение признаков в классах шкалы наименований можно охарактеризовать путем определения абсолютных и относительных частот встречаемости, возможно также определение модальных и центральных значений в классах. Оценка статистической связи между группами признаков возможна с помощью анализа корреляции (см. корреляция качественных признаков).

Если один из рядов переменных представлен в дихотомической шкале наименований, а другой – в любой иной (интернальной, отношений или порядковой), то применяются коэффициенты корреляции бисериальной. Переменные в дихотомической шкале могут распределяться по нормальному закону или иначе в зависимости от этого выбирают способ расчета коэффициентов корреляции.

В строгом смысле номинативная шкала не является шкалой измерения. Она допускает лишь операцию равенства и неравенства и более или менее дифференцированную классификацию признаков. Вместе с тем в психологических исследованиях и психологической диагностике этот вид измерительных шкал имеет достаточно большое значение, особенно при фиксации качественной информации (например, данных проективных методик при сборе психологического анамнеза и т. д.).

^

2. Порядковые шкалы



Порядковые шкалы (ординальные) предназначены для расчленения совокупности признаков на элементы, связанные отношением «больше – меньше», и допускают отнесение переменных к группам, упорядоченным (ранжированным) друг относительно друга и представляющим некое системное единство. Порядковые шкалы дают возможность оценить степень выраженности признака. Они содержат не менее трех классов с установленной последовательностью, не допускающей перестановки. Так, между двумя показателями объектов А и В, обладающих признаком X, возможны три вида отношений: ХА = ХB; ХА ‹ ХB; ХА › ХB. Если имеются три объекта A, В, С и между ними установлены отношения ХА ‹ ХB, ХB ‹ ХC, из этого следует, что ХА ‹ ХC. При этом значения разностей между признаками не устанавливаются (шкала неметрическая, единицы измерения отсутствуют). Упорядочивание признаков в ординальной шкале может быть униполярным (при определении классов исходят из степени выраженности измеряемого свойства) и биполярным (в основе разделения лежит ранг степени приближения к одному из противоположных полюсов свойства).

В качестве примера униполярного упорядочивания может быть приведена шкала оценивания качеств внимания: «весьма устойчивое /устойчивое / лабильное / рассеянное». Примером оценивания по биполярному принципу может служить идентификация выраженности свойств между полярными антонимическими характеристиками свойств личностных проявлений:

1) уравновешенный… нестабильный;

2) общительный… замкнутый;

3) подвижный… медлительный.

Порядковые шкалы относятся к числу распространенных в психологической диагностике. В качестве одного из практических приемов оценивания результатов испытуемого по порядковой шкале можно привести модификацию теста «Прогрессивные матрицы Равена», в котором каждый ответ включает три варианта, последовательно приближающихся к правильному. Вариантом применения порядковой шкалы может быть закрытый дифференцированный ответ на пункт опросника:

Бывает, что я никак не могу принять какое-то окончательное решение и упускаю возможность сделать что-то своевременно.

1. Полностью согласен.

2. Пожалуй, могу согласиться.

3. Не уверен.

4. Скорее не согласен.

5. Совершенно не согласен.

Порядковая шкала допускает операции равенства / неравенства и сравнения по интенсивности. По сравнению со шкалой наименований здесь возможны определение медианы распределения , использование коэффициентов ранговой корреляции и сопряженности (см. корреляция качественных признаков).

^

3. Метрические шкалы



Шкала интервалов относится к метрическим шкалам, в которых элементы упорядочены не только по принципу выраженности измеряемого признака, но и на основе ранжирования признаков по размеру, что выражается интервалами между числами, приписываемыми степени выраженности измеряемого признака.

В шкале интервалов нулевая точка отсчета может устанавливаться произвольно, а величины единиц и направление отсчета могут определяться по избираемым константам.

К разряду шкалы интервалов относятся шкалы стандартного IQ-показателя, Т-баллов, процентилей и другие (см. стандартизация, оценки шкальные). Шкалирование в интервальной шкале составляет основу психометрических измерений.

В шкалах отношений (пропорциональных) числовые значения присваиваются объектам таким образом, чтобы между числами и объектами соблюдалась пропорциональность. Начало отсчета в такой шкале фиксировано. Шкала предусматривает операции равенства / неравенства, больше / меньше, равенства интервалов и равенства отношений.

Примером использования такой шкалы в психологических измерениях может служить шкала порогов абсолютной чувствительности анализатора.

Наряду с делением шкал на метрические и неметрические существует классификация по признаку формы фиксации эмпирических данных, а именно: шкалы вербальные, шкалы числовые и шкалы графические.

В психологической диагностике важным практическим вопросом является оценка надежности, одномерности и обоснованности измерительных шкал. Надежность шкалы определяется на основе анализа устойчивости повторных измерений.

Под валидностью понимается обоснование гипотезы о приспособленности данной шкалы для измерения критериального качества, о полноте его отражения и техническом соответствии самой процедуры шкалирования. Под одномерностью или соразмерностью шкалы понимаются сопоставимость шкалируемых параметров, отсутствие их смещений или пропорциональность между положительными и отрицательными полюсами шкалы, равенство интервалов шкалы или симметричность различных позиций.






страница11/15
Дата конвертации27.11.2013
Размер1,68 Mb.
ТипКонспект
1   ...   7   8   9   10   11   12   13   14   15
Разместите кнопку на своём сайте или блоге:
rud.exdat.com


База данных защищена авторским правом ©exdat 2000-2012
При копировании материала укажите ссылку
обратиться к администрации
Документы