→ Пошук по сайту       Увійти / Зареєструватися
Знання Тестологічний словник-довідник

Тестологічний словник-довідник - К

Ключові поняття:
Коефіцієнт кореляції бісеріальний, Коефіцієнт ваговий, Крива нормального розподілу, Квантилі, Квартиль, Кластер, Ключ до завдання, Ключ до тесту, Кмітливість, Коваріація, Кодифікатор, Коефіцієнт (Кронбаха) Альфа, Підходи визначення вагових коефіцієнтів, Коефіцієнт валідності, Коефіцієнт дискримінативності, Коефіцієнт контингенції (Пірсона), Коефіцієнт кореляції, Коефіцієнт кореляції точково-бісеріальний, Коефіцієнт угадування, Комплект тестовий, Комп'ютерне адаптивне тестування, Контамінація критерію, Конфіденційність тестування, Кореляція, Користувач педагогічного тесту, Крива розподілу балів кумулятивна (кумулята), Критерій, Критерії, Критерії валідності результатів вимірювання, Критерій І, Критерій II, Критерій III, Критерій IV, Критерій V, Критерій VI, Критерій VII, Критерій VIII, Критерій IX, Кумуляція.

Катафатичний тест — див. → Тест катафатичний.

Квантилі — точки на числовій осі вимірюваної ознаки, які ділять усю сукупність упорядкованих елементів на однакові за розміром (обсягом) групи.

Квартиль — значення ознаки, які ділять упорядковану за зростанням сукупність елементів на 4 рівних частини. Перший квартиль відповідає 25-му процентилю, другий — медіана, третій квартиль відповідає 75-му процентилю. Процентиліта квартилі використовують для визначення концентрації елементів сукупності в групах із певним значеням ознак чи інтервалів, зокрема застосовують для виділення окремих груп тестованих, найбільш типових або нетипових для певної множини спостережень. Кількість завдань у тесті має бути вказана у специфікації тесту і враховувати низку обмежень:

  1. Вік тестованих.
  2. Час, відведений на тестування.
  3. Тип використовуваних тестових завдань.
  4. Тип інтерпретації за результатами тестування.

Кластер — підмножина елементів сукупності з певними набором ознак, об'єднаних за принципом подібності та взаємопов'язаності.

Кластерний аналіз — див. → Аналіз кластерний.

Ключ до завдання — правильна відповідь до тестового завдання. Завдання з короткою відповіддю можуть мати кілька варіантів відповідей. Для завдань із розгорнутою відповіддю єдиного формалізованого ключа немає, правильність виконання завдання визначають експерти, які перевіряють за схемами оцінювання, що їх пропонує автор завдання.

Ключ до тесту — сукупність ключів до всіх завдань тесту.

Кмітливість — під час виконання тесту— компетентне володіння навичками виконання тестів і здатністю перехитрити не зовсім досвідчених авторів тестів (наприклад, уміння знайти не зовсім правдиві дистрактори, відкинути варіанти відповідей, складених із порушенням правил написання завдань множинного вибору).

Коваріація — відхилення значень двох взаємопов'язаних ознак X, та Y, від їхніх середніх значень х та у. Наприклад, X, результат тестування і-го тестованого за допомогою одного тесту, а У, — результат тестування того самого тестованого за допомогою іншого тесту. Якщо більшість тестованих, які отримали результат вищий (нижчий) за середній за один тест, такі самі результати виявляють і за другий тест, то коваріація позитивна, якщо ж за один тест тестований отримав високі результати, а за інший низькі — коваріація негативна.

Кодифікатор — перелік елементів навчального предмета, у якому кожен елемент позначений певним кодом. Кодифікатор укладають відповідно до державної програми з відповідного предмета.

Коефіцієнт (Кронбаха) Альфа — узагальнена міра внутрішньої гомогенності завдань тесту.

Коефіцієнт ваговий — числовий відносний показник, який характеризує ступінь складності (вагомості або важливості) певного тестового завдання. Існує два підходи щодо визначення вагових коефіцієнтів.

  Перший — це визначення вагових коефіцієнтів до завдань за кількістю кроків або кількістю розумових дій, які здійснив тестований для успішного виконання завдання. Є суб'єктивним і формальним, бо сума значної кількості простих кроків для виконання завдання, що вимагає репродуктивного рівня розумової діяльності, може давати більший внесок, ніж один складний крок (розумова дія), що передбачає елементи когнітивних процесів високого рівня (аналіз, синтез, оцінювання). Таке присвоєння вагових коефіцієнтів знижує надійність тесту.

  Другий підхід — установлення вагових коефіцієнтів, пропорційних складності завдання за статистичними показниками після отримання результатів тестування. Для його наукового розв'язання використовують складні математичні моделі на основі сучасної тестової теорії (Item Response Theory — IRT).

Коефіцієнт валідності — коефіцієнт кореляції, який виражає взаємозв'язок між сукупністю тестових балів і кри-терійним мірилом.

Коефіцієнт дискримінативності — числовий коефіцієнт якості завдання, один із показників диференційної здатності; різниця частки тестованих із сильної групи, які правильно виконали завдання, і частки тестованих із слабкої групи, які теж правильно виконали завдання. Завдання, на яке однаково добре можуть відповісти як сильні, так і слабкі тестовані, не має хорошої розподільної здатності й не дає жодної інформації про відносний рівень результатів.

Інтерпретацію коефіцієнта дискримінативності згідно з класичною тестовою теорією наведено в таблиці.

  Значення коефіцієнта Інтерпретація значення коефіцієнта
  Більше чи дорівнює 0,40 Завдання загалом ефективне
  Від 0,30 до 0,39 Завдання задовільне
  Від 0,20 до 0,29 Завданння треба проаналізувати на його придатність у тесті
  Менше ніж 0,19 Завдання треба вилучити з тесту або детально його проаналізувати й переробити

  Коефіцієнт контингенції (Пірсона) — оцінює щільність зв'язку між показниками, поданими альтернативною шкалою; використовують для 4-клітинкової таблиці. У практиці педагогічних вимірювань використовують для аналізу завдань у критеріально зорієнтованому тесті, мета якого — розподілити вибірку на дві дихотомічні групи (атестовано-не атестовано). Цей показник оцінює «чутливість» завдання до критеріального бала, тобто чим він ближчий до 1,тим щільніший зв'язок між результатами тестування та якістю виконання завдань. Макет таблиці для визначення коефіцієнта континген-ції має вигляд:

  Результат виконання тесту Результат виконання j-ro завдання Разом
  0 1
  Неатестований a b
  Атестований c d
  Разом
  де: а - кількість тестованих, які неправильно виконали j-e завдання й неатестовані за результатами всього тесту ;

  b - кількість тестованих, які правильно виконали j-e завдання й неатестовані за результатами всього тесту ;

  с - кількість тестованих, які неправильно виконали j-e завдання й атестовані за результатами всього тесту;

  d— кількість тестованих, які правильно виконали j-e завдання й атестовані за результатами всього тесту. Тоді


У практиці масового педагогічного тестування встановлено, що значення Сдля ефективного завдання має бути більше ніж 0,3 для певного критеріального бала.

Коефіцієнт кореляції — характеристика ступеня взаємозв'язку між двома співзалежними ознаками (наборами тестових балів чи іншими видами оцінювання). Набуває значень від + 1 до - 1. Додатне значення гсвідчить про прямий зв'язок між ознаками X,- та X,, а від'ємне — про зворотний.Чим ближче коефіцієнт кореляції до одиниці, тим щільніший зв'язок.

  Коефіцієнт кореляції визначають за формулою:

  де — середнє квадратичне відхилення для ознаки .

  На діаграмі розкиду графічно відображено результати тестування однієї групи тестованих (40 осіб) за допомогою двох тестів, середнє значення тестового бала для обох — 50, середнє квадратичне відхилення балів — 15, коефіцієнт кореляції г = 0,70.

  Коефіцієнт кореляції бісеріальний — статистичний показник, який використовують для визначення диферен-ційної здатності завдання; коефіцієнт кореляції між двома змінними, із яких одна виміряна в дихотомічній шкалі, друга — в інтервальній. Пов'язаний ізточково-бісеріальним коефіцієнтом, але має суттєві відмінності: при визначенні точково-бісеріального коефіцієнта вважають, що одна з двох змінних дихотомічна, а для бісеріального коефіцієнта кореляції вважають, що обидві змінні неперервні за умови нормального розподілу обох змінних. Скажімо, одну із змінних розподілено на дві групи: тестовані, які правильно виконали завдання, і ті, хто його виконав неправильно. Тоді бюеріальний коефіцієнт кореляції обчислюють за формулою:

   де — частка правильних відповідей;

   — частка неправильних відповідей. Коефіцієнт кореляції Спірмена визначають за формулою:

   де п — число рангів;

   — різниця між рангами за факторною ознакою, та результативного ,

   Інакше

   Отже, спочатку в однаковій послідовності ранжуються бали за результатами первинного й повторного тестів, а потім визначається різниця рангів ds •
  Коефіцієнт кореляції набуває значень у межах ± 1, тобто . Чим ближче , тим більша узгодженість між результатами тестування. Від'ємне значення р свідчить про протилежну узгодженість. Оскільки різниця в балах може виникнути випадково, необхідно перевірити істотність значення р з певним рівнем імовірності р ~ 0,95 залежно від кількості рангів (числа завдань у тесті) п. Перевірка здійснюється за відповідною таблицею критичних значень коефіцієнта рангової кореляції Спірмена. Якщо фактичне значення Р біЛЬШе КРИТИЧНОГО РодеСі), тобто P>P0,9d(n) визнається істотним, у протилежному зв'язок випадковий або істотність зв'язку не доведено.

  Коефіцієнт кореляції точково-бісеріальний — у класичній тестовій теорії коефіцієнт диференційної здатності завдання, який виражає зв'язок між результатами відповідей на певне завдання з індивідуальними балами вибірки тестованих. Оцінює ступінь статистичного зв'язку між двома змінними: профілем відповіді на конкретне завдання і підсумковим тестовим балом. Для j-ro завдання точково-бісеріальний коефіцієнт розраховують за формулою:   де — середнє значення індивідуальних балів тих тестованих, які відповіли на j-e завдання правильно;

   — середнє значення індивідуальних балів усієї вибірки тестованих;

   — стандартне відхилення індивідуальних балів усієї вибірки тестованих;

   — рівень складності завдання, що характеризуються часткою правильних відповідей;

   — частка неправильних відповідей.

   Значення точково-бісеріального коефіцієнта кореляції, що дорівнює або більше за 0,3, є задовільним показником його якості.

  Коефіцієнт складності завдання — див. → Число р. див. → Індекс складності.

  Коефіцієнт угадування — імовірність того, що учень із дуже низьким рівнем знань і навичок правильно виконає тестове завдання. Завжди існує імовірність випадкового вгадування правильної відповіді в завданнях на вибір відповіді й така ймовірність може бути різною в різних формах завдань. Коефіцієнт угадування дає можливість побудувати модель, яка враховує ці фактори.

  Комплект тестовий — зошит, у якому містяться всі завдання, призначені для одного учасника тестування, і бланк (бланки) відповідей. За наявності тестового комплекте тестовий зошит можна використовувати як чернетку, його не перевіряють І не оцінюють. Якщо тест складається із завдань на вибір відповіді й на надання відповіді, тестованому пропонують два бланки відповідей (№ 1 І № 2). У бланку № 1 тестований певними символами позначає правильні значення відповіді, його перевіряють за допомогою спеціальної комп'ютерної програми, убланку№ 2тестований виконує завдання на надання відповіді, які перевіряють експерти.

  Комп'ютерне адаптивне тестування (КАТ) — див. → Модель педагогічного тестування. див. → п. 7. Адаптивна модель.

  Конструктивна валідність — див. → Валідність конструктивна.

  Контамінація критерію — комплекс явищ, пов'язаних із тим, як інформація про результати тестування учня/студента вплинула на ставлення до нього інших осіб.

  Контрольне завдання — див. → Завдання контрольне.

  Контрольно-вимірювальний матеріал — див. → Матеріал контрольне-вимірювальний.

  Конфіденційність тестування — нерозголошення змісту тесту до моменту його проведення та індивідуальних результатів тестування кожного учасника.

  Кореляційна таблиця — див. → Таблиця кореляційна.

  Кореляційне поле — див. → Поле кореляційне.

  Кореляційний метод визначення валідності — див. → Метод визначення валідності кореляційний.

  Кореляція — 1) тенденція тесту співвідноситися або не співвідноситися з іншим тестом;

  2) вірогідна залежність між двома рядами вимірювань.

  Користувач педагогічного тесту — юридична чи фізична особа, яка використовує педагогічний тест відповідно до заздалегідь визначеної мети.

  Крива гауссівського розподілу — див. → Крива нормального розподілу.

  Крива нормального розподілу — це симетрична крива рівномірного розподілу одиниць сукупності за значенням ознаки (балів). Згідно із законом нормального розподілу, бали концентруються навколо середнього арифметичного значення ознаки, а їх частоти щодалі від середнього значення рівномірно зменшуються. Середнє значення ознаки (бала) припадає точно на центр розподілу. Для нормального розподілу асиметрія відсутня (х= Me = Mo), а ексцес дорівнює З (Е = 3). Широко використовується для інтерпретації балів стандартизованих тестів.

  Так, за умов нормального розподілу 66,6% усієї'сукупності елементів (тестованих) значення ознаки відхиляється від середнього значення не більше ніж на величину одного квадратичного відхилення. Чим більша відмінність, тим менше в сукупності представників з однаковими значеннями ознаки. Якщо характеристика — бал тестованого, то шанс набрати за тест бали, що значно відхиляються від середнього значення (утой чи інший бік), значно зменшуються зі зростанням відхилення.

  Крива розподілу балів кумулятивна (кумулята) — неперервна крива, що зображена графічно в системі координат, де на осі абсцис позначається значення ознаки (бал) чи межі її інтервалів, а на осі ординат — накопичені частоти, тобто наростаючий підсумок частот (часток), що утворюється послідовним підсумуванням попередніх частот. Так, друга накопичена частота є сумою першої та другої частоти розподілу. Якщо будується кумулята інтервального ряду розподілу (з рівним або нерівним інтервалом), то нижній межі першого інтервалу відповідає частота, що дорівнює нулю, а верхній межі — частота цього інтервалу.

  Критєріальна валідність — — див. → Валідність критеріальна.

  Критеріальний бал — див. → Бал критеріальний.

  Критеріально зорієнтований тест — див. → Тест критеріально-зорієнтований.

  Критерій — показник, з яким порівнюють результати тестування для визначення валідності тесту.

  Критерії -набір кількісних і якісних характеристик, які використовують для винесення судження щодо якості виконання завдання. Можуть бути холістичними чи аналітичними, загальними або конкретними. Наявність критеріїв для завдань на надання відповіді дає можливість експертам максимально дотримуватися об'єктивності оцінювання. Тому перш ніж перевіряти завдання, треба виробити такі критерії, які чітко визначають найважливіші параметри виконання. Крім того, критерії ставлять перед тестованим мету, яку треба досягнути, і дають йому важливу інформацію проте, що очікують від його відповіді та які параметри ефективного виконання завдання.

  Критерії валідності результатів вимірювання — Залежно відзначення і знаків асиметрії та ексцесу можна визначити критерії, за якими ухвалюється рішення щодо ва-лідності процесу вимірювання та наявності або відсутності статистичне достовірної дії факторів, які впливають на їх результати.

  Критерій І — Тест є валідним і процес вимірювання можна вважати об'єктивним, якщо асиметрія та ексцес дорівнюють нулю .

  Критерій II — Якщо асиметрія є від'ємною, а ексцес додатним , то результати тестування завищені, тест легкий і має низьку розподільну здатність.

   Способи валідизації:
   • ускладнити завдання;
   • підвищити розподільну здатність завдань;
   • удосконалити адміністрування процедури тестування.

  Критерій III — Якщо асиметрія та ексцес є від'ємними , то результати тестування завищені, тест легкий, але має хорошу розподільну здатність. Спосіб валідизації — ускладнити завдання.

  Критерій IV — Якщо асиметрія є від'ємною, а ексцес дорівнює нулю , то результати тестування завищені, тест легкий. - Спосіб валідизації — ускладнити завдання.

  Критерій V — Якщо асиметрія є додатною, а ексцес від'ємним , то результати тестування занижені, тест складний, але має хорошу розподільну здатність. Спосіб валідизації— вилучити або спростити завдання, які роблять тест складним.

  Критерій VI — Якщо асиметрія й ексцес є додатними, , , то результати тестування є заниженими, тест складний і має низьку розподільну здатність. Спосіб валідизації — валідизація завдань.

  Критерій VII — Якщо асиметрія додатна, а ексцес дорівнює нулю , то результати тестування є заниженими, тест складний. Спосіб валідизації — валідизація завдань.

  Критерій VIII — Якщо крива розподілу симетрична, асиметрія дорівнює нулю, а ексцес додатний , то тест неоднорідний і складається з двох субтестів — складного й легкого. Валідизація тесту полягає в його поділі на два окремі тести.

  Критерій IX — Якщо крива розподілу симетрична, асиметрія дорівнює нулю, а ексцес від'ємний , то тест неоднорідний, сконструйований із трьох субтестів: легкого, середнього рівня складності та складного. Валідизація тесту полягає в його поділі на окремі тести.

  Критичний поріг — див. → Поріг критичний.

  Кумулятивна крива розподілу балів — див. → Крива розподілу балів кумулятивна (комулята).

  Кумуляція — накопичення елементів шляхом підсумуван-ня їх кількості в наступній групі до кількості в усіх попередніх. Завдання, побудовані за принципом кумуляції, цікаві тим, що не завжди остання відповідь є правильною. Учні, які звикли давати повні й правильні відповіді, зазвичай вибирають останній варіант, помилково вважаючи, що він є найбільш вичерпною відповіддю. Тому, розробляючи завдання, що відповідають цьому принципу, варто в значній кількості завдань правильну відповідь не ставити на останнє місце.

  Упорядник Л. Т. Коваленко
  Короткий тестологічний словник-довідник. — К56 К.: Грамота, 2008. — 160 с. (Серія «Словник»).
  Формалізація контенту розділу здійснена за підтримки Лабораторії СЕТ: Контроль знань, Інтелектуальні системи навчання, Дистанційне навчання — статті.
  загрузка...
Сторінки, близькі за змістом
Числовий відносний показник, який характеризує ступінь складності (вагомості або важливості) певного тестового завдання. Існує два підходи щодо визначення вагових коефіцієнтів. Перший це визначення вагових коефіцієнтів до завдань за кількістю кроків або кількістю розумових дій, які здійснив тестований для успішного виконання завдання. Є суб'єктивним і формальним, бо сума значної кількості простих кроків для виконання завдання, що вимагає репродуктивного рівня розумової діяльності, може давати більший внесок, ніж один складний крок (розумова дія), що передбачає елементи когнітивних процесів високого рівня (аналіз, синтез, оцінювання). Таке присвоєння вагових коефіцієнтів знижує надійність тесту. Другий підхід установлення вагових коефіцієнтів, пропорційних складності завдання за статистичними показниками після отримання результатів тестування. Для його наукового розв'язання використовують складні математичні моделі на основі сучасної тестової теорії (Item Response Theory IRT)..