→ Пошук по сайту       Увійти / Зареєструватися
Знання Тестологічний словник-довідник

Тестологічний словник-довідник - В

Ваговий коефіцієнт — див. → Коефіцієнт ваговий.

Валідизація — дослідження тесту, що ставить за мету визначити ступінь валідності, тобто встановити, чи дійсно тест вимірює ту якість, для вимірювання якої він був складений, і чи можна на цій підставі робити достовірні узагальнення й висновки.

Валідність — одна з основних характеристик ефективності тесту, включає широке коло понять. У найзагальнішому вигляді валідність показує, що оцінює тест і як добре він це робить. Іншими словами, валідність указує на більший чи менший ступінь придатності тесту до використання з певною метою. Валідність стосується справедливості висновків, що їх роблять із результатів оцінювання для певного запланованого їх використання. Визначають кілька видів валідності. Різні сторони, або типи, валідності є, по суті, різними способами її визначення.

Фактори, що знижують валідність результатів оцінювання:

    1. Завдання не відповідають цілям тестування.

    2. Дуже мала кількість завдань, яка не охоплює усього змісту навчальної дисципліни або теми, яку перевіряють.

    3. Завдання є неоднозначними за змістом, некоректно сформульовані, у тесті містяться ключі до відповідей тощо.

    4. У тесті вміщено завдання без урахування їх складності.

    5. Завдання в тесті неправильно упорядковані (не враховано розташування завдань за складністю, завдання не згруповано за формою тощо).

    6. Наявність нечітких або неповних інструкцій, що перешкоджає тестованим правильно зрозуміти, як треба працювати з тестом.

    7. Суб'єктивність під час оцінювання завдань на надання відповіді або помилки при обчисленні балів у завданнях на вибір відповіді.

    8. Не враховано час, необхідний для виконання тесту.

    9. Порушення процедур проведення тестування, незадовільні умови контролю тощо.

Якщо показник валідності від'ємний, тест вважають непридатним для використання, якщо низький (наближений до нуля), — доопрацьовують. Використовують такі прийоми для визначення валідності :

    • аналіз бісеріального розподілу;
    • аналіз індексу дискримінації;
    • оцінка диференціації фахівцем, експертом;
    • характеристики асиметрії розподілу;
    • кореляція результатів із зовнішніми критеріями.

Валідність за віковою диференціацією — визначає можливість використання тесту для тестованих різних вікових категорій. Визначення цього виду валідності для тестів шкільних досягнень дає можливість установити оптимальний час проведення тестування (наприклад, розроблений інструментарій краще використати не пізніше, ніж через тиждень після вивчення теми чи тестування доцільно провести в перші два тижні II семестру).

Валідність змістова — характеристика тесту, що відображає ступінь упевненості, що завдання тесту досить повно охоплюють зміст певної сфери знань, тест точно визначає суттєві для цієї діяльності навички, але водночас не перевіряє другорядні в даному разі знання й навички. Змістова валідність залежить від глибини попередньо проведеного авторами тесту аналізу навчального плану й програми, змісту підручників, від точності й повноти формулювання мети навчання. Про змістову валідність складають уявлення зі специфікації тесту й методів, які використовують під час його складання. Змістову валідність установлюють шляхом експертної оцінки конгруентності й технологічної якості всієї множини тестових завдань, розроблених для конкретного тесту за певним обсягом матеріалу. Можна стверджувати, що якщо експертиза конгруентності й технологічної якості всіх тестових завдань для певного критеріально зорієнтованого тесту була проведена ретельно й науково обґрунтована, то для атестації змістова валідність буде високою.

Валідність зовнішня — свідчить, наскільки привабливими та прийнятними є завдання тесту для викладачів/учителів, учнів/студентів, адміністрації, тобто тих, хто не є експертами-текстологами й можуть мати лише інтуїтивно-суб'єктивне судження про зміст тесту. Для по-1 значення зовнішньої валідності інколи використовують термін «суб'єктивна валідність». Дані про зовнішню валідність тесту можуть бути отримані шляхом опитування й/або анкетування тестованих.

Валідність конструктивна — характеристика тесту, що відображає впевненість у тому, що вимірювана тестом властивість має реальний педагогічній або психологічній зміст. Щоб оцінити конструктивну валідність, необхідно якнайточніше описати змінну (психологічний конструкт),для вимірювання якої призначено тест. Інтелект, тривожність, правдивість, креативність — приклади таких психологічних конструктів. Процедура визначення конструктивної валідності така:

    1) формують гіпотези щодо зовнішніх змінних, з якими певний тест має корелювати;
    2) формують гіпотези щодо зовнішніх змінних, з якими певний тест не має корелювати;
    3) визначають групи тестованих, які виявлять високі або низькі результати такого тестування. Ці гіпотези мають бути перевірені на великих специфічних вибірках тестованих.

Валідність критеріальна — характеристика тесту, яка відображає ступінь упевненості, що даний тест правильно оцінює успішність тестованого, реально відображає досягнення певного рівня знань і вмінь. Критеріальна валідність визначає ступінь відповідності між результатами тестування й зовнішнім критерієм, який не стосується тесту. Щодо тестів досягнень, то критеріальна валідність визначає, у якій мірі результати тесту можна використати для висновків про успішність тестованого. На практиці критеріальна валідність визначається кореляцією між результатами тестування й зовнішньою критеріальною змінною, зокрема показниками,отриманими шляхом незалежного оцінювання (експертні судження, результати інших тестів, валідність яких уже встановлена). Наприклад, результати вступного тестування до ВНЗ можна вважати валідними, якщо вони добре корелюють з успішністю цих студентів на першому й наступних курсах навчання. Критеріаль-ну валідність поділяють на поточну (діагностичну, конкурентну) і прогностичну.

Валідність поверхнева — оцінювання тесту тільки за результатами загального (побіжного) ознайомлення з його змістом. Наприклад, формат тесту може бути перевірений на його аутентичність (особливо для тестів із мови) та взаємозв'язок із практикою викладання.

Валідність порівняльна — характеристика тесту, яка передбачає порівняння результатів проведеного тесту, самооцінки тестованих, оцінювання викладачів із результатами іншого тесту, які отримано приблизно в той самий час. Ступінь взаємоузгодженості оцінюється за допомогою коефіцієнта кореляції. Валідність порівняльна використовується у двох випадках: по-перше, якщо новий діагностичний інстру-- мент якісно відрізняється від того, який уже використовували; по-друге, якщо вже існують готові високоякісні тести, що перевіряють ту саму властивість особистості.

Валідність поточна — характеристика тесту, за якої результати тестування порівнюють з уже відомими показниками підготовленості учнів/студентів за поточний проміжок часу. Оцінюють за допомогою коефіцієнта кореляції результату тесту з результатами інших тестів або інших зовнішніх критеріїв (змінних вимірювання), що існують на момент тестування.

Валідність прогностична — характеристика тесту, яка відображає ступінь упевненості, що отримані за тест оцінки добре прогнозують майбутні досягнення тестованого (наприклад, у США результати за складання тесту SAT передбачають певний рівень успішності студента у ВНЗ). Для виявлення прогностичної валідності результати одного тесту порівнюють із результатами іншого тесту, який проводять, наприклад, через півроку або рік навчання. Учитель/викладач може використати індивідуальні бали студента як такі, що передбачають їхній успіх у майбутньому навчанні чи професійній діяльності тощо. Прогностичну валідність оцінюють за допомогою коефіцієнта кореляції між результатами тестування й певним зовнішнім критерієм (зовнішньою змінною), що характеризуватиме вимірювану властивість у майбутньому. Основна складність визначення такої валідності — вибір вагомого зовнішнього критерію (зовнішньої змінної) в майбутньому. Більш загальне поняття — критеріальна валідність.

Валідність суб'єктивна — див. → див.Валідність зовнішня.

Валідність узагальнююча — ступінь збігу балів за два тести, наприклад, ступінь збігу тієї самої характеристики в новому й уже апробованому тесті або в тесті здібностей і тесті досягнень.

Варіант тесту — набір тестових завдань, які пропонують тестованому в одному зошиті.

Варіанти відповідей — див. → Альтернативи.

Варіанти тесту — див. → Форми тесту паралельні.

Вибір стандарту — оцінювання для критеріально зорієнтованих тестів процедура оптимального встановлення критеріального бала або критерію оцінювання (відсотка правильних відповідей). Вибір тестових завдань автоматичний

Вибір тестових завдань автоматичний — вибір завдань для тесту за допомогою комп'ютерної програми, що дає змогу уникнути можливої фальсифікації результатів тестування.

Вибірка репрезентативна — відібрана за принципами випадковості частина сукупності (тестованих), яка з певною точністю відтворює всю генеральну сукупність за складом тестованих та їхніми основними статистичними характеристиками (середнім балом, часткою успішних або помилкових відповідей тощо).

Види тестів — див. → Тест.

Викривлення тестове — різниця в тестових балах або прогнозах щодо цих балів між двома чи більше підгрупами сукупності, які порівнюють за вимірювальним конструктом, що покладено в її основу.

Вимірювання — формалізований процес оцінювання, який завершується кількісною оцінкою.

Вимірювання педагогічне — спосіб упорядкування інформації про навчальні досягнення учня/студента, за якого систему чисел і відношень між ними ставлять відповідно до ряду вимірюваних факторів.

Випадковий бал — див. → Бал випадковий.

Виставлення балів за виконання завдань — методика переведення результатів виконання завдань у числове значення.

Вихідний бал — див. → Бал первинний.

Відкрита форма завдання з короткою відповіддю — див. → Завдання відкрите з короткою відповіддю.

Відкрита форма завдання з розгорнутою відповіддю — див. → Завдання відкрите з розгорнутою відповіддю.

Відтворюванність — здатність тесту повторювати основні статистичні характеристики в наступних тестуваннях.

Відхилення стандартне — середній квадратичний розмір відхилень індивідуальних значень ознаки (оцінки кожного тестованого) від її середнього значення (середнього балу оцінок усіх тестованих). За нормального розподілу приблизно дві третини (66,6%) оцінок знаходяться в межах одного стандартного відхилення вище середньої величини й одного стандартного відхилення нижче за неї.

Віковий еквівалент — див. → Еквівалент віковий.

ТІМО: Тестування і моніторинг в освіті — періодичне видання, на сторінках якого висвітлюється широке коло питань, пов'язаних з упровадженням зовнішнього тестування й моніторингових досліджень в освіті.

Властивості завдань інтерсуб'єктивні — виникають як наслідок вимірювання й усереднення суб'єктивних властивостей, що дає можливість перевести суб'єктивні властивості в групу інтерсуб'єктивних або, інакше кажучи, об'єктивізованих властивостей завдань. Одна з двох найважливіших цілей педагогічних вимірювань — отримання об'єктивних оцінок властивостей завдань на лінійній шкалі. Друга мета — отримання на цій же шкалі оцінок рівня підготовленості тестованих. Термін «інтерсуб'єктивні властивості завдань» означає, що ці оцінки вже не суб'єктивні, але їх ще не можна вважати об'єктивними. Цей проміжний клас оцінок корисно запровадити для філософського осмислення проблеми співвідношення між суб'єктивним і об'єктивним у процесі педагогічних вимірювань.

Вправи на інтерпретацію — див. → Завдання на інтерпретацію.

Упорядник Л. Т. Коваленко
Короткий тестологічний словник-довідник. — К56 К.: Грамота, 2008. — 160 с. (Серія «Словник»).
Формалізація контенту розділу здійснена за підтримки Лабораторії СЕТ: Контроль знань, Інтелектуальні системи навчання, Дистанційне навчання — статті.
загрузка...
Сторінки, близькі за змістом