ADO в Delphi AJAX Android C++ CakePHP CMS COM CSS Delphi Flash Flex HTML Internet Java JavaScript MySQL PHP RIA SCORM Silverlight SQL UML XML Бази даних Веб-розробка Генетичні алгоритми ГІС Гітара Дизайн Економіка Інтелектуальні СДН Колір Масаж Математика Медицина Музика Нечітка логіка ООП Патерни Подання знань Розкрутка сайту, SEO САПР Сесії в PHP Системне програмування Системний аналіз Тестологія Тестування ПЗ Фреймворки Штучний інтелект
|
Тестологічний словник-довідник. Семантичний конспект розділу
← Тестологічний словник-довідникКороткий тестологічний словник-довідник є першою спробою в Україні систематизувати найчастіше вживані у вітчизняній і зарубіжній літературах терміни, якими користуються під час проведення тестування. Словник-довідник розрахований на фахівців, які займаються організацією та проведенням тестування, педагогічних працівників системи загальної середньої освіти, широке коло читачів, які цікавляться питаннями тестології.
Семантичне ядро: Тест ↓ Валідність ↓ Оцінка ↓ Бал ↓ Завдання в тестовій формі ↓ Оцінювання ↓ Критерій ↓ Шкала ↓
Тест — Сукупність запитань, які переважно вимагають однозначної відповіді, укладений за певними правилами та процедурами, передбачає попередню експериментальну перевірку й відповідає таким характеристикам ефективності, як валідність і надійність
Модель з обмеженням часу на виконання тесту — Є п завдань з певного предмета, розділу чи теми або з кількох предметів. Із цієї множини завдань довільно вибирають kзавдань (k < п) і вказують максимальний час для виконання тесту (відповіді на всі завдання тесту).
Завдання в тестовій формі — Педагогічний засіб, який відповідає вимогам:
1) відповідність меті;
2) лаконічність;
3) логічна форма висловлювання;
4) наявність місця для відповіді;
5) однакові правила оцінювання відповідей;
6) правильне розміщення елементів завдання;
7) наявність однакової інструкції для всіх тестованих;
8) адекватність інструкції, формі та змісту завдання Завдання в тестовій формі — Характеризується певним рівнем складності, після включення до тесту витирається з банку даних
Модель з обмеженням часу на виконання тесту — Є п завдань з певного предмета, розділу чи теми або з кількох предметів. Із цієї множини завдань довільно вибирають kзавдань (k < п) і вказують максимальний час для виконання тесту (відповіді на всі завдання тесту)
Теорія однопараметричного оцінювання Раша — Завдання вважають складнішим за інше, якщо вірогідність правильної відповіді на нього менше від іншого незалежно від того, хто його виконує. Отже, більш підготовлений тестований має більшу ймовірність правильно відповісти на всі завдання тесту, ніж менш підготовлений. Теорія однопараметричного оцінювання Раша — Данський учений Раш розробив математичну модель, у якій пов'язано два латентних параметри: рівень знань тестованого і рівень складності завдання тесту
Валідність змістова — Характеристика тесту, що відображає ступінь упевненості, що завдання тесту досить повно охоплюють зміст певної сфери знань, тест точно визначає суттєві для цієї діяльності навички, але водночас не перевіряє другорядні в даному разі знання й навички Валідність змістова — Залежить від глибини попередньо проведеного авторами тесту аналізу навчального плану й програми, змісту підручників, від точності й повноти формулювання мети навчання
Валідність за віковою диференціацією — Визначає можливість використання тесту для тестованих різних вікових категорій Валідність за віковою диференціацією — Визначення цього виду валідності для тестів шкільних досягнень дає можливість установити оптимальний час проведення тестування (наприклад, розроблений інструментарій краще використати не пізніше, ніж через тиждень після вивчення теми чи тестування доцільно провести в перші два тижні II семестру).
Оцінка — Кількісна міра результату контролю засвоєння знань, сформованості навичок і вмінь, що оцінює якість виконання різноманітних навчальних завдань Можуть бути позначені літерами (у практиці зарубіжного оцінювання А, В, С ...), цифрами (1, 2, 3...) або словами ([відмінноk, [добреk, [задовільноk, [незадовільноk).
Валідність прогностична — Характеристика тесту, яка відображає ступінь упевненості, що отримані за тест оцінки добре прогнозують майбутні досягнення тестованого (наприклад, у США результати за складання тесту SAT передбачають певний рівень успішності студента у ВНЗ). Валідність прогностична — Для її виявлення результати одного тесту порівнюють із результатами іншого тесту, який проводять, наприклад, через півроку або рік навчання. Оцінюють за допомогою коефіцієнта кореляції між результатами тестування й певним зовнішнім критерієм (зовнішньою змінною), що характеризуватиме вимірювану властивість у майбутньому. Основна складність визначення такої валідності вибір вагомого зовнішнього критерію (зовнішньої змінної) в майбутньому. .
Бал — Кількісний показник вираження вимірюваної властивості тестованого після виконання певного завдання або системи завдань з використанням відповідних шкал
Бал стандартний тестовий — Тестовий бал, заданий на певній стандартній шкалі. Його отримують внаслідок переведення первинних ("сирих") балів у стандартну шкалу в результаті лінійної стандартизації (за наявності параметричних тестових норм, заданих середнім значенням і стандартним відхиленням) або табличної нормалізації. Бал стандартний тестовий — Стандартні бали в діапазоні від 1 до 9 із середнім арифметичним 5 та стандартним відхиленням 2.
Бал первинний — Сума балів за відповіді на завдання, які тестований виконав правильно. Бал первинний — Для тестів, які складаються з дихотомічних завдань, кількість правильно виконаних завдань, що відображає певний рівень підготовленості тестованого до конкретного тесту. Бал первинний — Бал вихідний .
Бал істинний — Іпотетичний бал, який міг би отримати тестований, якби він виконав усі завдання з банку завдань для певного тесту за встановленою шкалою. Цей бал відповідає справжньому рівневі підготовленості тестованого на момент оцінювання. При цьому припускають, що помилка педагогічного вимірювання дорівнює нулю.
Бал критеріальний — Граничне значення тестового бала, за допомогою якого сукупність тестованих розділяють на тих, хто виконав тест задовільно, і тих, хто виконав його незадовільно.
Бал узагальнюючий — Середній бал за виконання всіх завдань тесту або бал одного тестованого за кілька тестів, або середній по групі тестованих бал за один тест (наприклад, усіх третьокласників). Бал узагальнюючий — Узагальнююча оцінка для одного тестованого складається із суми балів за кілька компонентів оцінки
Бали «стандартної дев'ятки» — Стандартні бали в діапазоні від 1 до 9 із середнім арифметичним 5 та стандартним відхиленням 2
Оцінювання — Формалізований або експертний процес визначення рівня навчальних досягнень учнів/студентів, який завершується виставленням балів
Оцінювання діагностичне — Тип оцінювання, мета якого визначити можливості учня/студента та труднощі в процесі навчання для того, щоб надати допомогу й визначити наступні етапи навчання Оцінювання діагностичне — Воно дає можливість установити зворотний зв'язок між учителем і учнем і найефективніше розподілити учнів на групи відповідно до їхніх здібностей до навчання Ефективне, якщо його проводять систематично.
Оцінювання формаційне — Тип оцінювання, який використовують на завершальному етапі певного періоду навчання, мета якого оцінити рівень засвоєння навчального матеріалу і виставити бали Оцінювання формаційне — Мета такого оцінювання отримати детальну інформацію про поточні досягнення учнів/студентів і можливості їхнього удосконалення
Центр тестових технологій і моніторингу якості освіти — Міжнародна благодійна організація. Центр тестових технологій і моніторингу якості освіти — Розробляє та впроваджує механізми громадського моніторингу державної' системи зовнішнього оцінювання, бере участь у реалізації компоненту з громадського моніторингу Програми сприяння незалежному тестуванню в Україні USETI, зокрема в частині моніторингу діяльності інструкторів, екзаменаторів, адміністраторів, інших залучених до проведення зовнішнього оцінювання працівників Центр тестових технологій і моніторингу якості освіти — Щороку ЦТТі МЯО проводить анонімне опитування учасників зовнішнього незалежного оцінювання для визначення ставлення учнів до тестування, за результатами якого надає рекомендації щодо вдосконалення форми, змісту та процедур зовнішнього оцінювання. Центр тестових технологій і моніторингу якості освіти — Центр бере участь у проведенні міжнародних І національних порівняльних досліджень якості освіти (у травні 2007 р. у Міжнародному дослідженні якості математичної та природничої освіти TIMSS-2007 та Національному моніто-ринговому дослідженні математичної освіти учнів 4-х класів початкової школи). Центр тестових технологій і моніторингу якості освіти — Центр здійснює антикорупційні заходи в освіті: досліджує питання приватного репетиторства, організовує та проводить регіональні семінари з питань етики, прозорості й підзвітності в освіті, бере участь у проекті REFINE програми розвитку освіти Інституту відкритого суспільства [Оцінювання для підвищення якості, рівного доступу та підзвітності в освітіk.
Валідність поверхнева — Оцінювання тесту тільки за результатами загального (побіжного) ознайомлення з його змістом
Об'єктивність оцінювання — Оцінювання завдань на вибір відповіді, кожен варіант відповіді яких визначено як правильний або неправильний Об'єктивність оцінювання — За такого оцінювання хто б не ставив оцінки, у всіх експертів вони будуть однаковими
Об'єктивність оцінювання — Оцінювання завдань на вибір відповіді, кожен варіант відповіді яких визначено як правильний або неправильний. За такого оцінювання хто б не ставив оцінки, у всіх експертів вони будуть однаковими
Коефіцієнт кореляції — Характеристика ступеня взаємозв'язку між двома співзалежними ознаками (наборами тестових балів чи іншими видами оцінювання). Набуває значень від + 1 до - 1 Коефіцієнт кореляції — Додатне значення гсвідчить про прямий зв'язок між ознаками X,- та X,, а від'ємне про зворотний.Чим ближче коефіцієнт кореляції до одиниці, тим щільніший зв'язок
Коефіцієнт кореляції точково-бісеріальний — Коефіцієнт диференційної здатності завдання, який виражає зв'язок між результатами відповідей на певне завдання з індивідуальними балами вибірки тестованих Коефіцієнт кореляції точково-бісеріальний — Оцінює ступінь статистичного зв'язку між двома змінними: профілем відповіді на конкретне завдання і підсумковим тестовим балом.
Коефіцієнт кореляції бісеріальний — Статистичний показник, який використовують для визначення диферен-ційної здатності завдання; коефіцієнт кореляції між двома змінними, із яких одна виміряна в дихотомічній шкалі, друга в інтервальній
Коефіцієнт валідності — Коефіцієнт кореляції, який виражає взаємозв'язок між сукупністю тестових балів і кри-терійним мірилом
Метод внутрішньої послідовності — метод оцінки надійності тестових балів, в основі якого лежить припущення, що паралельні не тільки окремі форми, а й окремі частини всередині одного тесту.
Огіва — Плавна S-подібна крива, яку отримують при графічному зображенні розподілу накопичених частот (часток) за верхньою межею інтервалів значення ознаки (тестові оцінки)
Апробація тесту — Пробне педагогічне тестування на певній вибірці учнів/студентів, яке проводять перед контрольним (сертифікаційним) тестуванням для усунення неточностей у завданнях, оцінки складності тесту та його окремих частин.
Переваги однопараметричного оцінювання Раша порівняно з класичною моделлю тестування:
Валідність критеріальна — Характеристика тесту, яка відображає ступінь упевненості, що даний тест правильно оцінює успішність тестованого, реально відображає досягнення певного рівня знань і вмінь. Валідність критеріальна — Визначається кореляцією між результатами тестування й зовнішньою критеріальною змінною, зокрема показниками,отриманими шляхом незалежного оцінювання (експертні судження, результати інших тестів, валідність яких уже встановлена). Валідність критеріальна — Визначає ступінь відповідності між результатами тестування й зовнішнім критерієм Валідність критеріальна — Визначає, у якій мірі результати тесту можна використати для висновків про успішність тестованого.
Валідність порівняльна — Характеристика тесту, яка передбачає порівняння результатів проведеного тесту, самооцінки тестованих, оцінювання викладачів із результатами іншого тесту, які отримано приблизно в той самий час. Валідність порівняльна — Використовується у двох випадках: по-перше, якщо новий діагностичний інстру-- мент якісно відрізняється від того, який уже використовували; по-друге, якщо вже існують готові високоякісні тести, що перевіряють ту саму властивість особистості.
Процедура визначення конструктивної валідності —
Валідизація — Дослідження тесту, що ставить за мету визначити ступінь валідності, тобто встановити, чи дійсно тест вимірює ту якість, для вимірювання якої він був складений, і чи можна на цій підставі робити достовірні узагальнення й висновки
Критерій — Показник, з яким порівнюють результати тестування для визначення валідності тесту
Індекс — Відносна величина, що характеризує зміну показника в часі, просторі чи порівняно Із стандартом
Інструкція до тесту — Керівна вказівка, настанова, у якій описано, як виконувати завдання тесту Має бути простою й стислою, але водночас містити інформацію щодо кожного з таких пунктів: 1) мета тесту; 2) час, відведений для виконання тесту; 3) як позначати правильну відповідь; 4) чи вдаватися до вгадування, якщо є сумніви щодо правильної відповіді..
Метод Агноффа — дає можливість визначити прохідний бал для кожного тестового завдання
Метод Д. Міллмана — Кілька незалежних фахівців із предмета присвоюють кожному тестовому завданню рейтинг (ступінь відповідності або конгруентності певному елементу змісту)
Метод Л. Нєдєльського — Передбачає винесення експертом судження щодо кожної можливої неправильної відповіді
Метод Пофама (Popham W. J.) — Експертам пропонують ознайомитися зі змістом двох списків: один із тестовими завданнями, а другий з елементами змісту й метою тестування. Завдання експертів з'ясувати, який елемент змісту вимірює кожне завдання, тобто якому елементу змісту яке завдання відповідає (якщо завдання взагалі конгруентне будь-якому елементу змісту списка). Підрахувавши кількість відповідностей [завдання елемент змістуk для кожного експерта, автор тесту заповнює таблицю. Навіть візуальний аналіз цієї таблиці надасть інформацію про кількість збігів/неузгодженостей в експертних оцінках. (Щодо аналізу статистичних показників) У практиці педагогічного тестування застосовують чотири методи підрахунку тестових балів: традиційний метод (дихотомічне оцінювання), метод корекції на вгадування [Правильний мінус неправильнийk, метод корекції на вгадування [Правильний плюс пропускk, метод [Доведення відповіді до правильноїk.
Диференційна здатність завдання — Здатність завдання тесту розрізняти у вибірці сильних і слабких (добре й погано підготовлених) учнів/студентів Якісний тест Має складатися тільки із завдань із високою диференційною здатністю
Якісний тест Має складатися тільки із завдань із високою диференційною здатністю Важлива характеристика ефективного тестового завдання .
Батарея тестів — Серія спеціально складених для діагностики тестів, кожен із яких має свої діагностичні характеристики й можливості
Батарея тестів — Серія спеціально складених для діагностики тестів, кожен із яких має свої діагностичні характеристики й можливості.
|