|
Тестологічний словник-довідник - М
ADO в Delphi AJAX Android C++ CakePHP CMS COM CSS Delphi Flash Flex HTML Internet Java JavaScript MySQL PHP RIA SCORM Silverlight SQL UML XML Бази даних Веб-розробка Генетичні алгоритми ГІС Гітара Дизайн Економіка Інтелектуальні СДН Колір Масаж Математика Медицина Музика Нечітка логіка ООП Патерни Подання знань Розкрутка сайту, SEO САПР Сесії в PHP Системне програмування Системний аналіз Тестологія Тестування ПЗ Фреймворки Штучний інтелект
|
Тестологічний словник-довідник - МКлючові поняття: Класична модель оцінювання, Класична модель з урахуванням складності завдань, Модель із зростанням складності, П'ять рівнів засвоєння навчального матеріалу, Модель з урахуванням часу виконання завдання., Модель з обмеженням часу на виконання тесту, Адаптивна модель., Модель тестування за сценарієм, Модель, що ґрунтується на нечіткій математиці., Матеріали інформаційні, Матеріал контрольно-вимірювальний, Метод визначення валідності кореляційний, Матриця результатів тестування, Медіана, Метод фасетного дизайну, Метод внутрішньої послідовності, Метод еквівалентних форм, Метод повторного тестування (метод ре-тесту), Метод тестування, Метод часткового бала, Методи визначення надійності, Методи експертної оцінки якості тестових завдань, Метод Агноффа, Метод Д. Міллмана, Метод Л. Нєдєльського, Метод Пофама (Popham W. J.), Методи підрахунку балів за завдання множинного вибору з кількома правильними відповідями, Методи підрахунку балів за завдання на встановлення відповідності, Міра центральної тенденції розподілу, Мода, Моделі оцінювання, Модель педагогічного тестування, Модель із розподілом завдань за рівнем засвоєння навчального матеріалу, Модель з обмеженням часу на виконання тесту.Матеріал контрольно-вимірювальний — комплект (варіант) тестових завдань різної форми, який підготовлено для проведення тестування. Матеріали інформаційні — збірник, у якому вміщено умови про правила проходження зовнішнього оцінювання, програмові вимоги з предмета, описано форму, структуру, зміст зовнішнього оцінювання, його мету, а також запропонований демонстраційний варіант завдань. Матриця відповідей — див. → Матриця результатів тестування. Матриця результатів тестування — таблиця, що містить результати відповідей кожного тестованого на кожне завдання тесту. Номер рядка ] відповідає номеру тестованого, а номер стовпчика і — номеру завдання. Медіана — значення ознаки, яке ділить упорядковану за обсягом сукупність елементів навпіл так, що одна половина всіх значень виявляється менше медіани, а друга — більше. Відповідає 50-му процентилю, 5-мудеци-лю та 2-му квартилю. Метод багатоваріантних тверджень — див. → Метод фасетного дизайну. Метод визначення валідності кореляційний — один з основних методів кількісного визначення валідності тесту шляхом оцінки ступеня кореляції результатів тестування з певною зовнішньою змінною.
Метод внутрішньої послідовності —
метод оцінки надійності тестових балів, в основі якого лежить припущення, що паралельні не тільки окремі форми, а й окремі частини всередині одного тесту. Для отримання коефіцієнта надійності порівнюють результати виконання частин тесту. Залежно від способу поділу тесту можуть змінюватися значення коефіцієнта. Часто тест ділять на дві частини, об'єднуючи в одну групу парні, у другу — непарні завдання.
Метод еквівалентних форм — метод оцінки надійності тестових балів, за яким одній групі тестованих пропонують виконати спочатку одну форму тесту, а через певний час — іншу. Форми тестує паралельними, бо їх розробляють для оцінювання тих самих знань і вмінь, тобто вони побудовані за однією специфікацією. Після проведення тестування обчислюють величину коефіцієнта кореляції правильності виконання завдань, яка і приймається за значення коефіцієнта надійності. Якщо між виконанням двох форм був значний часовий інтервал, то коефіцієнт надійності називають по-іншому —коефіцієнтом еквівалентності або коефіцієнтом стабільності.
Метод повторного тестування (метод ре-тесту) —
метод оцінки надійності тестових балів, коли один тест використовують два або більше разів в одній групі тестованих. Для того, щоб підвищити ре-тестову надійність, треба відібрати з апробованого варіанта тесту ті завдання, на які тестовані дають стійкі відповіді. Чим вище ретестова надійність, тим менш чутливий тест до впливу неконтрольованих факторів.
Метод поділу тесту навпіл — див. → Метод внутрішньої послідовності. Метод тестування — перетестування за еквівалентними формами — комбінація двох методів, коли дві еквівалентні (паралельні) форми тесту проводять з інтервалом у часі.
Метод фасетного дизайну —
створення не одного, а відразу кількох варіантів того самого завдання на основі одного елементу змісту. Кожен тестований отримує з фасету тільки один варіант завдань, але всі тестовані виконують однотипні завдання з різними варіантами фасету і з різними відповідями. Застосування фасету дає можливість запобігти списуванню або іншим порушенням під час проведення контролю знань та об'єктивного порівняння тестових балів тестованих.
Метод часткового бала — виставлення тестового бала з урахуванням винагороди тестованого за часткові знання.
Методи визначення надійності —
методи, які дають можливість визначити різні види надійності результатів оцінювання.
Методи експертної оцінки якості тестових завдань — Є два методи оцінки якості тестових завдань: Методи експертної оцінки завданьМетод Агноффа — дає можливість визначити прохідний бал для кожного тестового завдання. Група експертів визначає характеристики «пограничного тестованого», тобто учня/студента, навичок якого достатньо саме для того, щоб скласти екзамен. Експерти групують завдання на «необхідні», «важливі» та «індикаторні», визначають число тестових завдань у кожній категорії, на які зможе правильно відповісти «пограничний тестований». Критерій «склав — не склав» розраховують як сумарний процент можливих балів «пограничного тестованого». Метод Д. Міллмана — кілька незалежних фахівців із предмета присвоюють кожному тестовому завданню рейтинг (ступінь відповідності або конгруентності певному елементу змісту). Необхідні показники для оцінки конгруентності тестового завдання, отримані за результатами рейтингу, — це середнє і/або медіане значення рейтингового бала, обчислені за даними групування оцінок. Дані рейтингу можна аналізувати й без застосування статистичних процедур, тому його можуть використовувати учителі/викладачі-практики. Метод Л. Нєдєльського — передбачає винесення експертом судження щодо кожної можливої неправильної відповіді. Завдання експерта полягає втому, щоб проаналізувати завдання на вибір відповіді й визначити, які з неправильних відповідей не будуть привабливими для непідготовленого учня/студента. Метод Пофама (Popham W. J.) — експертам пропонують ознайомитися зі змістом двох списків: один — із тестовими завданнями, а другий — з елементами змісту й метою тестування. Завдання експертів — з'ясувати, який елемент змісту вимірює кожне завдання, тобто якому елементу змісту яке завдання відповідає (якщо завдання взагалі конгруентне будь-якому елементу змісту списка). Підрахувавши кількість відповідностей «завдання — елемент змісту» для кожного експерта, автор тесту заповнює таблицю. Навіть візуальний аналіз цієї таблиці надасть інформацію про кількість збігів/неузгодженостей в експертних оцінках. (Щодо аналізу статистичних показників).
Методи підрахунку тестових балів за завдання з однією правильною відповіддю —
У практиці педагогічного тестування застосовують чотири методи підрахунку тестових балів: традиційний метод (дихотомічне оцінювання), метод корекції на вгадування «Правильний мінус неправильний», метод корекції на вгадування «Правильний плюс пропуск», метод «Доведення відповіді до правильної».
Методи підрахунку балів за завдання множинного вибору з кількома правильними відповідями — У практиці педагогічного тестування використовують два методи:
Методи підрахунку балів за завдання на встановлення відповідності — Існує два методи, які застосовують залежно від мети тестування й підходів до інтерпретації результатів.
Другий спосіб — застосування часткового бала. В інструкції вказують, що за кожну правильну логічну пару тестований отримає один бал. Тоді максимальну кількість балів тестований отримає за умови, що він установив правильно всі відповідності, якщо він утворив правильно дві пари — отримає два бали, одну— відповідно один бал. Якщо він не вибрав жодної правильної відповіді, отримує нуль. За такого способу оцінювання підвищується диференційна здатність завдання, тому що тестовані з частковим знанням мають вищу оцінку, ніж тестовані з повним незнанням предмета (теми). Метрична шкала — —див. → Шкала метрична. Міжнародні моніторингові дослідження — див. → Дослідження моніторингові міжнародні. Міжнародні організації з питань тестування — див. → Організації з питань тестування міжнародні. Міра центральної тенденції розподілу — — узагальню-вальні характеристики центру розподілу елементів сукупності за значенням ознаки (бали), що визначають центр тяжіння ряду. Мовчазна згода — — див. Згода мовчазна. Мода — — значення ознаки, яке найчастіше трапляється в ряду розподілу. Варто пам'ятати, що мода — це значення ознаки, яке відповідає найбільшій частоті (частці), а не її частота.
Моделі оцінювання —
У системі освіти використовують три відомі моделі оцінювання:
Модель педагогічного тестування — метод, відповідно до якого учню/студенту пропонують тестові завдання й оцінюють результати тестування. Нижче наведено моделі, які найчастіше використовують під час оцінювання у формі тестування. Перевага цієї моделі — її простота. Недоліки:
З усієї множини завдань випадковим методом вибирають k завдань (k < п), які пропонують тестованому. Результат відповідей на кожне завдання позначають «правильно» або «неправильно». Підсумовуючи результати тестування, ураховують складність запитань, на які тестований відповів правильно. Чим складніше завдання, тим вищим буде результат тестування. Складність не враховують для завдань, які виконано неправильно. Недолік: через випадковість вибірки не можна заздалегідь визначити, які завдання за складністю отримає тестований, тому одному учаснику тестування дістанеться k легких, а іншому — k складних завдань. Моделі з урахуванням складності завдань дають можливість більш адекватно оцінити знання тестованого, але випадковий вибір завдань не дає можливості підготувати паралельні за складністю тести, тобто однакової сумарної характеристики складності завдань, що зменшує надійність тестування. Є п завдань із певного предмета, розділу чи теми або з кількох предметів. Кожне завдання має певний рівень складності. Усі завдання розподілено між т рівнями складності. У тесті мають бути завдання всіх рівнів складності. З усієї сукупності випадковим методом вибирають k завдань (k < п) й упорядковують їх за зростанням рівня складності. Кількість завдань кожної групи складності має бути однаковим або підпорядковане нормальному закону. Результат тестування визначають аналогічно до моделі 2. Така модель забезпечує паралельність тестів за складністю, а отже, надійність результатів тестування є вища, ніжу попередніх моделях. Визначають п'ять рівнів засвоєння навчального матеріалу. 1. Нульовий рівень (рівень розуміння) — рівень, коли учень/студент усвідомлено сприймає нову для нього інформацію (фактично йдеться про попередню його підготовку). 2. Перший рівень (упізнавання) —упізнавання об'єктів, що вивчаються, при повторному сприйнятті раніше засвоєної інформації про них або дій над ними, наприклад, коли виділяють окремий об'єкт із ряду запропонованих. 3. Другий рівень (відтворення) — відтворення засвоєних раніше знань від буквальної копії'до застосування в типових ситуаціях, наприклад, пригадування вивченого напам'ять, розв'язання типових задач за зразком тощо. 4. Третій рівень (застосування) — це такий рівень засвоєння інформації, коли учень/студент може самостійно відтворити й перетворити засвоєну інформацію, пояснити відомі об'єкти й застосувати інформацію в нетипових ситуаціях. При цьому він здатний генерувати нову для нього інформацію про об'єкти, що вивчаються, наприклад, розв'язати нетипову задачу, вибрати необхідний алгоритм з-поміж раніше вивчених алгоритмів для розв'язання конкретної задачі. 5. Четвертий рівень (творча діяльність) — рівень володіння навчальним матеріалом теми, коли учень/студент може створювати нову інформацію, раніше нікому не відому, наприклад, розробити новий алгоритм розв'язання задачі. Завдання складають для кожного з п'яти рівнів. Спочатку проводять тестування, використовуючи завдання рівня 0, потім рівня 1, 2...5. Перш ніж перевести тестованого на наступний рівень, визначають рівень засвоєння навчального матеріалу на цьому рівні та встановлюють можливість переходу на наступний рівень. Щоб виміряти рівень знань, якому відповідає тестований на кожному рівні, використовують коефіцієнт, який виражає співвідношення між кількістю правильно виконаних суттєвих операцій під час тестування (проходження рівня) та загальною кількістю суттєвих операцій у тесті. Під суттєвими розуміють операції, які виконують на рівні, що перевіряється. Отже, визначений рівень засвоєння навчального матеріалу можна використати для оцінювання якості знань і виставлення оцінки. У цій моделі, визначаючи результаттестування, ураховують час, за який тестований виконував кожне завдання. Це роблять для того, щоб урахувати можливість несамостійної відповіді на завдання: тестований може шукати відповідь у підручнику чи будь-якому іншому джерелі, але його оцінка буде низькою, навіть якщо завдання він виконав правильно. З іншого боку, якщо він не скористався підказкою, але довго думав над завданням, це означає, що він не достатньо добре вивчив теорію, а отже, навіть коли він відповів правильно, оцінку йому буде знижено. Час для виконання може задавати як константа для всіх завдань тесту або вираховуватися для кожного окремого завдання з урахуванням його складності, оскільки для відповіді на складне запитання потрібно часу значно більше, ніж на просте. Ця модель дає можливість підвищити надійність результатів тестування, особливо поєднавши її з урахуванням складності завдань. Є п завдань з певного предмета, розділу чи теми або з кількох предметів. Із цієї множини завдань довільно вибирають kзавдань (k < п) і вказують максимальний час для виконання тесту (відповіді на всі завдання тесту). Щоб оцінити результаттестування, ураховують тільки ті завдання, на які тестований за відведений час відповів правильно. Сам тест може бути побудовано за моделями 1-4. У деяких завданнях рекомендують обов'язково сортувати завдання за рівнем складності та встановлювати такий час для тестування, за який жоден, навіть найбільш підготовлений учасник оцінювання, не може відповісти на всі завдання тесту. Такий метод рекомендують використовувати під час бланкового тестування, коли учень бачить усі завдання тесту відразу. Такі обмеження виконання в часі пов'язані з тим, що якщо тестований відповість на всі запитання, а час у нього ще залишиться, він, перевіряючи роботу, може вагатися щодо правильності виконання завдання і виправити правильні відповіді на неправильні. У такому разі пропонують або обмежити час роботи, або забрати бланк відразу ж після виконання тесту. Ця модель спирається на класичну модель з урахуванням складності завдань. Вид комп'ютерного тестування, при якому тестові завдання з певними характеристиками послідовно зображуються на екрані комп'ютера, а рівень підготовки тестованого, із зростаючою точністю оцінюється відразу ж після комп'ютерної відповіді. Кожне наступне завдання в адаптивному тестуванні залежить від попередніх відповідей: кожне наступне завдання буде складнішим, якщо попереднє завдання тестований виконав правильно. Якщожу попередньому завданні була допущена помилка, наступне завдання комп'ютерна програма запропонує легше. За такої моделі є можливість запропонувати тестованому додаткові завдання з тем, які він знає не досить добре, щоб точніше оцінити рівень засвоєння матеріалу з певної теми. Отже, рівень складності тесту допомагає найкраще оцінити підготовленість учня/студента. У західній літературі виокремлюють три варіанти початку адаптивного тестування. Якщо немає попередніх оцінок, тестування починають із завдань середнього рівня складності, після чого, залежно від відповіді, тестованому пропонують завдання легше чи важче. Цей спосіб часто називають «пірамідальним тестуванням». Удруго-му варіанті тестований може почати з будь-якого довільно вибраного завдання, поступово наближаючись до реального рівня знань. У третьому варіанті тестованому пропонують завдання з банку даних, розділених за рівнями складності.Кількість завдань тесту заздалегідь не фіксують, а процес тестування завершують після досягнення заданої точності оцінки рівня підготовленості тестованого. Відбувається це тоді, коли тестований виходить на певний постійний рівень складності, наприклад, відповідає поспіль на певну критичну (заздалегідь визначену) кількість запитань одного рівня складності.
1. Дає можливість більш гнучко виміряти знання тестованих. 2. Дає можливість виміряти знання меншою кількістю завдань, ніж у класичній моделі. 3. Виявляє теми, які тестований знає погано і дає можливість перевірити знання з цієї теми додатково. Недоліки: 1. Заздалегідь невідомо, скільки запитань треба поставити тестованому, щоб визначити рівень його знань. 2. Можна застосувати модель тільки за наявності комп'ютера. Надійність результатів такого тестування найвища, тому що програма тестування підлаштовується під рівень знань тестованого. Ця модель є продовженням й удосконаленням класичної моделі тестування, яка реалізується в системі дистанційного асинхронного навчання, її розроблено в Татарському інституті сприяння бізнесу (Росія). Модель «Проведення тестування за сценарієм» намагається усунути недолік класичної моделі тестування, а саме непаралельність тестів учнів із різним рівнем навчальної підготовки, бо не можна заздалегідь визначити,який саме за рівнем складності тест виконуватиме кожен учень. Викладач перед проведенням тестування формує його сценарій, у якому враховує: Відбір завдань кожного рівня складності, з кожної теми, кожної форми здійснюється вибірковим методом із загальної бази завдань. Кожен учень отримує індивідуальний тест, але тести всіх учасників тестування є паралельні. На відміну від «Моделі із зростанням складності», яка теж ураховує паралельність тестів, у цій моделі автор сам визначає, скільки і яких завдань з якої саме теми має бути в тесті, отже, тестування здійснюється в абсолютно однакових умовах для всіх його учасників. Порівняно з адаптивною моделлю ця модель є менш ефективною, тому що не враховує індивідуальні особливості кожного учня, але має переваги психологічного характеру: в адаптивному тестуванні учасники виконують різну кількість завдань і, на перший погляд, знаходяться в нерівних умовах. У «Моделі за сценарієм» учні отримують однакову кількість завдань із кожної теми І за кожним рівнем складності. Надійність результатів тестування аналогічна до моделі зі зростанням складності. Ця модель тестування є продовженням будь-якої з описаних вище моделей, але в ній замість чітких характеристик тестових завдань і відповідей використовують їх нечіткі аналоги. Наприклад:
• правильність відповіді («правильно», «частково правильно», «радше правильно, ніж неправильно», «неправильно» тощо); • час відповіді на запитання («короткий», «середній», «тривалий» тощо); • підсумкова оцінка. У тестуванні можна також комбінувати кілька моделей, наприклад:
• модель із зростанням складності завдань і модель з урахуванням часу, за який тестований виконує завдання; • модель із зростанням складності завдань і модель з обмеженням часу, за який тестований виконує завдання; • модель з урахуванням часу, за який тестований виконує завдання, й адаптивна модель; • модель з урахуванням часу, за який тестований виконує завдання, й модель, що ґрунтується на нечіткій математиці. Мономорфний тест — див. → Тест мономорфний.
Упорядник Л. Т. Коваленко
Короткий тестологічний словник-довідник. — К56 К.: Грамота, 2008. — 160 с. (Серія «Словник»). Формалізація контенту розділу здійснена за підтримки Лабораторії СЕТ: Контроль знань, Інтелектуальні системи навчання, Дистанційне навчання — статті. Зверніть увагу на додаткові посиланняЯкщо вас цікавить...Головний розділзагрузка...
|
Сторінки, близькі за змістом ![]() Короткий тестологічний словник-довідник є першою спробою в Україні систематизувати найчастіше вживані у вітчизняній і зарубіжній літературах терміни, якими користуються під час проведення тестування. Словник-довідник розрахований на фахівців, які займаються організацією та проведенням тестування, педагогічних працівників системи загальної середньої освіти, широке коло читачів, які цікавляться питаннями тестології.
|
|
Copyright © 2008—2026 Портал Знань.
При використанні матеріалів посилання, для інтернет-ресурсів — гіперпосилання, на Znannya.org обов'язкове.
Зв'язок
|
НТУУ "КПІ" Інженерія програмного забезпечення КПІ Лабораторія СЕТ |
|