Základy teórie testov. Prezentácia základov teórie testov vo fyzickej kultúre

Základy teórie testov. Prezentácia základov teórie testov vo fyzickej kultúre
Základy teórie testov. Prezentácia základov teórie testov vo fyzickej kultúre

Čo je testovanie

V súlade s IEEE STD 829-1983 Testovanie - Ide o proces analýzy softvéru zameraný na identifikáciu rozdielov medzi jeho skutočne existujúcimi a požadovanými vlastnosťami (defekt) a vyhodnotiť vlastnosti softvéru.

Podľa GOST R ISO IEC 12207-99 v životnom cykle softvéru sa určujú okrem iných pomocných procesov overovania, certifikácia, spoločná analýza a audit. Proces overovania je proces určovania, že softvérové \u200b\u200bprodukty fungujú v plnom súlade s požiadavkami alebo podmienkami realizovanými v predchádzajúcich prácach. Tento proces môže zahŕňať analýzu, overovanie a testovanie (testovanie). Proces certifikácie je proces určovania úplnosti zhody stanovených požiadaviek vytvorených systémom alebo softvérovým produktom byť ich funkčným určeným. Proces spoločnej analýzy je proces hodnotenia štátov av prípade potreby výsledky práce (výrobkov) na projekte. Proces auditu je proces určovania súladu s požiadavkami, plánomi a podmienkami zmluvy. Vo výške týchto procesov a tvoria to, čo sa bežne nazýva testovanie.

Testovanie je založené na skúšobných postupoch so špecifickými vstupnými údajmi, počiatočnými podmienkami a očakávaným výsledkom vyvinutým na konkrétny účel, ako napríklad kontrola samostatného programu alebo overovanie súladu s určitou požiadavkou. Skúšobné postupy môžu kontrolovať rôzne aspekty fungovania programu - od riadnej prevádzky samostatnej funkcie pred primeraným vykonávaním obchodných požiadaviek.

Pri vykonávaní projektu je potrebné zohľadniť v súlade s akým normami a požiadavky budú testované výrobkom. Aké nástroje budú (ak sú) používajú na vyhľadávanie a dokumentov zistených defektov. Ak si spomeniete na testovanie od samého začiatku projektu, testovanie vyvinutého výrobku nebude dodať nepríjemné prekvapenia. Takže kvalita výrobku bude pravdepodobne dosť vysoká.

Životný cyklus produktu a testovanie

V našom čase ho používate iteratívnymi procesmi vývoja softvéru, najmä technológie RUP - racionálny jednotný proces(Obr. 1). Keď používate tento prístup, testovanie prestane byť "na procese šité", ktorý beží potom, čo programátori napísali všetok potrebný kód. Práca na testoch začína veľmi počiatočnou fázou identifikácie požiadaviek na budúci výrobok a úzko sa integruje so súčasnými úlohami. A robí nové požiadavky pre testerov. Ich úloha nie je len znížená na identifikáciu chýb čo najskôr a čo najskôr. Mali by sa zúčastňovať na celkovom procese identifikácie a eliminovania najvýznamnejších rizík projektu. Na tento účel je určený účel testovania a metód pre jeho dosiahnutie pre každú iteráciu. A na konci každej iterácie sa určuje, koľko je tento cieľ dosiahnutý, ak sú potrebné ďalšie testy, a či nie je potrebné zmeniť zásady a testovacie nástroje. Na druhej strane musí každá zistená vada prejsť svojím životným cyklom.

Obr. 1. Životný cyklus produktu na RUP

Testovanie sa zvyčajne vykonáva cyklom, z ktorých každý má špecifický zoznam úloh a účely. Skúšobný cyklus sa môže zhodovať s iteráciou alebo zodpovedať svojej špecifickej časti. Typicky sa skúšobný cyklus vykonáva pre špecifickú zostavu systému.

Životný cyklus softvérového produktu sa skladá zo série relatívne krátkych iterácií (obr. 2). Iterácia je kompletný vývojový cyklus, ktorý vedie k uvoľneniu konečného produktu alebo niektoré z jeho skrátenej verzie, ktorá sa rozširuje z iterácie na iteráciu tak, že na konci sa stáva hotovým systémom.

Každá iterácia zahŕňa spravidla úlohy pracovného plánovania, analýzy, dizajnu, implementácie, testovania a hodnotenia dosiahnutých výsledkov. Pomery týchto úloh sa však môžu výrazne zmeniť. V súlade s pomerom rôznych úloh v iteráciách sú zoskupené do fáz. V prvej fáze - začiatok - hlavná pozornosť sa venuje úlohám analýzy. V iteráciách druhej fázy - rozvoj - zameranie je na dizajn a testovanie kľúčových rozhodnutí projektu. V tretej fáze je výstavba najväčším podielom úloh rozvoja a testovania. A v poslednom fáze - prenos - sú vyriešené najvyššie úlohy testovania a prenosu systému k zákazníkovi.

Obr. 2. Iterácie životného cyklu softvérového produktu

Každá fáza má svoje vlastné špecifické ciele v životnom cykle výrobkov a považuje sa za to, že sa dosiahnu tieto ciele. Všetky iterácie, s výnimkou, môžu byť, iterácie fázy štart sú dokončené vytvorením fungujúcej verzie vyvinutého systému.

Kategórie testu

Testy sa výrazne líšia v úlohách, ktoré sú riešené s ich pomocou a podľa použitej techniky.

Kategórie testu Popis Kategórie Typy testovania
Aktuálne testovanie Súbor testov vykonaných na určenie výkonu pridaných nových funkcií systému.
  • stresové testovanie;
  • testovanie obchodných cyklov;
  • stresové testovanie.
Regresné testovanie Účelom regresného testovania je overiť, či pridanie systému neznižuje svoje schopnosti, t.j. Testovanie sa vykonáva podľa požiadaviek, ktoré už boli ukončené pred pridaním nových funkcií.
  • stresové testovanie;
  • testovanie obchodných cyklov;
  • stresové testovanie.

Subkategory testovanie

Subkategory testovanie Popis typu testovania Testovanie poddruhov
Stresové testovanie Používa sa na testovanie všetkých bez výnimky aplikácií funkcií. V tomto prípade sekvencia testovania funkcií nezáleží.
  • funkčné testovanie;
  • testovanie rozhrania;
  • testovacia databáza
Testovanie obchodných cyklov Používa sa na testovanie funkcií aplikácie v poradí ich volania užívateľom. Napríklad imitácia všetkých účtovných akcií na 1. štvrťrok.
  • jednotkové testovanie (modulárne testovanie);
  • funkčné testovanie;
  • testovanie rozhrania;
  • testovacia databáza.
Stresové testovanie

Používa sa na testovanie

Výkonnosť aplikácií. Účelom tohto testu je určiť rámec stabilnej prevádzky aplikácie. S týmto testovaním sa nazývajú všetky dostupné funkcie.

  • jednotkové testovanie (modulárne testovanie);
  • funkčné testovanie;
  • testovanie rozhrania;
  • testovacia databáza.

Typy testovania

Testovanie jednotiek (Modulárne testovanie) - Tento druh znamená testovanie jednotlivých aplikačných modulov. Na získanie maximálneho výsledku sa testovanie vykonáva súčasne s vývojom modulov.

Funkčné testovanie - Účelom tohto testu je zabezpečiť správne fungovanie skúšobného objektu. Testuje sa správne navigácia objektu, ako aj vstupným, spracovaním a výstupom údajov.

Testovacia databáza - Skontrolujte výkon databázy s normálnou prevádzkou aplikácie, pri momentoch preťaženia a multiplayerového režimu.

Testovanie jednotiek

Pre OOP je obvyklá organizácia modulárneho testovania otestovať metódy každej triedy, potom triedu každého balenia I.T.D. Postupne sa obrátime na testovanie celého projektu a predchádzajúce testy sú typom regresie.

Vo výstupných povinnostiach, testovacie údaje zahŕňajú skúšobné postupy, vstupné údaje, kód vykonávajúci test, výstup. Nasleduje typ výstupnej dokumentácie.

Funkčné testovanie

Funkčné testovanie skúšobného objektu sa plánuje a vykonáva sa na základe požiadaviek na testovanie uvedené v etape definície. Požiadavky sú obchodné pravidlá, prípadové grafy, obchodné funkcie, ako aj ak existujú grafy aktivít. Účelom funkčných testov je skontrolovať súlad vypracovaných grafických zložiek stanovených požiadaviek.

Tento typ testovania nemôže byť plne automatizovaný. V dôsledku toho je rozdelená do:

  • Automatizované testovanie (sa použije v prípade, keď môžete skontrolovať informácie o výstupe).

Účel: Testovací vstup, spracovanie a výstup údajov;

  • Manuálne testovanie (v iných prípadoch).

Účel: Testuje správnosť vykonávania požiadaviek používateľov.

Je potrebné vykonať (prehrať) každý z použitia, s použitím verných hodnôt a samozrejme chybné, na potvrdenie správneho fungovania podľa nasledujúcich kritérií: \\ t

  • produkt reaguje primerane na všetky zadané údaje (očakávané výsledky sa zobrazia v reakcii na správne zadané údaje);
  • výrobok primerane reaguje na nesprávne zadané údaje (zobrazia sa vhodné chybové hlásenia).

Testovacia databáza

Účelom tohto testovania je zabezpečiť, aby metódy prístupu k databázam boli spoľahlivé, v ich správnom vykonávaní bez toho, aby narušili integritu údajov.

Musíte konzistentne použiť maximálny možný počet odvolaní do databázy. Používa sa prístup, v ktorom je test zostavený takým spôsobom, aby "zaťaženie" základne so sekvenciou, vernými hodnotami a samozrejme chybné. Odpoveď databázy na zadávanie údajov sa odhaduje, časové intervaly ich spracovania sa odhadujú.

Matematické základy teórie testovacích testov

Typy testovacích úloh

Existujú dve v podstate rôzne úlohy: ZATVORENÉ (keď sú možnosti testovania ponúkané) a otvorené (subjekty musia prijať odpoveď nezávisle). Otvorené úlohy môžu byť rozdelené do dvoch skupín:

    Úlohy so stručnou regulačnou odozvou, ktorého znenie by malo vygenerovať len jeden plánovaný vývojárom, odpoveďou;

    Úlohy s voľne postavenými odpoveďami, ktoré nemajú žiadne obmedzenia týkajúce sa obsahu obsahu a prezentácie.

Prideliť päť základných typov úloh. Všetky ostatné typy sú variácie alebo kombinácie týchto piatich typov.

    S výberom. Text úlohy pozostáva z otázky. Pre výber sú ponúkané niekoľko odpovedí, z ktorých jeden alebo viac sú správne.

    Úloha na pridanie. Vo formulácii úlohy, určitý fragment textu, ktorý označuje podčiarknuté (alebo niekoľkými podčiarkovníkmi rovnakej dĺžky, ak sú zmeškané slová trochu). Skip môže byť v ktorejkoľvek časti textu, ale odporúča sa to urobiť na konci. V reakcii na subjekt musí napísať zmeškané slová.

    Nastavenie správnej sekvencie.

    Úloha pre zhodu.Znenie úlohy obsahuje dva zoznamy. Vľavo, spravidla, prvky súpravy obsahujúcej formuláciu problému sú uvedené vpravo - prvky, ktoré sa majú vybrať. Prvky ľavej sady sú očíslované, správne - označené písmenami. Je žiaduce, aby druhá sada obsahuje väčší počet prvkov v porovnaní s prvou sadou. V tomto prípade každý prvok prvej sady zodpovedá jednému alebo viacerým prvkom druhej sady.

    Úlohu s podrobnou odpoveďou.

Etapy vývoja testu

    Formulovanie účelu a predmetu štúdie.

Kto je a prečo podlieha testovaniu

    Rozvoj testovania.

Študovanie požiadaviek vzdelávacieho štandardu, obsah učebníc.

Špecifikácia testovania:

    Výber sekcií (témy) a ich percento v skúške

    Výber typov úloh

    Určenie úrovní zvládnutia vedomostí a zručností:

    Úroveň 1

    Znalosť definícií základných pojmov disciplíny, ako aj základné obvinenia z disciplíny

    2 úrovne

    Znalosť základných vzorcov a algoritmov; Schopnosť aplikovať ich pri riešení štandardných úloh

    3 úrovne

    Aplikácia poznatkov získaných na riešenie atypických úloh

  1. Určenie približného počtu úloh v teste a distribúcii tohto čísla podľa typu úloh.

    Vývoj úloh.

Vzhľadom k tomu, prvá verzia testu by mala identifikovať nedostatky úloh (vrátane navrhovaných rušňovodičov), potom v každej úlohe bolo možné pre najväčší počet rozptyľujúcich, aby boli dostatočne postačujúce.

    Preskúmanie surového cesta.

Účelom preskúmania je identifikovať a opraviť nesprávne a nezrozumiteľné znenie. Výsledkom je, že akékoľvek úlohy môžu byť odstránené z testu (preto sa odporúčajú úlohy).

    Schválenie.

    Výpočet charakteristík úloh a testu.

Podľa výsledkov testovania sa vypočítajú tieto štatistické charakteristiky úloh a testov.

Priestor jednotlivých bodov Meria vzdialenosť, v ktorej sa všetky hodnoty indikátora zmenia v distribúcii (jednotlivé body).

Z rýchlo selektívne(priemeru) pre kombináciu jednotlivých bodov H. 1 , H. 2 , …, H. K. Skupina K. Subjekty sa vypočítajú vzorcom

.

Počítať disperzia Na základe výpočtu odchýlok každej hodnoty indikátora z priemerného aritmetiky v distribúcii:

.

Nízka disperzia označuje nízku kvalitu testov, pretože slabá variácia výsledkov ukazuje slabú diferenciáciu testov na úroveň prípravy. Prípadne vysoká disperzia je charakteristická pre prípad, keď sa všetci študenti líšia v počte vykonaných úloh, ktoré tiež vyžaduje testovanie.

Dokončuje výpočet vyhodnotenia testovacích charakteristík cesto spoľahlivosti. Na výpočet koeficientu spoľahlivosti môžete použiť vzorca cuozér Richardson Coeficic (len v prípade, keď sú všetky váhy úloh rovné):

.

Ak chcete poskytnúť kvalitatívne hodnotenie spoľahlivosti skúšky, použite nasledujúcu tabuľku:

Hodnota koeficientu spoľahlivosti

Hodnotenie spoľahlivosti

neuspokojivý

uspokojivý

vynikajúci

Posúdenie obtiažnosti TRUE J TROUP Vypočítané vzorcom

.

Všimnite si, že čím viac uľahčuje úlohu, tým viac podielu správnych odpovedí na to ( p. \\ t j.) Preto by bolo prirodzené interpretovať tento podiel ako jednoduchosť úlohy. V dobre vyváženom teste musí mať test niekoľko ťažkých úloh, niekoľko pľúc, ale väčšina úloh by mala mať ťažkosti od 0,3 do 0,7; Zároveň je žiaduce, aby sa na to, aby sa nachádzal v poradí výsledku svojich ťažkostí.

Test platnosti úlohy Určená stupňom súladu s úlohou na účely diferenciácie predmetov. Na tento účel sa určujú koeficienty korelačného hodnotenia pre úlohu so skóre počas celého testu. To sa vykonáva pomocou korelačného koeficientu vzorcom

,

kde X. i.  Skóre skúšky i.-Kód Y. i.  lopta i.-HO testované na úlohu. Všimnite si, že v prípade dichotomického odhadu úlohy je výpočet koeficientu o niečo zjednodušený. Ak r.< 0, то задание следует удалить из теста, т. к. в нем побеждают слабые ученики, а сильные выбирают неверный ответ либо пропускают задание при выполнении теста. Положительные значения, но близкие к нулю (незначимые), указывают на низкую прогностическую способность задания теста; такие задания требуют доработки содержания.

Schopnosť rozlišovať predmety na najlepších a najhorších výstavách koeficient diferencovania schopnosti (alebo diskriminácia) Úlohy. Najjednoduchší spôsob výpočtu takéhoto indexu sa nazýva metóda kontrastných skupín a je nasledovná. Z celej skupiny subjektov sú niektoré z najlepších testov pridelené testovacej skúške (budú ich nazývaní silná podskupina) a rovnaká najhoršia (slabá podskupina). Potom pre každú z týchto podskupín sa vypočíta podiel správnych odpovedí v podskupine. Zaznamenaný p. \\ t 1 j. Podiel správnych odpovedí j.-E-úloha v silnej podskupine a cez p. \\ t 0 j. - podiel správnych odpovedí v slabej podskupine. Potom diskriminácia index i.Úloha je určená vzorcom:

(r. DIS) j. P. 1 j.p. \\ t 0 j. .

Pre úlohu, s ktorou všetky silné semenné skúšky a nie sú slabé, diskriminačný index sa nespôsobil r. disk bude 1; V tomto prípade má úloha maximálny diferenčný účinok. Pre úlohu, s ktorou všetky slabé skúšky sa nezhodujú, nie jeden silný, diskriminácia sa bude rovnať -1. V iných prípadoch bude index brať hodnoty medzi -1 a 1. Úlohy s nulou a zápornou hodnotou diskriminačného indexu sú zle diferencovaní študenti, takže musia byť odstránené z testu. Ak je index pozitívny, ale menej ako 0,2, potom takáto úloha vyžaduje starostlivú analýzu obsahu.

Podľa týchto charakteristík môžu byť niektoré úlohy odstránené z testu, ktoré podliehajú korekcii. Potom sa musia opakovať kroky 5, 6.

Formuláry na výpočet pravdepodobnosti hádania

Pri vypracovaní testu je potrebné určiť, koľko odpovedí by sa malo ponúkať každej otázke, aby pravdepodobnosť úspešne absolvovala testovanie jednoducho hádanie správnych odpovedí, bolo menej ako 0,05 (t.j. menej ako 5%). Testovanie sa bude považovať za úspešne prešiel, ak je test pravdivý najmenej ako Q.otázky. Ak test obsahuje N. Otázky, potom sa použije nasledujúci vzorec na výpočet pravdepodobnosti "úspešného hádania":

,

kde m. - počet odpovedí, ktoré ponúka každú otázku.

V prípade, že počet odpovedí ponúkaných na otázky v rôznych úlohách je iný, vzorec má komplexnejší vzhľad:

,

kde - Pravdepodobnosť odhadnutí odpovedí j. otázky, ktoré sa vypočítajú takto. Nechajte všetky otázky v teste možno rozdeliť r. Skupiny tak, aby tá istá skupina v kombinácii s rovnakou pravdepodobnosťou hádania. Označiť p. \\ t i. , 0< p. \\ t i. <1 - вероятность угадывания и k. i. - počet otázok v i.- táto skupina (
) a

.

Potom j. z
na n:

,

kde t. r. = j.  (t. 1 + t. 2 +…+ t. r. -1) a ak t. r. > k. r. Potom budeme zvážiť
= 0 .

Príklady.

N \u003d 10, q \u003d 2/3: m \u003d 2, p<0,2; m=3, P<0,02; m=4, P<0,004

Literatúra

    Chelsskova M. B. Teória a prax navrhovania pedagogických testov: tutoriál. - M.: LOGOS, 2002. - 432 p.

    Malygin A.A., Svetsov V. I., GSYNICINA S. V. Praktické odporúčania pre prípravu kontrolných a meracích materiálov: Metóda. Manuál / Ivan. Štát On-tehnol. UN-T. - Ivanovo, 2005. - 30 s.

    Ako urobiť test // slejer K. Matematická fantázia. - M.: Mir, 1993. - P.116-118.


Základné otázky: Test ako nástroj na meranie. Hlavné teórie testovania. Funkcie, schopnosti a obmedzenia testovania. Používanie testov v hodnotení zamestnancov. Výhody a nevýhody používania testov. Formuláre a typy testovaných úloh. Technológie na budovanie úlohy. Posúdenie kvality testov. Spoľahlivosť a platnosť. Softvér na testovanie testov. 2.




Test ako základné koncepcie merania v testoch: meranie, test, obsah a forma úloh, spoľahlivosť a platnosť výsledkov merania. Okrem toho testológia používa takéto pojmy štatistickej vedy ako selektívne a všeobecné agregáty, priemerné ukazovatele, variácie, korelácia, regresia atď. 4




Testovacia úloha je didakticky a technologicky účinná jednotka kontrolného materiálu, časť testu, ktorá spĺňa požiadavky hmotnoprávnej čistoty obsahu (alebo jedného rozmeru), obsahu a logickej správnosti, správnosti formulára, prípustnosť geometrického obrazu obrazu. 6.




Tradičný test je štandardizovaný spôsob diagnostikovania úrovne a štruktúry pripravenosti. V takomto teste všetky subjekty reagujú na rovnaké úlohy súčasne za rovnakých podmienok as rovnakými pravidlami pre hodnotiace reakcie. Aby ste dosiahli testovací cieľ, môžete vytvoriť nespočetné testy a všetky môžu zodpovedať dosiahnutiu úlohy. osem


Professional (z Lat. Profesio Specialty + Gramma Record) Systém funkcií, ktoré túto profesiu opisujú, alebo toto povolanie, ako aj zoznam pravidiel a požiadaviek uložených touto profesiou alebo špecialitou zamestnanca. Professional môže zahŕňať najmä zoznam psychologických charakteristík, ktoré musia byť nakonfigurované zástupcovia špecifických profesijných skupín. deväť


Hlavná skúška testovania prvých vedeckých prác na teórii testov sa objavili na začiatku dvadsiateho storočia, na križovatke psychológie, sociológie, pedagogiky a iných, tzv. Zahraniční psychológovia nazývajú túto vedu s psychometrickou (psychometrikou) a učiteľmi - pedagogické meranie (meranie vzdelávania). Nežiaduca ideológia a politika, výklad názvu titulu "Testology" je jednoduchá a transparentná: veda o testoch. 10


Prvou etapou je pozadie - od staroveku až do konca XIX storočia, keď boli distribuované duhové formy kontroly znalostí a schopností; Druhé obdobie, klasické, pokračovalo od začiatku 20. do konca 60-tych rokov, počas ktorých bola vytvorená klasická teória testov; Tretie obdobie je technologický - ktorý sa začal z 70. rokov - rozvoj metodík adaptívnych testovacích a vzdelávacích metodík, metodiky účinného vypracovania testov a testovacích úloh pre parametrické hodnotenie predmetov nameranej latentnej kvality. jedenásť


Funkcie, schopnosť a obmedzenia testovania použité pri výbere testov sú určené na získanie psychologického portrétu kandidáta, hodnotiť svoje schopnosti, ako aj odborné znalosti a zručnosti. Testy vám umožňujú porovnávať kandidátov medzi sebou alebo s odkazmi, to znamená ideálny kandidát. Testy sa používajú na meranie vlastností osoby potrebnej na účinnú výkonnosť práce. Niektoré testy sú usporiadané takým spôsobom, aby zamestnávateľ samostatne spravoval testovanie a vypočítané výsledky. Iní vyžadujú služby skúsených konzultantov, aby zabezpečili ich správne používanie. 12


Obmedzenia používania testov súvisia - s ich nákladnou správou; - s vhodnosťou na hodnotenie ľudských schopností; - Skúšky sú úspešnejšie na predpovedanie úspechu v práci, ktorá obsahuje krátkodobé odborné úlohy, a nie sú veľmi vhodné v prípadoch, keď úlohy vyriešené pri práci zaberajú niekoľko dní alebo týždňov. 13








2. Použitá terminológia musí byť vybraná na špecifické cieľové publikum. Je tiež potrebné vylúčiť zbytočné články alebo články, ktoré zahŕňajú dve alebo viac otázok, pretože niekedy zamieňajú odporcu a sťažujú ho interpretovať. 17.


3. Na splnenie všetkých týchto požiadaviek by ste mali zobraziť celú otázku článku podľa článku pre článok a analyzovať, aký účel každý z nich slúži. Napríklad, ak je test vyvinutý na meranie analytických schopností stážistov - účtovníkov, stojí za to myslieť, že v tomto prípade znamená koncept "analytických schopností". osemnásť




5. Ak sú vybraté otázky a formáty výsledkov počítania, musia byť prevedené na užívateľsky príjemný formát, s jasne písomnými pokynmi a otázkami - príklady; Tak, že kandidáti test úplne pochopili, že sú potrebné. dvadsať


6. Veľmi často v tomto štádiu, vývoj v teste zahŕňa viac otázok, ako je potrebné. Podľa niektorých odhadov trikrát viac ako zostávajú v konečnom systéme skúšky alebo merania. Počiatočným opatrením bude test testu vyvinuté na relatívne širokom vzorke z počtu existujúcich pracovníkov, aby sa ubezpečil, že všetky otázky sú ľahko zrozumiteľné. 21.


7. Testy na definíciu poznatkov zvyčajne začínajú jednoduchými otázkami, ktoré postupne komplikujú až do konca. Keď sú testy určené na meranie sociálnych postojov a osobných charakteristík, môže byť užitočné striedať negatívne a pozitívne formulované výrobky, aby sa zabránilo nedotváraným odpovediam. 22.


8. Posledným krokom je použitie testu na širokej reprezentatívnej vzorke na stanovenie pravidiel vykonávania, spoľahlivosti a platnosti ešte pred použitím ako výberový nástroj. Okrem toho je potrebné určiť spravodlivosť testu, aby ste sa uistili, že nediskriminuje žiadne podskupiny obyvateľstva (napríklad etnické rozdiely). 23.


Vyhodnotenie kvality testu tak, že výberové metódy boli pomerne účinné, mali by byť spoľahlivé, platné a spoľahlivé. Presnosť výberu metódy je charakterizovaná nekonzistentnosť systematických chýb v meraní, to znamená jeho konzistentnosť za rôznych podmienok. 24.


V praxi, spoľahlivosť pri vydávaní rozsudkov sa dosiahne porovnaním výsledkov dvoch alebo viacerých podobných testov vykonaných v rôznych dňoch. Ďalším spôsobom, ako zvýšiť spoľahlivosť je porovnaním výsledkov niekoľkých alternatívnych výberových metód (napríklad test a konverzácia). Ak sú výsledky podobné alebo rovnaké, možno ich považovať za správne. 25.


Spoľahlivosť znamená, že vykonané merania poskytnú rovnaký výsledok ako tie predchádzajúce, to znamená, že faktory tretích strán neovplyvňujú výsledky. Platnosť znamená, že táto metóda mení presne to, na čom je určený. Maximálna možná presnosť informácií získaných špeciálne vyvinutých techník vo vedeckom výskume je obmedzená technickými faktormi a nepresahuje 0,8. 26.


V praxi výber pracovníkov poznamenáva, že spoľahlivosť rôznych metód hodnotenia sa nachádza v intervaloch: 0,1 - 0,2 - tradičný pohovor; 0,2 - 0,3 - odporúčania; 0,3 - 0,5 - Profesionálne testy; 0,5 - 0,6 - štruktúrovaný rozhovor, pohovor v kompetenciách; 0,5 - 0,7 - kognitívne a osobné testy; 0,6 - 0.7 - Prístup kompetencie (hodnotenie - centrum). 27.


Pod rozumnosťou je určený, s akou stupeň presnosti, tento výsledok, metóda alebo kritérium "predpovedá" budúcu účinnosť ľudského testovaného. Platnosť metód sa týka záverov vykonaných na základe postupu alebo iného, \u200b\u200ba nie samotného postupu. To znamená, že metóda výberu môže byť sama osebe spoľahlivá, ale nie splniť konkrétnu úlohu: neariame sa to, čo sa vyžaduje v tomto prípade. 28.


Softvér pre rozvoj testov v domácej praxi predstavil rôzne integrované programy s psychodiagnostickým modulom, napríklad programom "1 C: platu a personálny manažment 8.0" s psychodiagnostickým modulom, vyvinutý spolu so skupinou učiteľov ministerstva osobnosti Psychológia a všeobecná psychológia fakulty psychológie Moskva Štátna univerzita M. V. Lomonosov pod vedením dediny psych. Sciences, prof. A. N. GUSEVA. Tréningový simulátor pre rozvoj systémov hodnotenia personálu a prispôsobenie testovacích techník Fakulty psychológie TSU, vyvinutý aj na základe "1 C: Enterprise 8.2" softvérovej spoločnosti spoločnosti. 29.


Literatúra: Výber a prenájom zamestnancov: Testovanie a hodnotiace technológie / Dominic Cooper, Ivan T. Robertson, Gordon Tinline. - M., Ed - v "Top, - 156 p. Psychologická podpora odbornej činnosti: teória a prax / ed. Prof. G. S. NIKIFOROVA. - SPB.: Reč, - 816 p. tridsať

Kapitola 3. Výsledky štatistického spracovania

Štatistické spracovanie výsledkov testov umožňuje na jednej strane objektívne definovať výsledky predmetov, na druhej strane - vyhodnotiť kvalitu samotného testovania, testovacích úloh, najmä na zhodnotenie jeho spoľahlivosti. Problém spoľahlivosti sa vypláca veľa pozornosti v klasickej teórii testov. Táto teória nestratila relevantnosť a teraz. Napriek vzhľadu, modernejším teóriám, klasická teória naďalej udržiava svoju pozíciu.

3.1. Hlavné ustanovenia klasickej teórie testov

3.2. Výsledky testov MATRIX

3.3. Grafická prezentácia testovacích bodov

3.4. Opatrenia ústrednej tendencie

3.5. Normálna distribúcia

3.6. Test testovacích bodov disperzie

3.7. Korelačná matrica

3.8. Spoľahlivosť skúšky

3.9. Platnosť skúšky

Literatúra

Hlavné ustanovenia klasickej teórie testov

Stvoriteľ klasickej teórie testov (klasická teória mentálnych testov) je dobre známy britský psychológ, autor faktorovej analýzy, náročné Edward Spearman (1863-1945) 1. Narodil sa 10. septembra 1863 a štvrtina jeho života bola doručená v britskej armáde. Z tohto dôvodu dostal stupeň lekára filozofie len vo veku 41 2. Dizertačná štúdia dielPirmana bola vykonaná v Lipsku laboratóriu experimentálnej psychológie pod vedením Wilhelm Wundt (Wilhelm Wundt). V tomto období bol Francis Galton (Francis Galton) silný vplyv na Ch.Pirman (Francis Galton) na testovanie ľudskej inteligencie. Žiaci PartPirman boli R.Cattell a D.wechsler. Medzi jeho nasledovníkmi, A.anastasi, J. P. Guilford, P.Vernon, C.BURT, A.Jensen môže byť nazývaný.

Veľký prínos k rozvoju klasickej teórie testov vyrobených Louis Guttman, 1916-1987) 3.

Komplexne a plné klasickej teórie testov prvýkrát je uvedené v základnej práci Harold Gullixen (Gulliksen H., 1950) 4. Odvtedy sa teória trochu modifikovala, najmä matematické zariadenie bolo zlepšené. Klasická teória testu v modernej prezentácii je uvedená v knihe Crocker L., ALIGNA J. (1986) 5. Od domácich výskumníkov bol prvýkrát uvedený opis tejto teórie v.Avanesis (1989) 6. V práci Chelyowkova M.B. (2002) 7 poskytuje informácie o štatistických odôvodnení kvality testu.

Klasická testovaná teória je založená na nasledujúcich piatich hlavných pozíciách.

1. Empiricky získaný výsledok merania (x) je súčtom skutočného výsledku merania (t) a chýb merania (E) 8:

X \u003d t + e (3.1.1)

Hodnoty t a e sú zvyčajne neznáme.

2. Skutočný výsledok merania môže byť vyjadrený ako matematické očakávania E (X):

3. Korelácia pravdivých a chybných zložiek podľa sady subjektov je nula, to znamená ρ te \u003d 0.

4. Chybné zložky dvoch akýchkoľvek testov nerealizujú: \\ t

5. Chybné zložky jedného testu nerealizujú so skutočnými zložkami akéhokoľvek iného testu:

Okrem toho je základom klasickej teórie testov dve definície - paralelné a ekvivalentné testy.

Paralelné testy musia spĺňať požiadavky (1-5), pravé zložky jedného testu (T 1) musia byť rovnaké ako skutočné zložky iného testu (T2) v každej vzorke testov, ktoré reagujú na obidva testy. Predpokladá sa, že T1 \u003d T2 a navyše sa rovnajú disperziou S 12 \u003d S22.

Ekvivalentné testy musia spĺňať celú požiadavku paralelných testov s výnimkou jedného: Skutočné zložky jedného testu sa nemusia rovnať skutočným zložkám iného paralelného testu, ale mali by sa líšiť na rovnakom konštante. z.

Podmienka ekvivalencie dvoch testov je zaznamenaná v nasledujúcom podobe:

kde C12 je konštanta rozdielov vo výsledkoch prvých a druhých testov.

Na základe uvedených ustanovení je teória spoľahlivosti skúšky 9.10.

to znamená, že disperzia získaných testovacích bodov sa rovná súčtu disperzií skutočných a chybných zložiek.

Tento výraz prepíšem takto:

(3.1.3)

Pravá strana tejto rovnosti je spoľahlivosť testu ( r.). Spoľahlivosť testu teda môže byť napísaná vo forme:

Na základe tohto vzorca boli následné výrazy na nájdenie faktora spoľahlivosti testu. Spoľahlivosť testu je jeho kľúčová charakteristika. Ak je spoľahlivosť neznáma, výsledky testov nemožno interpretovať. Spoľahlivosť testu charakterizuje svoju presnosť ako merací prístroj. Vysoká spoľahlivosť znamená vysokú opakovateľnosť výsledkov skúšok za rovnakých podmienok.

V klasickej teórii testov je najdôležitejším problémom určiť skutočný testovací bod predmetu (t). Empirický testovací bod (X) závisí od mnohých podmienok - úrovne obtiažnosti úloh, úrovne pripravenosti predmetov, počtu úloh, podmienky vykonávania testovania atď. V skupine silných, dobre vyškolených predmetov budú výsledky testov zvyčajne lepšie. v skupine slabo pripravených predmetoch. V tejto súvislosti zostáva otázka rozsahu ťažkostí úloh na všeobecnej populácii subjektov otvorená. Problém spočíva v tom, že skutočné empirické údaje sa získajú na všetkých náhodných vzorkách predmetov. Sú to pravidlo, že ide o vzdelávacie skupiny, ktoré sú mnoho študentov pomerne dôrazne spolupracovať medzi sebou v procese učenia a študentov v podmienkach, ktoré sa často neopakujú pre iné skupiny.

Nájsť s E. Z rovnice (3.1.4)

Tu výslovne ukazuje závislosť presnosti merania zo štandardnej hodnoty odchýlky. s X. a od spoľahlivosti testu r..

SPRÁVA

Študent 137 gr. Ivanova I.

o kontrole účinnosti odbornej techniky
Použitie matematických štatistických metód

Oddiely správy sa vykonávajú v súlade s vzorkami uvedenými v tomto návode na konci každej fázy hry. Kredité správy sú uložené na Katedre biomechaniky pred poradenstvom pred skúškou. Študenti, ktorí sa neuviedli na vykonanú prácu a nedali sa notebooku so správou pre učiteľa, nie sú povolené na skúšku v športovej metrológii.


I Stage Business hra
Kontrola a meranie v športe

Účel:

1. Oboznámiť sa s teoretickými základmi kontroly a meraní v športe a telesnej výchove.

2. Kúpiť meranie zručností vysokorýchlostného výkonu v športovcov.

1. Kontrola vo fyzickom
Vzdelávanie a šport

Telesná výchova a športové vzdelávanie nie je spontánny, ale spravovaný proces. V každom okamihu času je osoba v určitom fyzickom stave, ktorá je určená najmä zdravím (súlad ukazovateľov životne dôležitej činnosti, stupeň udržateľnosti organizmu nepriaznivým náhlym vplyvom), postavením a stavom fyzických funkcií.

Odporúča sa spravovať fyzickú podmienku osoby zmenou správnym smerom. Toto riadenie sa vykonáva prostredníctvom telesnej výchovy a športu, ktorá, najmä na liečbu cvičenia.

Zdá sa, že učiteľ (alebo tréner) spravuje fyzickú podmienku, čo ovplyvňuje správanie športovca, t.j. Ponúka určité cvičenie, ako aj kontrolu správnosti ich implementácie a získaných výsledkov. V skutočnosti, správanie športovca nešetrí trénera, ale samotný športovec. Počas športového vzdelávania je ovplyvnený vplyv na samosprávny systém (ľudské telo). Individuálne rozdiely v štáte športovcov nedávajú dôveru, že rovnaký účinok spôsobí rovnakú odpoveď. Otázka spätnej väzby je preto relevantná: informácie o štáte športovca vstupujúci do trénera počas kontroly tréningového procesu.

Kontrola fyzickej výchovy a športu je založená na meraniach ukazovateľov, výber najdôležitejšieho a ich matematického spracovania.

Riadenie vzdelávacieho procesu zahŕňa tri etapy:

1) Zber informácií;

2) jeho analýza;

3) rozhodovanie (plánovanie).

Zber informácií sa zvyčajne vykonáva počas komplexnej kontroly, ktorých predmety sú:

1) konkurenčné činnosti;

2) Výcvikové zaťaženie;

3) Štát športu.



Existujú tri typy športovcov v závislosti od trvania medzery potrebnej na presťahovanie z jedného štátu do druhého.

1. Pharge (trvalý) stav. Uložiť relatívne dlhé -týždňov alebo mesiacov. Komplexná charakteristika stupňa športovca, čo odráža jeho schopnosti na demonštráciu športových úspechov, sa nazýva pripravenosť a optimálny stav (najlepšie pre tento tréningový cyklus) pripravenosti - Športový formulár. Samozrejme, v priebehu jedného alebo viacerých dní, stav športovej formy nemožno dosiahnuť alebo stratiť.

2. Prúd štát. Sa líši pod vplyvom jedného alebo niekoľko povolaní. Dôsledky účasti na súťaže alebo na jednom útvare odbornej prípravy sa často oneskoria na niekoľko dní. V tomto prípade športovec zvyčajne berie na vedomie javy z nepriaznivej povahy (napríklad svalová bolesť) a pozitívna (napríklad stav vysokého výkonu). Takéto zmeny sa nazývajú retrActive Training Effect.

Súčasný stav pretekára určuje povahu najbližších tréningov a rozsah zaťaženia v nich. Osobitný prípad súčasného stavu charakterizovaného pripravenosťou vykonávať v najbližších dňoch konkurenčného cvičenia s výsledkom v blízkosti maxima aktuálna pripravenosť.

3. Operatívny štát. Zmeny vplyvu jednorazové vykonanie Cvičenie a je dočasné (napríklad únava spôsobená jednou prevádzkovou vzdialenosťou; dočasné zvýšenie výkonu po zahriatí). Operačný stav zahynov sa mení počas školiaceho zasadnutia a mala by sa zohľadniť pri plánovaní rekreačných intervalov medzi prístupmi, opakovanými pretekami a zároveň vyriešili otázku uskutočniteľnosti dodatočného tréningu atď. Osobitný prípad prevádzkového stavu charakterizovaného okamžitou pripravenosťou vykonávať konkurenčné cvičenie s výsledkom v blízkosti maxima prevádzková pripravenosť.

V súlade s klasifikovaným rozdelením klasifikácie tri hlavné typy stavu monitorovania:

1) fázová kontrola. Jeho cieľom je posúdiť štádium (pripravenosť) športovca;

2) súčasná kontrola. Jej hlavnou úlohou je identifikovať každodenné (aktuálne) výkyvy v športovcom;

3) prevádzková kontrola. Jeho cieľom je v súčasnosti výslovné hodnotenie štátu športovca.

Meranie alebo testovanie vykonané s cieľom určiť stav alebo schopnosti športovca cesto. Postup merania alebo skúšky sa nazýva testovanie.

Akákoľvek skúška zahŕňa meranie. Ale nie žiadne meranie slúži ako test. Ako testy sa môžu použiť len tie, ktoré spĺňajú nasledujúce metrologické účely. požiadavky:

2) štandardizácia;

3) dostupnosť systému hodnotenia;

4) Testy spoľahlivosti a informatizity (dobroty);

5) Typ kontroly (štádium, aktuálne alebo prevádzkové).

Test, ktorý je založený na motorových úlohách, sa nazýva motor. Existujú tri skupiny motorových testov:

1. Kontrolné cvičenia vykonaním športovec získa úlohu na zobrazenie maximálneho výsledku. Výsledkom testu je motorový úspech. Napríklad čas, počas ktorého športovec prevádzkuje vzdialenosť 100 m.

2. Štandardné funkčné vzorky, počas ktorých úloha, to isté pre všetkých, je dávkované buď veľkosťou vykonanej práce, alebo rozsah fyziologických posunov. Výsledkom testu je fyziologické alebo biochemické ukazovatele so štandardnými prácami alebo motorickými úspechmi so štandardnou veľkosťou fyziologických posunov. Napríklad percento zvyšovania srdcovej frekvencie po 20 droboch alebo rýchlosť, s ktorou športovec beží na pevnú hodnotu srdcovej frekvencie 160 bije za minútu.

3. Maximálne funkčné vzorky, počas ktorého musí športovec zobraziť maximálny výsledok. Výsledkom testu je fyziologické alebo biochemické ukazovatele pri maximálnej prevádzke. Napríklad maximálna spotreba kyslíka alebo maximálne množstvo kyslíka.

Vysoko kvalitné testovanie zahŕňa znalosti o teórii meraní.