Matematické základy teórie návrhu testov. Charakteristika kontrolného testovania v telesnej výchove

Matematické základy teórie návrhu testov.  Charakteristika kontrolného testovania v telesnej výchove
Matematické základy teórie návrhu testov. Charakteristika kontrolného testovania v telesnej výchove

Popis prezentácie k jednotlivým snímkam:

1 snímka

Popis snímky:

2 snímka

Popis snímky:

Fyzické vlastnosti je zvykom nazývať vrodenými (geneticky zdedenými) morfofunkčnými vlastnosťami, vďaka ktorým je možná fyzická (materiálne vyjadrená) ľudská činnosť, ktorá sa naplno prejavuje v cieľavedomej motorickej činnosti. Medzi hlavné fyzické vlastnosti patrí sila, rýchlosť, vytrvalosť, flexibilita, obratnosť.

3 snímka

Popis snímky:

Motorické schopnosti sú individuálne charakteristiky, ktoré určujú úroveň pohybových schopností človeka (V. I. Lyakh, 1996). Základ pohybových schopností človeka tvoria fyzické vlastnosti a formou prejavu je motorika a schopnosti. Motorické schopnosti zahŕňajú silu, vysokú rýchlosť, rýchlosť-sila, motoricko-koordinačné schopnosti, všeobecnú a špecifickú vytrvalosť

4 snímka

Popis snímky:

Schéma systematizácie fyzických (motorických) schopností Fyzické (motorické) schopnosti Kondičné (energetické) Sily Kombinácie kondičných schopností Vytrvalosť Rýchlosť Flexibilita Koordinačné (informačné) CS súvisiace so samostatnými skupinami pohybových akcií, špeciálne CS Špecifické CS Kombinácie koordinačných schopností Kombinácie kondičných a koordinačných schopností

5 snímka

Popis snímky:

ZÍSKAJTE PRESNÉ INFORMÁCIE O ÚROVNI ROZVOJA POHYBOVÝCH SCHOPNOSTÍ / vysoká, stredná, nízka / JE TO MOŽNÉ POMOCOU TESTOV / alebo kontrolných cvičení /.

6 snímka

Popis snímky:

Pomocou kontrolných testov (testov) je možné odhaliť absolútne (explicitné) a relatívne (skryté, latentné) ukazovatele týchto schopností. Absolútne indexy charakterizujú úroveň rozvoja určitých motorických schopností bez zohľadnenia ich vzájomného vplyvu. Relatívne ukazovatele umožňujú posúdiť prejav motorických schopností, berúc do úvahy tento vplyv.

7 snímka

Popis snímky:

Vyššie uvedené fyzické schopnosti môžu byť prezentované ako potenciálne existujúce, to znamená pred začatím vykonávania akejkoľvek pohybovej aktivity alebo činnosti (možno ich nazvať potenciálne schopnosti) a ako prejavujúce sa v skutočnosti na začiatku (aj pri vykonávaní motorických testov) a v proces vykonávania týchto činností (skutočné fyzické schopnosti).

8 snímka

Popis snímky:

S istou mierou konvencie môžeme hovoriť o ZÁKLADNÝCH a telesných schopnostiach KOMPLEXNÝCH fyzických schopnostiach

9 snímka

Popis snímky:

VÝSLEDKY VÝSKUMU UMOŽŇUJÚ ROZLIŠOVAŤ NASLEDUJÚCE FYZICKÉ SCHOPNOSTI ŠPECIÁLNE ŠPECIFICKÉ VŠEOBECNÉ COP

10 snímka

Popis snímky:

Špeciálne fyzické schopnosti sa vzťahujú na homogénne skupiny integrálnych pohybových činností alebo činností: beh, akrobatické a gymnastické cvičenia na prístroji, hádzacie motorické činnosti, športové hry (basketbal, volejbal).

11 snímka

Popis snímky:

O konkrétnych prejavoch fyzických schopností možno hovoriť ako o zložkách, ktoré tvoria ich vnútornú štruktúru.

12 snímka

Popis snímky:

Hlavnými zložkami koordinačných schopností človeka sú teda: schopnosť orientácie, rovnováhy, reakcie, diferenciácie parametrov pohybov; schopnosť rytmu, reorganizácia motorických akcií, vestibulárna stabilita, dobrovoľná svalová relaxácia. Tieto schopnosti sú špecifické.

13 snímka

Popis snímky:

Za hlavné zložky štruktúry rýchlostných schopností sa považuje rýchlosť odozvy, rýchlosť jednotlivého pohybu, frekvencia pohybov a rýchlosť prejavujúca sa v integrálnych pohybových akciách.

14 snímka

Popis snímky:

K prejavom silových schopností patrí: statická (izometrická) sila, dynamická (izotonická) sila - výbušná, sila tlmiaca nárazy.

15 snímka

Popis snímky:

Štruktúra vytrvalosti je veľmi zložitá: aeróbna, vyžadujúca na svoj prejav kyslíkové zdroje rozkladu energie; anaeróbne (glykolytické, kreatínfosfátové zdroje energie - bez účasti kyslíka); vytrvalosť rôznych svalových skupín v statických polohách - statická vytrvalosť; výdrž pri dynamických cvičeniach vykonávaných rýchlosťou 20-90% maxima.

16 snímka

Popis snímky:

Prejavy (formy) flexibility, kde sa rozlišuje aktívna a pasívna flexibilita, sú menej zložité.

17 snímka

Popis snímky:

Všeobecné fyzické schopnosti by sa mali chápať ako potenciálne a realizované schopnosti človeka, ktoré určujú jeho pripravenosť na úspešnú realizáciu motorických akcií rôzneho pôvodu a významu. Špeciálne fyzické schopnosti sú schopnosti človeka, ktoré určujú jeho pripravenosť na úspešnú realizáciu motorických akcií podobného pôvodu a významu. Testy preto poskytujú informácie predovšetkým o stupni formovania špeciálnych a špecifických fyzických (rýchlosť, koordinácia, sila, vytrvalosť, flexibilita) schopností.

18 snímka

Popis snímky:

Špeciálne fyzické schopnosti sú schopnosti človeka, ktoré určujú jeho pripravenosť na úspešnú realizáciu motorických akcií podobného pôvodu a významu. Testy preto poskytujú informácie predovšetkým o stupni formovania špeciálnych a špecifických fyzických (rýchlosť, koordinácia, sila, vytrvalosť, flexibilita) schopností.

19 snímka

Popis snímky:

Úlohou testovania je zisťovať úrovne rozvoja kondičných a koordinačných schopností, posudzovať kvalitu technickej a taktickej pripravenosti. Na základe výsledkov testov je možné: porovnať pripravenosť tak jednotlivých študentov, ako aj celých skupín žijúcich v rôznych regiónoch a krajinách; vykonávať výber športu na vykonávanie určitého športu, na účasť v súťažiach; vykonávať vo veľkej miere objektívnu kontrolu výchovy (tréningu) školákov a mladých športovcov; identifikovať výhody a nevýhody používaných nástrojov, vyučovacích metód a foriem organizovania tried; napokon zdôvodniť normy (vekové, individuálne) telesnej zdatnosti detí a dospievajúcich.

20 snímka

Popis snímky:

Spolu s vyššie uvedenými úlohami v praxi rôznych krajín sú úlohy testovania redukované na nasledovné: naučiť samotných školákov určiť úroveň ich fyzickej zdatnosti a naplánovať potrebné komplexy fyzických cvičení; stimulovať žiakov k ďalšiemu zlepšovaniu fyzickej kondície (formy); poznať ani nie tak počiatočnú úroveň rozvoja motorickej schopnosti, ako jej zmenu v určitom čase; stimulovať žiakov, ktorí dosiahli vysoké výsledky, ale ani nie tak na vysokú úroveň, ako na plánované zvýšenie osobných výsledkov.

21 snímka

Popis snímky:

Test je meranie alebo test vykonávaný na určenie schopností alebo stavu osoby.

22 snímka

Popis snímky:

Ako skúšky možno použiť len tie skúšky (vzorky), ktoré spĺňajú špeciálne požiadavky: musí sa určiť účel aplikácie akejkoľvek skúšky (alebo skúšok); mala by sa vypracovať štandardizovaná skúšobná metóda merania a skúšobný postup; je potrebné určiť spoľahlivosť a informačný obsah testov; výsledky testov možno uviesť v príslušnom systéme klasifikácie

23 snímka

Popis snímky:

Test. Testovanie. Výsledok testu Systém používania testov v súlade s danou úlohou, organizovanie podmienok, vykonávanie testov subjektmi, vyhodnocovanie a analyzovanie výsledkov sa nazýva testovanie. Číselná hodnota získaná v priebehu meraní je výsledkom testovania (testu).

24 snímka

Popis snímky:

Testy používané v telesnej kultúre sú založené na pohybových činnostiach (fyzické cvičenia, motorické úlohy). Tieto testy sa nazývajú motorické alebo motorické testy.

25 snímka

Popis snímky:

Klasifikácia testov podľa ich štruktúry je známa a podľa ich prevládajúcich indikácií sa rozlišujú jednotlivé a komplexné testy. Jediný test sa používa na meranie a hodnotenie jedného znaku (koordinačná alebo kondičná schopnosť).

26 snímka

Popis snímky:

27 snímka

Popis snímky:

Pomocou komplexného testu sa posudzuje viacero charakteristík alebo komponentov rôznych alebo rovnakých schopností. napríklad výskok z miesta (so mávnutím paží, bez mávnutia pažami, do danej výšky).

28 snímka

Popis snímky:

29 snímka

Popis snímky:

TESTY môžu byť kondičné testy na posúdenie silovej schopnosti na posúdenie vytrvalosti; posúdiť rýchlostné schopnosti; na posúdenie flexibility, koordinačné testy na posúdenie koordinačných schopností súvisiacich so samostatnými samostatnými skupinami pohybových úkonov, ktorými sa merajú špeciálne koordinačné schopnosti; posúdiť špecifické koordinačné schopnosti - schopnosť rovnováhy, orientácia v priestore, odozva, diferenciácia pohybových parametrov, rytmus, reštrukturalizácia pohybových úkonov, koordinácia (komunikácia), vestibulárna stabilita, vôľová svalová relaxácia.

30 snímka

Popis snímky:

Každá klasifikácia je akýmsi návodom na výber (alebo vytvorenie) typu testov, ktoré sú relevantnejšie pre ciele testovania.

31 snímka

Popis snímky:

KRITÉRIÁ LÁSNOSTI MOTORICKÝCH SKÚŠOK Pojem „motorický test“ spĺňa svoj účel vtedy, keď test spĺňa príslušné základné kritériá: spoľahlivosť, stabilita, rovnocennosť, objektivita, informačný obsah (platnosť), ako aj ďalšie kritériá: štandardizácia, porovnateľnosť a hospodárnosť. Testy, ktoré spĺňajú požiadavky spoľahlivosti a informačného obsahu, sa nazývajú kvalitné, alebo autentické (spoľahlivé).

32 snímka

Popis snímky:

Spoľahlivosť testu sa chápe ako miera presnosti, s akou hodnotí určitú motorickú schopnosť bez ohľadu na požiadavky toho, kto ju hodnotí. Spoľahlivosť sa prejavuje v miere zhody výsledkov pri opätovnom testovaní tých istých ľudí v rovnakých podmienkach; je to stabilita alebo konzistentnosť výsledku testu jednotlivca, keď sa kontrolné cvičenie opakuje. Inými slovami, dieťa v skupine vyšetrovaných podľa výsledkov opakovaných testov (napr. skokové ukazovatele, čas behu, dosah hodu) si stabilne udržiava svoje miesto. Spoľahlivosť testu sa určuje pomocou korelačnej štatistickej analýzy výpočtom faktora spoľahlivosti. Zároveň sa používajú rôzne metódy, na základe ktorých sa posudzuje spoľahlivosť testu.

33 snímka

Popis snímky:

Stabilita testu je založená na vzťahu medzi prvým a druhým pokusom, opakovaným po určitom čase za rovnakých podmienok tým istým experimentátorom. Spôsob opätovného testovania na určenie spoľahlivosti sa nazýva opakovaný test. Stabilita testu závisí od typu testu, veku a pohlavia subjektov, časového intervalu medzi testom a opakovaným testom. Napríklad indexy kondičných testov alebo morfologických znakov v krátkych časových intervaloch sú stabilnejšie ako výsledky koordinačných testov; u starších detí sú výsledky stabilnejšie ako u mladších detí. Opakovaný test sa zvyčajne vykonáva najneskôr o týždeň neskôr. V dlhších intervaloch (napríklad po mesiaci) sa stabilita rovnomerných testov, ako je beh na 1000 metrov alebo skok do diaľky z miesta, výrazne znižuje.

34 snímka

Popis snímky:

Ekvivalencia testu Ekvivalencia testu je korelácia výsledku testu s výsledkami iných testov rovnakého typu. Napríklad, keď je potrebné zvoliť, ktorý test adekvátnejšie odráža rýchlostné schopnosti: beh na 30, 50, 60 alebo 100 metrov Postoj k ekvivalentným (homogénnym) testom závisí od mnohých dôvodov. Ak je potrebné zvýšiť spoľahlivosť odhadov alebo záverov štúdie, potom je vhodné použiť dva alebo viac ekvivalentných testov. A ak je cieľom vytvoriť batériu, ktorá obsahuje minimum testov, potom by sa mal použiť iba jeden z ekvivalentných testov. Takáto batéria, ako bolo uvedené, je heterogénna, pretože testy v nej zahrnuté merajú rôzne motorické schopnosti. Príklady heterogénnej batérie testov sú beh na 30 m, brada hore, predklon, beh na 1000 m.

35 snímka

Popis snímky:

Spoľahlivosť testov sa určuje aj porovnaním priemerného skóre párnych a nepárnych pokusov zahrnutých v teste. Napríklad priemerné hody na cieľ z 1, 3, 5, 7 a 9 pokusov sa porovnávajú s priemernými hodmi na cieľ z 2, 4, 6, 8 a 10 pokusov. Táto metóda hodnotenia spoľahlivosti sa nazýva metóda zdvojenia alebo štiepenia. Používa sa najmä pri hodnotení koordinačných schopností a v prípade, že počet pokusov tvoriacich výsledok testu nie je menší ako šesť.

36 snímka

Popis snímky:

Objektivita (konzistentnosť) testu Objektivita (konzistentnosť) testu je chápaná ako miera konzistentnosti výsledkov získaných na rovnakých predmetoch rôznymi experimentátormi (učiteľmi, sudcami, odborníkmi). Pre zvýšenie objektivity skúšania je potrebné dodržať štandardné podmienky skúšania: čas skúšania, miesto, poveternostné podmienky; jednotná materiálová a hardvérová podpora; psychofyziologické faktory (objem a intenzita záťaže, motivácia); prezentácia informácií (presná verbálna formulácia testového problému, vysvetlenie a demonštrácia). Ide o takzvanú objektivitu testu. Hovorí sa aj o interpretačnej objektivite, ktorá odkazuje na mieru nezávislosti interpretácie výsledkov testov rôznymi experimentátormi.

37 snímka

Popis snímky:

Vo všeobecnosti, ako poznamenávajú odborníci, spoľahlivosť testov možno zlepšiť rôznymi spôsobmi: prísnejšou štandardizáciou testovania, zvýšením počtu pokusov, lepšou motiváciou subjektov, zvýšením počtu hodnotiteľov (sudcov, znalcov), zvýšenie konzistentnosti ich názorov, zvýšenie počtu ekvivalentných testov. Neexistujú žiadne pevné hodnoty pre indikátory spoľahlivosti testu. Vo väčšine prípadov používajú nasledujúce odporúčania: 0,95 - 0,99 - vynikajúca spoľahlivosť; 0,90 - 0,94 - dobrý; 0,80 - 0,89 - prijateľné; 0,70 - 0,79 - zlé; 0,60 - 0,69 - pochybné pre individuálne hodnotenie, test je vhodný len na charakterizáciu skupiny subjektov.

38 snímka

Popis snímky:

Informatívnosť testu je miera, do akej meria hodnotenú motorickú schopnosť alebo zručnosť. V zahraničnej (i domácej) literatúre sa namiesto slova „informatívnosť“ používa výraz „validity“ (z angl. Validity-validity, validity, legality). V skutočnosti, keď hovoríme o informačnom obsahu, výskumník odpovedá na dve otázky: čo meria tento konkrétny test (batéria testov) a aký je stupeň presnosti merania. Existuje niekoľko typov platnosti: logická (zmysluplná), empirická (založená na experimentálnych údajoch) a prediktívna.

39 snímka

Popis snímky:

Dôležité dodatočné testovacie kritériá, ako už bolo uvedené, sú štandardizácia, porovnateľnosť a efektívnosť nákladov. Podstatou štandardizácie je, že na základe výsledkov testov je možné vytvárať normy, ktoré majú osobitný význam pre prax. Porovnateľnosť testu je schopnosť porovnávať výsledky získané z jednej alebo viacerých foriem paralelných (homogénnych) testov. Prakticky povedané, používanie porovnateľných motorických testov znižuje pravdepodobnosť, že v dôsledku pravidelného používania toho istého testu sa nehodnotí len a ani tak úroveň schopností, ale aj stupeň zručnosti. Simultánne porovnávané výsledky testov zvyšujú spoľahlivosť záverov. Podstatou hospodárnosti ako kritéria kvality testu je, že test nevyžaduje dlhý čas, veľké materiálne náklady a účasť mnohých asistentov.

40 snímka

Popis snímky:

ORGANIZÁCIA TESTOVANIA PRIPRAVENOSTI DETÍ ŠKOLSKÉHO VEKU Druhým dôležitým problémom testovania pohybových schopností (pripomeňme, že prvým je výber informatívnych testov, je organizácia ich aplikácie. testovanie Načasovanie testovania je v súlade so školským vzdelávacím programom, ktorý zabezpečuje na povinné dvojnásobné preskúšanie fyzickej zdatnosti žiakov.

41 snímka

Popis snímky:

Poznanie každoročných zmien vo vývoji pohybových schopností detí umožňuje učiteľovi vhodne upraviť proces telesnej kultúry na nasledujúci akademický rok. Učiteľ však musí a môže vykonávať častejšie testovanie, vykonávať takzvanú prevádzkovú kontrolu. Je to užitočné, ak chcete napríklad určiť zmeny v úrovni rýchlosti, sily a vytrvalosti ovplyvnené hodinami atletiky počas prvého štvrťroka. Na tento účel môže učiteľ aplikovať testy na posúdenie koordinačných schopností detí na začiatku a na konci osvojenia si učiva programu, napríklad v športových hrách, identifikovať zmeny v ukazovateľoch rozvoja týchto schopností. .

42 snímka

Popis snímky:

Treba mať na pamäti, že rôznorodosť pedagogických úloh, ktoré je potrebné riešiť, neumožňuje učiteľovi poskytnúť jednotnú metodiku testovania, rovnaké pravidlá na vykonávanie testov a hodnotenie výsledkov testov. To si vyžaduje, aby experimentátori (učitelia) preukázali samostatnosť pri riešení teoretických, metodických a organizačných otázok testovania. Testovanie v lekcii musí byť prepojené s jej obsahom. Inými slovami, aplikovaný test alebo testy, podliehajúce zodpovedajúcim požiadavkám (ako výskumná metóda), by mali byť organicky zahrnuté do plánovaného fyzického cvičenia. Ak napríklad deti potrebujú určiť úroveň rozvoja rýchlostných schopností alebo vytrvalosti, potom by sa potrebné testy mali naplánovať v tej časti hodiny, v ktorej sa budú riešiť úlohy rozvoja zodpovedajúcich fyzických schopností.

43 snímka

Popis snímky:

Frekvencia testovania je do značnej miery určená rýchlosťou rozvoja špecifických fyzických schopností, vekom a pohlavím a individuálnymi charakteristikami ich vývoja. Napríklad na dosiahnutie výrazného nárastu rýchlosti, vytrvalosti či sily je potrebných niekoľko mesiacov pravidelného cvičenia (tréningu). Zároveň na získanie spoľahlivého zvýšenia flexibility alebo individuálnych koordinačných schopností je potrebných iba 4-12 tréningov. Zlepšenie fyzickej kvality je možné dosiahnuť, ak začnete od nuly v kratšom čase. A na zlepšenie rovnakej kvality, keď ide o dieťa na vysokej úrovni, je potrebné viac času. V tomto ohľade by mal učiteľ hlbšie študovať rysy rozvoja a zlepšovania rôznych motorických schopností u detí v rôznych vekových a pohlavných obdobiach.

44 snímka

Popis snímky:

Pri hodnotení všeobecnej fyzickej zdatnosti detí možno použiť širokú škálu testovacích batérií, ktorých výber závisí od konkrétnych testovacích úloh a dostupnosti potrebných podmienok. Vzhľadom na to, že získané výsledky testov je možné hodnotiť len porovnávaním, je však vhodné voliť testy, ktoré majú široké zastúpenie v teórii a praxi telesnej výchovy detí. Spoľahnite sa napríklad na tie odporúčané v programe FC. Na porovnanie všeobecnej úrovne fyzickej zdatnosti študenta alebo skupiny študentov pomocou súboru testov sa uchyľujú k prevodu výsledkov testov na body alebo body. Zmena súčtu bodov pri opakovaných testoch umožňuje posúdiť pokroky jednotlivého dieťaťa aj skupiny detí.

49 snímka

Popis snímky:

Dôležitým aspektom testovania je problém výberu testu na posúdenie konkrétnej fyzickej schopnosti a všeobecnej fyzickej zdatnosti.

50 snímka

Popis snímky:

Praktické rady a rady. DÔLEŽITÉ: Určite (vyberte) batériu (alebo súbor) potrebných testov s podrobným uvedením všetkých podrobností o ich správaní; Nastavte čas testovania (lepšie - 2-3 týždne v septembri - 1. testovanie, 2-3 týždne v máji - 2. testovanie); V súlade s odporúčaním presne určiť vek detí v deň testovania a ich pohlavie; Vypracovať jednotné protokoly na registráciu údajov (možno založené na využívaní IKT); Určite okruh asistentov a vykonajte samotný testovací postup; Okamžite vykonajte matematické spracovanie testovacích údajov - vypočítajte hlavné štatistické parametre (aritmetický priemer, aritmetická stredná chyba, smerodajná odchýlka, variačný koeficient a posúdenie spoľahlivosti rozdielov medzi ukazovateľmi aritmetického priemeru, napríklad paralelné triedy rovnakých a rôznych školy detí rovnakého veku a pohlavia); Jednou z významných etáp práce môže byť prevod výsledkov testov na body alebo body. Pri pravidelnom testovaní (2-krát ročne, počas niekoľkých rokov) to umožní učiteľovi mať predstavu o pokroku vo výsledkoch.

51 snímok

Popis snímky:

Moskva "Osvietenie" 2007 Kniha obsahuje najbežnejšie motorické testy na posúdenie kondičných a koordinačných schopností žiakov. Príručka poskytuje individuálny prístup učiteľa telesnej výchovy ku každému konkrétnemu žiakovi s prihliadnutím na jeho vek a telesnú zdatnosť.

Základné pojmy z teórie testov.

Meranie alebo test vykonávaný na zistenie stavu alebo schopností športovca sa nazýva test. Každý test zahŕňa meranie. Nie každá zmena je však skúškou. Postup merania alebo testovania sa nazýva testovanie.

Test založený na motorických úlohách sa nazýva motorický test. Existujú tri skupiny pohybových testov:

  • 1. Kontrolné cvičenia, pri ktorých má športovec za úlohu ukázať maximálny výsledok.
  • 2. Štandardné funkčné testy, pri ktorých sa úloha, ktorá je pre všetkých rovnaká, dávkuje buď množstvom vykonanej práce, alebo množstvom fyziologických posunov.
  • 3. Maximálne funkčné testy, pri ktorých musí športovec ukázať maximálny výsledok.

Vysokokvalitné testovanie vyžaduje znalosť teórie merania.

Základné pojmy teórie merania.

Meranie je identifikácia zhody medzi skúmaným javom na jednej strane a číslami na strane druhej.

Základom teórie merania sú tri pojmy: meracie váhy, meracie jednotky a presnosť merania.

Meracie váhy.

Mierka merania je zákon, podľa ktorého sa meranému výsledku pri jeho zvyšovaní alebo znižovaní priraďuje číselná hodnota. Uvažujme o niektorých mierkach používaných v športe.

Stupnica mien (nominálna stupnica).

Toto je najjednoduchšie zo všetkých mierok. Čísla v ňom fungujú ako štítky a slúžia na detekciu a rozlíšenie skúmaných objektov (napríklad číslovanie hráčov futbalového tímu). Čísla, ktoré tvoria mennú škálu, sa môžu meniť pomocou metas. V tejto škále nie sú žiadne viac-menej vzťahy, takže niektorí ľudia si myslia, že škála pomenovaní by sa nemala považovať za mieru. Pri použití menovacej stupnice je možné vykonávať len niektoré matematické operácie. Jeho čísla sa napríklad nedajú sčítať ani odčítať, ale môžete spočítať, koľkokrát (ako často) sa konkrétne číslo vyskytne.

Objednávková stupnica.

Sú športy, kde o výsledku športovca rozhoduje iba miesto v súťaži (napríklad bojové umenia). Po takýchto súťažiach je jasné, ktorý zo športovcov je silnejší a ktorý slabší. Ale o koľko silnejší alebo slabší, to sa nedá povedať. Ak sa traja športovci umiestnili na prvom, druhom a treťom mieste, potom nie je jasné, aké sú rozdiely v ich športovom správaní: druhý športovec môže byť takmer rovnaký ako prvý, alebo môže byť slabší ako on a byť takmer rovnaký ako tretí . Miesta obsadené na stupnici poradia sa nazývajú hodnosti a samotná škála sa nazýva hodnosť alebo nemetrická. V takejto škále sú čísla jej zložiek zoradené podľa hodností (t. j. obsadených miest), ale intervaly medzi nimi nemožno presne zmerať. Na rozdiel od mennej stupnice umožňuje stupnica poradia nielen zistiť skutočnosť rovnosti alebo nerovnosti meraných objektov, ale aj určiť povahu nerovnosti vo forme úsudkov: "viac - menej", "lepšie". - horšie" atď.

Pomocou objednávkových škál môžete merať kvalitatívne ukazovatele, ktoré nemajú striktnú kvantitatívnu mieru. Tieto stupnice sa používajú najmä v humanitných vedách: pedagogika, psychológia, sociológia.

Viac matematických operácií môže byť aplikovaných na stupne rádovej stupnice ako na čísla na stupnici nominálnych hodnôt.

Intervalová stupnica.

Je to stupnica, v ktorej sú čísla nielen zoradené podľa poradia, ale aj oddelené konkrétnymi intervalmi. Znakom, ktorý ho odlišuje od stupnice vzťahov opísanej nižšie, je, že nulový bod je zvolený ľubovoľne. Príklady zahŕňajú kalendárny čas (začiatok chronológie v rôznych kalendároch bol stanovený z náhodných dôvodov), kĺbový uhol (uhol v lakťovom kĺbe s úplným natiahnutím predlaktia môže byť buď nulový alebo 180 °), teplota, potenciálna energia zdvíhaného bremena, potenciál elektrického poľa atď. dr.

Výsledky meraní na intervalovej stupnici je možné spracovať všetkými matematickými metódami okrem výpočtu pomerov. Tieto intervalové škály dávajú odpoveď na otázku: „o koľko viac“, ale neumožňujú tvrdiť, že jedna hodnota nameranej hodnoty je toľkokrát väčšia alebo menšia ako iná. Napríklad, ak sa teplota zvýšila z 10 na 20 C, potom nemožno povedať, že sa oteplila dvakrát.

Vzťahová škála.

Táto stupnica sa líši od intervalovej stupnice len tým, že striktne definuje polohu nulového bodu. Vďaka tomu škála pomerov nekladie žiadne obmedzenia na matematický aparát používaný na spracovanie výsledkov pozorovaní.

V športe miera vzťahu meria vzdialenosť, silu, rýchlosť a desiatky ďalších premenných. Stupnica vzťahov tiež meria tie hodnoty, ktoré sa tvoria ako rozdiel medzi číslami počítanými na stupnici intervalov. Kalendárny čas sa teda počíta na stupnici intervalov a časové intervaly - na stupnici vzťahov. Pri použití mierky pomerov (a iba v tomto prípade!) sa meranie akejkoľvek veličiny redukuje na experimentálne určenie pomeru tejto veličiny k inej podobnej veličine, branej ako jednotka. Meraním dĺžky skoku zistíme, koľkokrát je táto dĺžka väčšia ako dĺžka iného telesa, brané ako jednotka dĺžky (v konkrétnom prípade metrové pravítko); vážením činky určíme pomer jej hmotnosti k hmotnosti iného telesa – jednotková hmotnosť „kilogram“ atď. Ak sa obmedzíme len na používanie škál vzťahov, môžeme uviesť inú (užšiu, konkrétnu) definíciu merania: merať akúkoľvek veličinu znamená empiricky nájsť jej vzťah k zodpovedajúcej jednotke merania.

Jednotky merania.

Aby sa výsledky rôznych meraní mohli navzájom porovnávať, musia byť vyjadrené v rovnakých jednotkách. V roku 1960 bola na Medzinárodnej generálnej konferencii pre váhy a miery prijatá Medzinárodná sústava jednotiek, ktorá bola skrátená ako SI (zo začiatočných písmen slov System International). V súčasnosti je preferovaná aplikácia tohto systému ustálená vo všetkých oblastiach vedy a techniky, v národnom hospodárstve, ako aj vo výučbe.

SI v súčasnosti zahŕňa sedem nezávislých základných jednotiek (pozri tabuľku 2.1.)

Tabuľka 1.1.

Od týchto základných jednotiek sa odvodzujú jednotky iných fyzikálnych veličín ako deriváty. Odvodené jednotky sú určené na základe vzorcov spájajúcich fyzikálne veličiny. Napríklad jednotka dĺžky (meter) a jednotka času (sekunda) sú základné jednotky a jednotka rýchlosti (meter za sekundu) je derivácia.

Okrem hlavných sú v SI zvýraznené dve ďalšie jednotky: radián - jednotka plochého uhla a steradián - jednotka priestorového uhla (uhol v priestore).

Presnosť meraní.

Žiadne meranie nie je možné vykonať s absolútnou presnosťou. Výsledok merania nevyhnutne obsahuje chybu, ktorej veľkosť je tým menšia, čím presnejšia je metóda merania a meracie zariadenie. Napríklad pomocou bežného pravítka s milimetrovými dielikmi nemôžete zmerať dĺžku s presnosťou 0,01 mm.

Základná a dodatočná chyba.

Základná chyba je chyba meracej metódy alebo meracieho prístroja, ktorá sa vyskytuje za normálnych podmienok používania.

Dodatočná chyba je chyba meracieho zariadenia spôsobená odchýlkou ​​jeho prevádzkových podmienok od normálu. Je zrejmé, že zariadenia určené na prevádzku pri izbovej teplote poskytnú nepresné údaje, ak sa používajú v lete na štadióne pod horiacim slnkom alebo v zime v chlade. Chyby merania sa môžu vyskytnúť, keď je napätie napájacej siete alebo batérie pod normálnou hodnotou alebo nie je konštantné.

Absolútne a relatívne chyby.

Hodnota E = A - Ao, ktorá sa rovná rozdielu medzi údajom meracieho zariadenia (A) a skutočnou hodnotou meranej veličiny (Ao), sa nazýva absolútna chyba merania. Meria sa v rovnakých jednotkách ako samotná nameraná hodnota.

V praxi je často vhodné použiť nie absolútnu, ale relatívnu chybu. Relatívna chyba merania je dvoch typov – skutočná a redukovaná. Skutočná relatívna chyba je pomer absolútnej chyby k skutočnej hodnote meranej veličiny:

A D = --------- * 100 %

Znížená relatívna chyba je pomer absolútnej chyby k maximálnej možnej hodnote meranej veličiny:

Ap = ---------- * 100 %

Systematické a náhodné chyby.

Systematická je chyba, ktorej hodnota sa od merania k meraniu nemení. Vďaka tejto zvláštnosti je možné systematickú chybu často vopred predvídať alebo v extrémnych prípadoch odhaliť a odstrániť na konci procesu merania.

Spôsob odstránenia systematickej chyby závisí predovšetkým od jej povahy. Systematické chyby merania možno rozdeliť do troch skupín:

chyby známeho pôvodu a známej hodnoty;

chyby známeho pôvodu, ale neznámeho rozsahu;

chyby neznámeho pôvodu a neznámej hodnoty. Najneškodnejšie sú chyby prvej skupiny. Ľahko sa eliminujú

zavedením vhodných korekcií do výsledku merania.

Do druhej skupiny patria v prvom rade chyby spojené s nedokonalosťou metódy merania a meracieho zariadenia. Napríklad chyba pri meraní fyzického výkonu pomocou masky na vdychovanie vydychovaného vzduchu: maska ​​sťažuje dýchanie a športovec prirodzene predvádza fyzický výkon, ktorý je v porovnaní so skutočným nameraným bez masky podhodnotený. Veľkosť tejto chyby sa nedá vopred predpovedať: závisí od individuálnych schopností športovca a jeho zdravotného stavu v čase štúdie.

Ďalším príkladom systematickej chyby tejto skupiny je chyba spojená s nedokonalosťou zariadenia, kedy meracie zariadenie úmyselne nadhodnotí alebo podhodnotí skutočnú hodnotu nameranej hodnoty, no veľkosť chyby nie je známa.

Chyby tretej skupiny sú najnebezpečnejšie, ich vzhľad je spojený tak s nedokonalosťou metódy merania, ako aj s charakteristikami objektu merania - športovca.

Náhodné chyby vznikajú pod vplyvom rôznych faktorov, ktoré sa nedajú vopred predvídať ani presne zohľadniť. V zásade nie sú náhodné chyby odstrániteľné. Pomocou metód matematickej štatistiky je však možné odhadnúť veľkosť náhodnej chyby a zohľadniť ju pri interpretácii výsledkov merania. Výsledky meraní nemožno považovať za spoľahlivé bez štatistického spracovania.

Čo je testovanie

V súlade s IEEE Std 829-1983 Testovanie je proces analýzy softvéru zameraný na identifikáciu rozdielov medzi jeho skutočne existujúcimi a požadovanými vlastnosťami (chyba) a na vyhodnotenie vlastností softvéru.

Podľa GOST R ISO IEC 12207-99 sa v životnom cykle softvéru okrem iného identifikujú pomocné procesy overovania, certifikácie, spoločnej analýzy a auditu. Proces overovania je proces určenia, že softvérové ​​produkty fungujú v úplnom súlade s požiadavkami alebo podmienkami implementovanými v predchádzajúcej práci. Tento proces môže zahŕňať analýzu, overovanie a testovanie (testovanie). Atestačný proces je proces zisťovania úplnosti súladu stanovených požiadaviek, vytvoreného systému alebo softvérového produktu s ich funkčným účelom. Proces kolaboratívneho hodnotenia je proces hodnotenia stavov a v prípade potreby aj výsledkov práce (produktov) na projekte. Proces auditu je proces zisťovania súladu s požiadavkami, plánmi a podmienkami zmluvy. Tieto procesy sa pridávajú k tomu, čo sa bežne nazýva testovanie.

Testovanie je založené na testovacích postupoch so špecifickými vstupmi, počiatočnými podmienkami a očakávanými výsledkami navrhnutými na konkrétny účel, ako je testovanie jedného programu alebo overenie zhody so špecifickou požiadavkou. Testovacie postupy môžu testovať rôzne aspekty výkonu programu, od správneho fungovania jednej funkcie až po adekvátne splnenie obchodných požiadaviek.

Pri realizácii projektu je potrebné zvážiť, podľa akých noriem a požiadaviek bude produkt testovaný. Aké nástroje budú (ak nejaké) použité na nájdenie a zdokumentovanie nájdených chýb. Ak si pamätáte na testovanie od samého začiatku projektu, testovanie vyvíjaného produktu neprinesie žiadne nepríjemné prekvapenia. To znamená, že kvalita produktu bude pravdepodobne dosť vysoká.

Životný cyklus produktu a testovanie

V našej dobe sa čoraz častejšie používajú iteratívne procesy vývoja softvéru, najmä technológie RUP - Rational Unified Process(obr. 1). Pri použití tohto prístupu prestáva byť testovanie hotovým procesom, ktorý sa spustí po tom, čo programátori napíšu všetok potrebný kód. Práca na testoch začína od úplnej počiatočnej fázy identifikácie požiadaviek na budúci produkt a je úzko integrovaná so súčasnými úlohami. A to kladie na testerov nové nároky. Ich úloha sa neobmedzuje len na jednoduchšiu identifikáciu chýb čo najúplnejšie a čo najskôr. Mali by sa podieľať na celkovom procese identifikácie a eliminácie najvýznamnejších rizík projektu. Na tento účel sa pre každú iteráciu určí cieľ testu a metódy na jeho dosiahnutie. A na konci každej iterácie sa určí, do akej miery bol tento cieľ dosiahnutý, či sú potrebné ďalšie testy a či je potrebné zmeniť princípy a nástroje na vykonávanie testov. Každá zistená chyba si zasa musí prejsť vlastným životným cyklom.

Ryža. 1. Životný cyklus produktu podľa RUP

Testovanie sa zvyčajne vykonáva v cykloch, pričom každý má špecifický zoznam úloh a cieľov. Testovací cyklus sa môže zhodovať s opakovaním alebo môže zodpovedať jeho špecifickej časti. Testovací cyklus sa zvyčajne vykonáva pre konkrétnu zostavu systému.

Životný cyklus softvérového produktu pozostáva zo série relatívne krátkych iterácií (obr. 2). Iterácia je úplný vývojový cyklus vedúci k vydaniu konečného produktu alebo nejakej jeho zmenšenej verzie, ktorá sa rozširuje z iterácie na iteráciu, aby sa nakoniec stala kompletným systémom.

Každá iterácia obsahuje spravidla úlohy plánovania práce, analýzy, návrhu, implementácie, testovania a hodnotenia dosiahnutých výsledkov. Vzťah medzi týmito úlohami sa však môže výrazne líšiť. V súlade s pomerom rôznych úloh v iterácii sú zoskupené do fáz. Prvá fáza - Inception - sa zameriava na analytické úlohy. Iterácie druhej fázy – Vývoj – sa zameriavajú na návrh a testovanie kľúčových konštrukčných riešení. Tretia fáza – Build – má najväčší podiel na vývojových a testovacích úlohách. A v poslednej fáze - Transfer - sa v najväčšej miere riešia úlohy testovania a prenosu systému na Zákazníka.

Ryža. 2. Iterácie životného cyklu softvérového produktu

Každá fáza má svoje špecifické ciele v životnom cykle produktu a považuje sa za ukončenú, keď sa tieto ciele dosiahnu. Všetky iterácie, možno okrem iterácií fázy Štart, sú ukončené vytvorením funkčnej verzie vyvíjaného systému.

Testovacie kategórie

Testy sa výrazne líšia v úlohách, ktoré sa s ich pomocou riešia, a v použitej technike.

Testovacie kategórie Popis kategórie Typy testovania
Aktuálne testovanie Bola pridaná sada testov vykonaných na určenie stavu nových funkcií systému.
  • Záťažové testovanie;
  • testovanie obchodného cyklu;
  • stresové testovanie.
Regresné testovanie Účelom regresného testovania je overiť, či doplnky systému neznížili jeho schopnosti, t.j. testovanie prebieha podľa požiadaviek, ktoré boli splnené už pred pridaním nových funkcií.
  • Záťažové testovanie;
  • testovanie obchodného cyklu;
  • stresové testovanie.

Testovanie podkategórií

Testovanie podkategórií Popis typu testovania Testovanie podtypov
Záťažové testovanie Slúži na testovanie všetkých funkcií aplikácie bez výnimky. V tomto prípade nezáleží na postupnosti testovacích funkcií.
  • funkčné testovanie;
  • testovanie rozhrania;
  • testovanie databázy
Testovanie obchodného cyklu Používa sa na testovanie funkcií aplikácie v poradí, v akom ich používateľ volá. Napríklad napodobňovanie všetkých úkonov účtovníka za 1 štvrťrok.
  • testovanie jednotiek (testovanie jednotiek);
  • funkčné testovanie;
  • testovanie rozhrania;
  • testovanie databázy.
Záťažové testovanie

Používa sa na testovanie

Výkon aplikácie. Účelom tohto testovania je určiť rámec pre stabilnú prevádzku aplikácie. Počas tohto testovania sa volajú všetky dostupné funkcie.

  • testovanie jednotiek (testovanie jednotiek);
  • funkčné testovanie;
  • testovanie rozhrania;
  • testovanie databázy.

Typy testovania

Jednotkové testovanie (unit testing) – tento typ zahŕňa testovanie jednotlivých aplikačných modulov. Aby sa dosiahol maximálny výsledok, testovanie sa vykonáva súčasne s vývojom modulov.

Funkčné testovanie - Účelom tohto testovania je zabezpečiť, aby testovaný predmet správne fungoval. Testuje sa správnosť navigácie cez objekt, ako aj vstup, spracovanie a výstup údajov.

Testovanie databázy - kontrola prevádzkyschopnosti databázy pri bežnej prevádzke aplikácie, v momentoch preťaženia a vo viacužívateľskom režime.

Jednotkové testovanie

Pre OOP je zvyčajnou organizáciou testovania jednotiek testovanie metód každej triedy, potom triedy každého balíka atď. Postupne prechádzame k testovaniu celého projektu a predchádzajúce testy sú regresné.

Výstupná dokumentácia týchto testov zahŕňa testovacie procedúry, vstupné dáta, kód, ktorý test vykoná, a výstupné dáta. Nasleduje pohľad na výstupnú dokumentáciu.

Funkčné testovanie

Funkčné testovanie testovaného objektu sa plánuje a vykonáva na základe testovacích požiadaviek špecifikovaných v štádiu definovania požiadaviek. Požiadavkami sú obchodné pravidlá, diagramy prípadov použitia, obchodné funkcie a, ak sú k dispozícii, diagramy aktivít. Účelom funkčných testov je overiť, či vyvinuté grafické komponenty spĺňajú stanovené požiadavky.

Tento typ testovania nie je možné plne automatizovať. Preto sa delí na:

  • Automatizované testovanie (používa sa v prípade, keď je možné overiť výstup).

Účel: otestovať vstup, spracovanie a výstup údajov;

  • Manuálne testovanie (v iných prípadoch).

Účel: Testuje sa správnosť plnenia požiadaviek užívateľa.

Na potvrdenie správneho fungovania je potrebné vykonať (prehrať) každý z prípadov použitia s použitím správnych aj zámerne chybných hodnôt podľa nasledujúcich kritérií:

  • produkt adekvátne reaguje na všetky vstupné údaje (očakávané výsledky sa zobrazujú ako odpoveď na správne zadané údaje);
  • produkt adekvátne reaguje na nesprávne zadané údaje (zobrazia sa zodpovedajúce chybové hlásenia).

Testovanie databázy

Účelom tohto testovania je uistiť sa, že metódy prístupu k databáze sú spoľahlivé, správne spustené, bez ohrozenia integrity údajov.

Mali by ste dôsledne používať čo najviac databázových volaní. Používa sa prístup, v ktorom je test zostavený tak, aby základ "zaťažil" sekvenciou správnych a zámerne chybných hodnôt. Zisťuje sa odozva databázy na vstup údajov a odhadujú sa časové intervaly ich spracovania.

Meranie alebo test vykonaný na zistenie stavu alebo schopností športovca sa nazýva cesto... Ako testy sa nedajú použiť všetky merania, ale len tie, ktoré spĺňajú špeciálne požiadavky: štandard, dostupnosť systému hodnotenia, spoľahlivosť, obsah informácií, objektivita. Testy, ktoré spĺňajú požiadavky spoľahlivosti, informačného obsahu a objektivity sa nazývajú pevný.

Proces testovania je tzv testovanie a číselné hodnoty získané ako výsledok merania sú výsledok testu.

Testy založené na motorických úlohách sú tzv motor alebo motor... V závislosti od úlohy, ktorej subjekt čelí, sa rozlišujú tri skupiny motorických testov.

Odrody motorických testov

Názov testu

Pridelenie športovcovi

Výsledok testu

Kontrolné cvičenie

Motorické úspechy

1500 m beh, čas behu

Funkčné štandardné testy

Pre všetkých rovnako, dávkované: 1) podľa množstva vykonanej práce; 2) podľa veľkosti fyziologických posunov

Fyziologické alebo biochemické ukazovatele pri štandardnej práci Motorické ukazovatele pri štandardnej veľkosti fyziologických posunov

Zaznamenávanie tepovej frekvencie pri štandardnej práci 1000 kgm/min Rýchlosť behu pri tepovej frekvencii 160 tepov/min

Maximálne funkčné testy

Zobraziť maximálny výsledok

Fyziologické alebo biochemické parametre

Stanovenie maximálneho kyslíkového dlhu alebo maximálnej spotreby kyslíka

Niekedy sa nepoužíva jeden, ale niekoľko testov s jediným konečným cieľom. Táto skupina testov sa nazýva batéria testov.

Je známe, že aj pri najprísnejšej štandardizácii a presnom vybavení sa výsledky testov vždy trochu líšia. Preto je jednou z dôležitých podmienok výberu dobrých testov ich spoľahlivosť.

Spoľahlivosť testu je miera zhody výsledkov, keď sa znova testujú tí istí ľudia za rovnakých podmienok. Existujú štyri hlavné dôvody pre rozdiely vo výsledkoch testov medzi jednotlivcami alebo v rámci skupiny:

    zmeny v stave subjektov (únava, zmena motivácie atď.); nekontrolované zmeny vonkajších podmienok a zariadení;

    zmena stavu osoby, ktorá test vykonáva alebo vyhodnocuje (pohoda, výmena experimentátora atď.);

    nedokonalosť testu (napríklad zámerne nedokonalé a nespoľahlivé testy – trestné hody do basketbalového koša pred prvou miss a pod.).

Kritériom spoľahlivosti testu môže byť faktor spoľahlivosti, vypočítané ako pomer skutočného rozptylu k rozptylu zaznamenanému v experimente: r = pravdivé s 2 / zaznamenané s 2, kde skutočnou hodnotou sa rozumie rozptyl získaný s nekonečným počtom pozorovaní za rovnakých podmienok; zaznamenaný rozptyl je odvodený z experimentálnych štúdií. Inými slovami, koeficient spoľahlivosti je jednoducho zlomkom skutočnej variácie vo variácii zaznamenanej v skúsenostiach.

Okrem tohto koeficientu využívajú aj index spoľahlivosti, ktorý sa považuje za teoretický koeficient korelácie alebo vzťahu medzi zaznamenanými a skutočnými hodnotami toho istého testu. Táto metóda je najbežnejšia ako kritérium hodnotenia kvality (spoľahlivosti) testu.

Jednou z charakteristík spoľahlivosti testu je jeho rovnocennosť, ktorý odráža mieru zhody výsledkov testov rovnakej kvality (napríklad fyzikálnych) rôznymi testami. Postoj k rovnocennosti testu závisí od konkrétnej úlohy. Na jednej strane, ak sú dva alebo viac testov ekvivalentné, ich kombinované použitie zvyšuje spoľahlivosť odhadov; na druhej strane sa zdá byť možné použiť iba jeden ekvivalentný test, ktorý zjednoduší testovanie.

Ak sú všetky testy v ktorejkoľvek testovacej batérii vysoko ekvivalentné, sú tzv homogénne(napr. na posúdenie kvality skákania treba predpokladať, že skok do diaľky, nahor, trojskoky budú homogénne). Naopak, ak v komplexe nie sú rovnocenné testy (napríklad na posúdenie všeobecnej fyzickej zdatnosti), tak všetky testy v ňom zahrnuté merajú rôzne vlastnosti, t.j. v podstate komplex je heterogénne.

Spoľahlivosť testov možno do určitej miery zlepšiť:

    prísnejšia štandardizácia testovania;

    zvýšenie počtu pokusov;

    zvýšenie počtu hodnotiteľov a zlepšenie konzistentnosti ich názorov;

    zvýšenie počtu ekvivalentných testov;

    lepšia motivácia subjektov.

Objektivita testu existuje špeciálny prípad spoľahlivosti, t.j. nezávislosť výsledkov testu od osoby, ktorá test vykonáva.

Informatívnosť testu Je miera presnosti, s akou meria vlastnosť (kvalitu športovca), pre ktorú sa používa. V rôznych prípadoch môžu mať rovnaké testy rôzny informačný obsah. Otázka informatívnosti testu sa delí na dve konkrétne otázky:

Čo tento test mení? Ako presne sa meria?

Je napríklad možné posúdiť pripravenosť bežcov na vzdialenosť podľa takého ukazovateľa, akým je IPC, a ak áno, s akou presnosťou? Môže sa tento test použiť v procese monitorovania?

Ak sa test používa na zistenie stavu športovca v čase vyšetrenia, potom hovoria o diagnostické informatívnosť testu. Ak chcú na základe výsledkov testov urobiť záver o možnej budúcej výkonnosti športovca, hovoria o prediktívne informatívnosť. Test môže byť diagnosticky informatívny, ale nie prognostický a naopak.

Stupeň informačného obsahu je možné charakterizovať kvantitatívne – na základe experimentálnych údajov (tzv empirický informatívnosť) a kvalitatívne – na základe zmysluplnej analýzy situácie ( logické informatívnosť). Aj keď v praktickej práci by logická alebo zmysluplná analýza mala vždy predchádzať tej matematickej. Ukazovateľom informatívnosti testu je korelačný koeficient vypočítaný pre závislosť kritéria od výsledku v teste a naopak (ukazovateľ je braný ako kritérium, zrejme odrážajúce vlastnosť, ktorá sa bude merať pomocou test).

V prípade nedostatočného informačného obsahu akéhokoľvek testu sa uchyľujú k použitiu batérie testov. Posledne menované však ani pri vysokých samostatných kritériách pre obsah informácií (súdiac podľa korelačných koeficientov) neumožňuje získať jediné číslo. Tu môže prísť na pomoc zložitejšia metóda matematickej štatistiky - faktorová analýza.Čo vám umožňuje určiť, koľko a ktoré testy spolupracujú na konkrétnom faktore a aký je stupeň ich príspevku ku každému faktoru. A potom je už jednoduché vybrať testy (alebo ich kombinácie), ktoré najpresnejšie posúdia jednotlivé faktory.

1 Čo sa nazýva test?

2 Čo je testovanie?

Kvantifikácia kvality alebo stavu športovca Meranie alebo test na určenie stavu alebo schopností športovca Proces testovania, ktorý kvantifikuje kvalitu alebo stav športovca Nevyžaduje sa žiadna definícia

3 Čo sa nazýva výsledok testu?

Kvantifikácia kvality alebo stavu športovca Meranie alebo test na určenie stavu alebo schopností športovca Proces testovania, ktorý kvantifikuje kvalitu alebo stav športovca Nevyžaduje sa žiadna definícia

4 Aký druh testov robí beh na 100 metrov?

5 Aký ​​druh testov robí ručná dynamometria?

Kontrolné cvičenie Funkčný test Maximálny funkčný test

6 Do akého druhu testov vzorka patrí? IPC?

Kontrolné cvičenie Funkčný test Maximálny funkčný test

7 Aký druh testov robí trojminútový beh pod metronómom?

Kontrolné cvičenie Funkčný test Maximálny funkčný test

8 Aký druh testov robí maximálny počet ťahov na hrazde?

Kontrolné cvičenie Funkčný test Maximálny funkčný test

9 V akom prípade sa test považuje za informatívny?

10 Kedy sa test považuje za spoľahlivý?

Schopnosť testu reprodukovať výsledky pri opätovnom testovaní Schopnosť testu merať kvalitu záujmového športovca Nezávislosť výsledkov testu od osoby, ktorá test vykonáva

11 Kedy sa test považuje za objektívny?

Schopnosť testu reprodukovať výsledky pri opätovnom testovaní Schopnosť testu merať kvalitu záujmového športovca Nezávislosť výsledkov testu od osoby, ktorá test vykonáva

12 Aké kritérium je potrebné pri hodnotení testu obsahu informácií?

13 Aké kritérium je potrebné pri hodnotení testu spoľahlivosti?

Študentov t-test F-Fisherov test Korelačný koeficient Koeficient determinácie Rozptyl

14 Aké kritérium je potrebné pri hodnotení objektívnosti testu?

Študentov t-test F-Fisherov test Korelačný koeficient Koeficient determinácie Rozptyl

15 Ako sa nazýva informatívnosť testu, ak slúži na posúdenie stupňa trénovanosti športovca?

16 Akou informatívnosťou kontrolných cvičení sa riadi tréner pri výbere detí do svojho športového oddielu?

Logická prediktívna empirická diagnostika

17 Je korelačná analýza potrebná na posúdenie informatívnosti testov?

18 Je faktorová analýza potrebná na posúdenie informatívnosti testov?

19 Je možné vyhodnotiť spoľahlivosť testu pomocou korelačnej analýzy?

20 Je možné vyhodnotiť objektívnosť testu pomocou korelačnej analýzy?

21 Budú testy určené na hodnotenie všeobecnej fyzickej zdatnosti rovnocenné?

22 Pri meraní rovnakej kvality rôznymi testami sa používajú testy ...

Navrhnuté na meranie rovnakej kvality Mať medzi sebou vysokú koreláciu Mať medzi sebou nízku koreláciu

ZÁKLADY TEÓRIE HODNOTENIA

Na posúdenie športového výkonu sa často používajú špeciálne bodovacie tabuľky. Účelom takýchto tabuliek je previesť zobrazený športový výsledok (vyjadrený v objektívnych mierach) na podmienené body. Zákon prepočtu športových výsledkov na body je tzv hodnotiacej stupnici... Mierka môže byť špecifikovaná ako matematický výraz, tabuľka alebo graf. V športe a telesnej výchove sa používajú 4 hlavné typy váh.

Proporcionálne stupnice

Regresné škály

Progresívne stupnice.

Proporcionálne stupnice znamená získanie rovnakého počtu bodov za rovnaký nárast výsledkov (napríklad za každú 0,1 s zlepšenie výsledku v pretekoch na 100 m sa udeľuje 20 bodov). Takéto stupnice sa používajú v modernom päťboji, rýchlokorčuľovaní, lyžovaní, severskej kombinácii, biatlone a iných športoch.

Regresné škály znamená, že pri rovnakom zvýšení výsledku, ako pribúdajú športové výkony, sa pripočítava stále menší počet bodov (napríklad za zlepšenie výsledku v behu na 100 m z 15, 0 na 14,9 s sa pripočítava 20 bodov a za 0,1 s v rozsahu 10,0-9,9 s - iba 15 bodov).

Progresívne stupnice. Tu platí, že čím vyšší je športový výsledok, tým väčší bodový nárast sa odhaduje na jeho zlepšenie (napr. 10 bodov sa pripočítava za zlepšenie bežeckého času z 15,0 na 14,9 s a 100 bodov z 10,0 na 9,9 s). Progresívne váhy sa používajú v plávaní, niektorých druhoch atletiky a vzpieraní.

Sigmoidné váhy sa v športe používajú len zriedka, ale vo veľkej miere sa používajú pri hodnotení fyzickej zdatnosti (takto napríklad vyzerá stupnica štandardov fyzickej zdatnosti populácie USA). Na týchto mierkach sa mierne podporuje zlepšenie výkonu v zónach veľmi nízkeho a veľmi vysokého výkonu; najviac bodov sa získa zvýšením výsledkov v strednej zóne úspechu.

Hlavnými cieľmi hodnotenia sú:

    porovnávať rôzne úspechy v rovnakej úlohe;

    porovnávať úspechy v rôznych úlohách;

    definovať normy.

Normou v športovej metrológii sa nazýva hraničná hodnota výsledku, ktorá slúži ako základ pre zaradenie športovca do niektorej z klasifikačných skupín. Existujú tri typy noriem: porovnávacie, individuálne a náležité.

Porovnávacie normy sú založené na porovnaní ľudí patriacich k rovnakej populácii. Napríklad rozdelenie ľudí do podskupín podľa stupňa rezistencie (vysoká, stredná, nízka) alebo reaktivity (hyperreaktívna, normoreaktívna, hyporeaktívna) voči hypoxii.

Rôzne stupne hodnotenia a normy

Percento testovaných osôb

Normy v mierkach

Verbálne

v bodoch

Percentil

Veľmi nízky

Pod M - 2

Od M - 2 po M - 1

Podpriemerný

Od M-1 po M-0,5

Od M – 0,5 po M + 0,5

Nad priemer

Od M + 0,5 po M + 1

Od M + 1 po M + 2

Veľmi vysoko

Nad M + 2

Tieto normy charakterizujú iba komparatívnu úspešnosť subjektov v danej populácii, ale nehovoria nič o populácii ako celku (ani o priemere). Preto by sa referenčné miery mali porovnávať s údajmi z iných populácií a mali by sa používať v spojení s individuálnymi a správnymi mierami.

Individuálne normy na základe porovnania výkonnosti toho istého športovca v rôznych štátoch. Napríklad v mnohých športoch neexistuje vzťah medzi váhou vlastného tela a športovým výkonom. Každý športovec má individuálne optimálnu hmotnosť zodpovedajúcu stavu športovej formy. Táto rýchlosť môže byť kontrolovaná v rôznych fázach športového tréningu.

Príslušné normy na základe rozboru toho, čo by mal byť človek schopný úspešne zvládnuť úlohy, ktoré mu život kladie. Príkladom toho môžu byť štandardy jednotlivých komplexov pre telesný tréning, správne hodnoty VC, bazálny metabolizmus, telesná hmotnosť a výška atď.

1 Je možné priamo merať kvalitu výdrže?

2 Je možné priamo merať kvalitu rýchlosti?

3 Je možné priamo merať kvalitu obratnosti?

4 Je možné priamo merať kvalitu flexibility?

5 Je možné priamo merať silu jednotlivých svalov?

6 Môže byť hodnotenie vyjadrené v kvalitatívnej charakteristike (dobré, uspokojivé, zlé, kreditné atď.)?

7 Existuje rozdiel medzi meracou stupnicou a stupnicou hodnotenia?

8 Čo je to hodnotiaca stupnica?

Systém merania športových výsledkov Zákon prepočtu športových výsledkov na body Systém hodnotenia noriem

9 Stupnica predpokladá získanie rovnakého počtu bodov pre rovnaký nárast výsledkov. To…

10 Za rovnaký nárast výsledku sa pri zvyšovaní športových úspechov udeľuje menší počet bodov. To…

Progresívna stupnica Regresívna stupnica Proporcionálna stupnica Sigmoidná stupnica

11 Čím vyšší je športový výsledok, tým väčší bodový nárast sa odhaduje na jeho zlepšenie. To…

Progresívna stupnica Regresívna stupnica Proporcionálna stupnica Sigmoidná stupnica

12 Zlepšenie výkonnosti v oblastiach s veľmi nízkou a veľmi vysokou výkonnosťou sa mierne podporuje; najviac bodov sa získa zvýšením výsledkov v strednej zóne úspechu. To…

Progresívna stupnica Regresívna stupnica Proporcionálna stupnica Sigmoidná stupnica

13 Normy založené na porovnávaní ľudí patriacich do rovnakej populácie sa nazývajú ...

14 Normy založené na porovnaní výkonnosti toho istého športovca v rôznych štátoch sa nazývajú...

Individuálne normy Príslušné normy Porovnávacie normy

15 Normy založené na analýze toho, čo by mal byť človek schopný urobiť, aby sa vyrovnal s úlohami, ktoré mu boli pridelené, sa nazývajú ...

Individuálne normy Príslušné normy Porovnávacie normy

ZÁKLADNÉ POJMY KVALIMETRIE

Qualimetria(lat. qualitas - kvalita, metron - miera) študuje a rozvíja kvantitatívne metódy hodnotenia kvalitatívnych charakteristík.

Kvalita je založená na niekoľkých predpokladoch:

Dá sa merať akákoľvek kvalita;

Kvalita závisí od množstva vlastností, ktoré tvoria „strom kvality“ (napríklad strom kvality cvičebného výkonu v krasokorčuľovaní pozostáva z troch úrovní – vyššia, stredná, nižšia);

Každá vlastnosť je definovaná dvoma číslami: relatívny index a váha; súčet váh vlastností na každej úrovni sa rovná jednej (alebo 100 %).

Metodologické techniky kvality sú rozdelené do dvoch skupín:

Heuristické (intuitívne) založené na odborných hodnoteniach a dotazníkoch;

Inštrumentálne.

Expert sa nazýva odhad získaný spýtaním sa na názory špecialistov. Typické príklady odbornosti: rozhodovanie v gymnastike a krasokorčuľovaní, súťaž o najlepšiu vedeckú prácu atď.

Skúška zahŕňa tieto hlavné etapy: formovanie jej cieľa, výber odborníkov, výber metodiky, prieskum a spracovanie získaných informácií vrátane posúdenia súladu jednotlivých odborných posudkov. Pri skúmaní má veľký význam miera konzistentnosti názorov znalcov, hodnotená hodnotou koeficient poradovej korelácie(v prípade viacerých odborníkov). Treba poznamenať, že poradová korelácia je základom riešenia mnohých problémov kvality, pretože umožňuje matematické výpočty s kvalitatívnymi znakmi.

V praxi je ukazovateľom kvalifikácie odborníka často odchýlka jeho hodnotení od priemerných hodnotení skupiny expertov.

Spochybňovanie sa nazýva metóda zbierania názorov vypĺňaním dotazníkov. Dotazník spolu s rozhovorom a rozhovorom odkazuje na metódy prieskumu. Na rozdiel od rozhovorov a rozhovorov dotazníkový prieskum predpokladá písomné odpovede vyplňujúceho dotazníka - respondenta - na systém štandardizovaných otázok. Umožňuje študovať motívy správania, zámery, názory atď.

Pomocou dotazníkov je možné riešiť mnohé praktické problémy v športe: posúdenie psychického stavu športovca; jeho postoj k charakteru a zameraniu tréningov; medziľudské vzťahy v tíme; vlastné hodnotenie technickej a taktickej pripravenosti; posúdenie stravy a mnohé iné.

1 Čo študuje kvalimetria?

Štúdium kvality testov Štúdium kvalitatívnych vlastností znaku Štúdium a vývoj kvantitatívnych metód hodnotenia kvality

2 Matematické metódy používané v kvalimetrii?

Párová korelácia Ranková korelácia Analýza rozptylu

3 Aké metódy sa používajú na hodnotenie úrovne výkonu?

4 Aké metódy sa používajú na hodnotenie rôznorodosti technických prvkov?

Dotazníková metóda Metóda odborných posúdení Metóda nešpecifikovaná

5 Aké metódy sa používajú na hodnotenie zložitosti technických prvkov?

Dotazníková metóda Metóda odborných posúdení Metóda nešpecifikovaná

6 Aké metódy sa používajú na hodnotenie psychického stavu športovca?

Dotazníková metóda Metóda odborných posúdení Metóda nešpecifikovaná

Prvá zložka, teória testov, obsahuje popis štatistických modelov na spracovanie diagnostických údajov. Obsahuje modely na analýzu odpovedí v testovacích položkách a modely na výpočet celkových výsledkov testu. Mellenberg (1980, 1990) to nazval „psychometria“. Klasická teória testov, moderná teória testov (alebo model analýzy odpovedí na testové položky - IRT) a model


Vzorky položiek tvoria tri najdôležitejšie typy modelov teórie testov. Predmetom psychodiagnostiky sú prvé dva modely.

Klasická teória testov. Väčšina testov inteligencie a osobnosti bola vyvinutá na základe tejto teórie. Ústredným pojmom tejto teórie je pojem „spoľahlivosť“. Spoľahlivosť sa týka konzistentnosti výsledkov pri prehodnotení. V referenčných knihách je tento pojem zvyčajne prezentovaný veľmi stručne a potom je uvedený podrobný popis aparátu matematickej štatistiky. V tejto úvodnej kapitole uvádzame stručný popis hlavného významu spomínaného pojmu. Reliabilita je v klasickej teórii testov chápaná ako opakovateľnosť výsledkov viacerých meracích postupov (hlavne meraní pomocou testov). Spoľahlivosť zahŕňa výpočet chyby merania. Výsledky získané počas procesu testovania možno prezentovať ako súčet skutočného výsledku a chyby merania:

Xi = Ti+ Еj

kde Xi je vyhodnotenie získaných výsledkov, Ti je skutočný výsledok a Еj- chyba merania.

Hodnotením získaných výsledkov je spravidla počet správnych odpovedí na testové úlohy. Skutočný výsledok možno považovať za skutočný odhad v platónskom zmysle (Gulliksen, 1950). Rozšírený je pojem očakávané výsledky, t.j. predstavy o bodoch, ktoré možno získať v dôsledku veľkého počtu opakovaní meracích postupov (Pán & Novich, 1968). Nie je však možné vykonať rovnaký postup posudzovania s jednou osobou. Preto je potrebné hľadať iné riešenia problému (Witlman, 1988).

V rámci tohto konceptu sa vytvárajú určité predpoklady o skutočných výsledkoch a chybách merania. Posledne menované sa berú ako nezávislý faktor, čo je, samozrejme, opodstatnený predpoklad, pretože náhodné výkyvy výsledkov nedávajú kovariancie: r EE = 0.

Predpokladá sa, že medzi skutočnými skóre a chybami merania neexistuje žiadna korelácia: r EE = 0.


Celková chyba je 0, pretože aritmetický priemer sa berie ako skutočný odhad:

Tieto predpoklady nás nakoniec vedú k známej definícii spoľahlivosti ako pomeru skutočného výsledku k celkovému rozptylu alebo vyjadreniu: 1 mínus pomer, v čitateli ktorého je chyba merania a v menovateli - celkový rozptyl. :


, OR

Z tohto vzorca na určenie spoľahlivosti získame rozptyl chyby S 2 (E) sa rovná celkovému rozptylu v počte prípadov (1 - r XX "); štandardná chyba merania je teda určená vzorcom:

Po teoretickom zdôvodnení spoľahlivosti a jej derivátov je potrebné určiť index spoľahlivosti konkrétneho testu. Existujú praktické postupy hodnotenia spoľahlivosti testov, ako je používanie zameniteľných formulárov (paralelné testy), rozdelenie položiek na dve časti, opätovné testovanie a meranie vnútornej konzistencie. Každá referencia obsahuje indexy stálosti výsledkov testov:

r XX ’= r (x 1, x 2)

kde r XX ' je koeficient stability a x 1 a x 2 - výsledky dvoch meraní.

Koncept spoľahlivosti zameniteľných foriem zaviedol a rozvinul Gulliksen (1950). Tento postup je dosť namáhavý, pretože je spojený s potrebou vytvárať paralelnú sériu úloh.

r XX ’= r (x 1, x 2)

kde r XX ' je koeficient ekvivalencie a x 1 a x 2 - dva paralelné testy.

Ďalší postup – rozdelenie hlavného testu na dve časti A a B – sa používa jednoduchšie. Ukazovatele získané pre obe časti testu sú korelované. Pomocou Spearman-Brownovho vzorca sa hodnotí spoľahlivosť testu ako celku:

kde A a B sú dve paralelné časti testu.

Ďalšou metódou je stanovenie vnútornej konzistencie testovaných položiek. Táto metóda je založená na stanovení kovariancie jednotlivých položiek. Sg je rozptyl náhodne vybranej položky a Sgh je kovariancia dvoch náhodne vybraných položiek. Najčastejšie používaným koeficientom na určenie vnútornej konzistencie je Cronbachov koeficient alfa. Používa sa aj vzorec KP20 a λ-2(lambda-2).

V klasickom poňatí spoľahlivosti sa zisťujú chyby merania, ktoré vznikajú ako pri testovaní, tak aj pri pozorovaní. Zdroje týchto chýb sú rôzne: môžu to byť osobnostné črty a zvláštnosti testovacích podmienok a samotné testovacie úlohy. Existujú špecifické metódy na výpočet chýb. Vieme, že naše pozorovania môžu byť nesprávne, naše metodické nástroje sú nedokonalé, rovnako ako sú nedokonalí ľudia sami. (Ako si nepamätať Shakespeara: „Si nespoľahlivý, ktorého meno je muž“). Skutočnosť, že v klasickej teórii testov sú chyby merania vysvetlené a vysvetlené, je dôležitým pozitívnym bodom.

Klasická teória testov má množstvo významných čŕt, ktoré možno považovať za jej nedostatky. Niektoré z týchto charakteristík sú uvedené v referenčných knihách, ale ich dôležitosť (z každodenného hľadiska) je zriedka zdôrazňovaná, rovnako ako sa neuvádza, že z teoretického alebo metodologického hľadiska by sa mali považovať za nedostatky.

Najprv. Klasická testovacia teória a koncept spoľahlivosti sú zamerané na výpočet celkových testovacích ukazovateľov, ktoré sú výsledkom sčítania odhadov získaných v samostatných úlohách. Takže pri práci


Po druhé. Faktor spoľahlivosti predpokladá odhad veľkosti rozptylu meraných ukazovateľov. Z toho vyplýva, že koeficient spoľahlivosti bude nižší, ak (pri rovnosti ostatných ukazovateľov) bude vzorka homogénnejšia. Neexistuje jednotný koeficient vnútornej konzistencie testovaných položiek, tento koeficient je vždy „kontextový“. Crocker a Aljina (1986) napríklad navrhujú špeciálny vzorec „homogénnej korekcie vzorky“ navrhnutý pre najvyššie a najnižšie skóre získané tými, ktorí sa podrobujú testovaniu. Pre diagnostika je dôležité poznať charakteristiky variácií vo vzorke, inak nebude môcť použiť koeficienty vnútornej konzistencie uvedené v príručke pre tento test.

Po tretie. Fenomén redukcie na aritmetický priemer je logickým dôsledkom klasickej koncepcie spoľahlivosti. Ak skóre testu kolíše (t. j. nie je dostatočne spoľahlivé), potom je celkom možné, že keď sa postup zopakuje, subjekty s nízkym skóre dostanú vyššie skóre a naopak subjekty s vysokým skóre získajú nízke skóre. Tento artefakt postupu merania nemožno zameniť za skutočnú zmenu alebo prejav vývojových procesov. Zároveň však nie je ľahké medzi nimi rozlíšiť, tk. možnosť zmeny v priebehu vývoja nemožno nikdy vylúčiť. Pre úplnú dôveru je potrebné „porovnať s kontrolnou skupinou.

Štvrtou charakteristikou testov navrhnutých v súlade s princípmi klasickej teórie je dostupnosť normatívnych údajov. Znalosť testovacích noriem umožňuje výskumníkovi adekvátne interpretovať výsledky testovania. Mimo normy sú výsledky testov bezvýznamné. Vývoj testovacích noriem je pomerne nákladná záležitosť, pretože psychológ musí získať výsledky testov na reprezentatívnej vzorke.

2 Ya ter Laak

Ak hovoríme o nedostatkoch klasickej koncepcie spoľahlivosti, potom je vhodné uviesť výrok Si-tsma (1992, s. 123-125). Poznamenáva, že prvým a hlavným predpokladom klasickej teórie testov je, že výsledky testov sa riadia intervalovým princípom. Neexistujú však žiadne štúdie, ktoré by tento predpoklad podporili. V podstate ide o „meranie podľa ľubovoľne stanoveného pravidla“. Táto vlastnosť stavia klasickú teóriu testov do menej priaznivej pozície v porovnaní so škálami merania postojov a samozrejme v porovnaní s modernou teóriou testov. Mnohé metódy analýzy údajov (analýza rozptylu, regresná analýza, korelačná a faktorová analýza) sú založené na predpoklade existencie intervalovej stupnice. Nemá však pevný základ. Považovať škálu skutočných výsledkov za škálu hodnôt psychologických charakteristík (napríklad aritmetické schopnosti, inteligenciu, neurotizmus) možno len predpokladať.

Druhá poznámka sa týka skutočnosti, že výsledky testu nie sú absolútnymi ukazovateľmi tej či onej psychologickej charakteristiky testovanej osoby, mali by sa považovať len za výsledky vykonania toho či onoho testu. Dva testy môžu tvrdiť, že skúmajú rovnaké psychologické charakteristiky (napríklad inteligenciu, verbálne schopnosti, extraverziu), ale to neznamená, že tieto dva testy sú rovnocenné a majú rovnaké schopnosti. Porovnanie ukazovateľov dvoch ľudí testovaných rôznymi testami je nesprávne. To isté platí pre absolvovanie dvoch rôznych testov tým istým predmetom. Tretia poznámka sa týka predpokladu, že štandardná chyba merania je rovnaká pre akúkoľvek úroveň merateľnej schopnosti jednotlivca. Pre tento predpoklad však neexistuje žiadny empirický test. Takže napríklad neexistuje žiadna záruka, že testovaný s dobrými matematickými schopnosťami získa vysoké skóre pri práci s relatívne jednoduchým aritmetickým testom. V tomto prípade je pravdepodobnejšie, že vysoké hodnotenie získa osoba s nízkymi alebo priemernými schopnosťami.

V rámci modernej teórie testov alebo teórie analýzy odpovedí obsahujú testové položky popis veľkého množstva


počet modelov možných odpovedí respondentov. Tieto modely sa líšia svojimi východiskovými predpokladmi, ako aj požiadavkami vo vzťahu k získaným údajom. Model Rush je často považovaný za synonymum teórií analýzy odpovedí na otázky v teste (1RT). V skutočnosti je to len jeden z modelov. Vzorec uvedený v ňom na opis charakteristickej krivky pre nastavenie g je nasledujúci:

kde g- samostatná testovacia úloha; exp- exponenciálna funkcia (nelineárna závislosť); δ ("Delta") - úroveň obtiažnosti testu.

Ďalšie testovacie položky ako napr h, získať aj svoje charakteristické krivky. Splnenie podmienky 5 h> 5 g (g znamená to h- ťažšia úloha. Preto pre akúkoľvek hodnotu ukazovateľa Θ ("Theta" - latentné vlastnosti schopností testujúcich) pravdepodobnosť úspešného dokončenia úlohy h menšie. Tento model sa nazýva prísny, pretože je zrejmé, že pri nízkej miere vyjadrenia vlastnosti sa pravdepodobnosť dokončenia úlohy blíži k nule. V tomto modeli nie je priestor na dohady alebo dohady. Pri úlohách s možnosťami nie je potrebné vytvárať predpoklady o pravdepodobnosti úspechu. Tento model je navyše prísny v tom zmysle, že všetky testované položky musia mať rovnakú rozlišovaciu schopnosť (vysoká diskriminácia sa odráža v sklone krivky; tu je možné zostrojiť Guttmannovu škálu, podľa ktorej v každom bode charakteristická krivka pravdepodobnosť dokončenia úlohy sa pohybuje od O do 1). Kvôli tejto podmienke nie je možné zahrnúť všetky úlohy do testov založených na modeli Rush.

Existuje niekoľko variantov tohto modelu (napríklad Birnbaura, 1968, See Lord & Novik). Umožňuje existenciu úloh s rôznou diskrimináciou

schopnosť.

Holandský výskumník Mokken (1971) vyvinul dva modely na analýzu odpovedí v testových položkách, ktorých požiadavky nie sú také prísne ako v modeli Rush, a preto sú možno reálnejšie. Ako hlavná podmienka

Viya Mokken predkladá stanovisko, že charakteristická krivka úlohy by mala nasledovať monotónne, bez prestávok. Všetky testovacie úlohy sú zároveň zamerané na štúdium rovnakých psychologických charakteristík, ktoré by sa mali merať v. Akákoľvek forma tejto závislosti je povolená, pokiaľ sa nepreruší. Preto tvar charakteristickej krivky neurčuje žiadna špecifická funkcia. Táto „sloboda“ vám umožňuje použiť v teste viac položiek a úroveň hodnotenia nie je vyššia ako bežná.

Metodológia modelov odozvy na testované položky (IRT) sa líši od metodológie väčšiny experimentálnych a korelačných štúdií. Matematický model je určený na štúdium behaviorálnych, kognitívnych, emocionálnych charakteristík, ako aj vývojových javov. Tieto javy, o ktorých sa uvažuje, sa často obmedzujú na reakcie na úlohy, čo viedlo Mellenberga (1990) k tomu, aby IRT nazval „mini-teóriou mini-správania“. Výsledky štúdie možno do určitej miery prezentovať ako krivky zhody, najmä v prípadoch, keď neexistuje teoretické pochopenie študovaných charakteristík. Doteraz máme k dispozícii len niekoľko testov inteligencie, schopností a osobnosti, vytvorených na základe početných modelov teórie IRT. Varianty Rushovho modelu sa častejšie používajú pri navrhovaní výkonnostných testov (Verhelst, 1993), kým Mockenove modely sú vhodnejšie pre vývojové javy (pozri tiež kapitolu 6).

Reakcia testovaného na testované položky je základnou jednotkou modelov IRT. Typ reakcie je určený závažnosťou študovanej charakteristiky u osoby. Takouto charakteristikou môže byť napríklad aritmetická alebo priestorová schopnosť. Vo väčšine prípadov ide o jeden alebo druhý aspekt inteligencie, charakteristiky úspechu alebo osobnostné vlastnosti. Predpokladá sa, že medzi pozíciou tejto konkrétnej osoby v určitom rozsahu skúmanej charakteristiky a pravdepodobnosťou úspešného splnenia konkrétnej úlohy existuje nelineárny vzťah. Nelinearita tohto vzťahu je v istom zmysle intuitívna. Známe frázy „Každý začiatok je ťažký“ (pomaly


lineárny štart) a „Stať sa svätým nie je také ľahké“ znamená, že ďalšie zlepšovanie po dosiahnutí určitej úrovne je ťažké. Krivka sa pomaly približuje, no takmer nikdy nedosahuje 100% úspešnosť.

Niektoré modely sú pravdepodobnejšie v rozpore s naším intuitívnym chápaním. Vezmime si tento príklad. Osoba s indexom závažnosti ľubovoľnej charakteristiky rovným 1,5 má 60-percentnú pravdepodobnosť úspechu v úlohe. To je v rozpore s naším intuitívnym chápaním takejto situácie, pretože s úlohou sa môžete buď úspešne vyrovnať, alebo sa s ňou nedokážete vyrovnať. Vezmime si tento príklad: 100-krát sa človek pokúsi nabrať výšku 1m 50 cm Úspech ho sprevádza 60-krát, t.j. má 60 percentnú úspešnosť.

Na posúdenie závažnosti charakteristiky sú potrebné aspoň dve úlohy. Model Rush predpokladá určenie závažnosti charakteristík bez ohľadu na náročnosť úlohy. To je tiež v rozpore s naším intuitívnym chápaním: predpokladajme, že človek má 80-percentnú pravdepodobnosť, že skočí nad 1,30 m. Ak áno, podľa charakteristickej krivky úloh má 60-percentnú pravdepodobnosť, že skočí nad 1,50 ma 40-percentnú pravdepodobnosť skoku vyššie ako 1,70 m. Preto bez ohľadu na hodnotu nezávislej premennej (výšky) je možné posúdiť schopnosť človeka skákať do výšky.

Modelov IRT je asi 50 (Goldstein & Wood, 1989.) Existuje mnoho nelineárnych funkcií, ktoré popisujú (vysvetľujú) pravdepodobnosť úspechu v úlohe alebo skupine úloh. Požiadavky a obmedzenia týchto modelov sú rôzne a tieto rozdiely možno nájsť pri porovnaní modelu Rush a Mockenovej stupnice. Požiadavky na tieto modely zahŕňajú:

1) potreba určiť študované charakteristiky a posúdiť postavenie osoby v rozsahu tejto vlastnosti;

2) posúdenie postupnosti úloh;

3) overenie konkrétnych modelov. V psychometrii bolo vyvinutých mnoho postupov na testovanie modelu.

V niektorých referenčných knihách sa teória IRT považuje za formu analýzy testovanej položky (pozri napr.

Croker & Algina, J 986). Je však možné tvrdiť, že teória IRT je „mini-teória mini-správania“. Zástancovia teórie IRT poznamenávajú, že ak sú koncepty strednej úrovne (modely) nedokonalé, čo potom zložitejšie konštrukcie v psychológii?

Klasická a moderná teória testov. Ľudia si nevedia pomôcť a porovnávajú veci, ktoré vyzerajú takmer rovnako. (Možno každodenný ekvivalent psychometrie spočíva najmä v porovnávaní ľudí podľa významných charakteristík a vo výbere medzi nimi). Každá z prezentovaných teórií – ako teória merania chýb v odhade, tak aj matematický model odpovedí na testové položky – má svojich priaznivcov (Goldstein & Wood, 1986).

Modelom IRT sa nevyčíta, že sú „založené na pravidlách“, na rozdiel od klasickej teórie testov. Model IRT je zameraný na analýzu hodnotených charakteristík. Osobnostné charakteristiky a charakteristiky úloh sa posudzujú pomocou škál (ordinálnych alebo intervalových). Okrem toho je možné porovnať ukazovatele výkonnosti rôznych testov zameraných na štúdium podobných charakteristík. Napokon, spoľahlivosť nie je rovnaká pre každú hodnotu na stupnici a priemery sú zvyčajne spoľahlivejšie ako tie na začiatku a na konci stupnice. Zdá sa teda, že modely IRT sú teoreticky pokročilejšie. Rozdiely sú aj v praktickom využití modernej teórie testov a klasickej teórie (Sijstma, 1992, s. 127-130). Moderná teória testov je zložitejšia ako klasická teória testov, takže ju menej často používajú laici. Okrem toho má IRT špeciálne požiadavky na úlohy. To znamená, že položky by mali byť vylúčené z testu, ak nespĺňajú požiadavky modelu. Toto pravidlo platí ďalej pre tie úlohy, ktoré boli súčasťou široko používaných testov, zostavených podľa princípov klasickej teórie. Test sa skráti, a preto bude menej spoľahlivý.

IRT ponúka matematické modely na štúdium javov v reálnom svete. Modely by nám mali pomôcť pochopiť kľúčové aspekty týchto javov. Je tu však základná teoretická otázka. Modely možno zvážiť


ako prístup k štúdiu komplexnej reality, v ktorej žijeme. Ale model a realita nie sú to isté. Podľa pesimistického pohľadu je možné modelovať len ojedinelé (a navyše nie najzaujímavejšie) typy správania. Dá sa nájsť aj tvrdenie, že realita vôbec nepodlieha modelovaniu, lebo podriaďuje sa nielen zákonom príčiny a následku. V najlepšom prípade je možné modelovať jednotlivé (ideálne) javy správania. Existuje aj iný, optimistickejší pohľad na možnosti modelingu. Vyššie uvedená pozícia blokuje možnosť hlbokého pochopenia podstaty javov ľudského správania. Aplikácia toho či onoho modelu vyvoláva niektoré všeobecné, zásadné otázky. Podľa nášho názoru niet pochýb o tom, že IRT je koncept teoreticky a technicky nadradený klasickej teórii testov.

Praktickým účelom testov, na akomkoľvek teoretickom základe sú vytvorené, je definovať významné kritériá a na ich základe stanoviť charakteristiky určitých psychologických konštruktov. Má model IRT výhody aj v tomto smere? Je možné, že testy založené na tomto modeli neposkytujú presnejšiu predpoveď ako testy založené na klasickej teórii a je možné, že ich prínos k rozvoju psychologických konštruktov nie je výraznejší. Diagnostici uprednostňujú kritériá, ktoré sú priamo relevantné pre jednotlivca, inštitúciu alebo komunitu. Vedecky pokročilejší model „ipso facto“ * nedefinuje vhodnejšie kritérium a je trochu obmedzený vo vysvetľovaní vedeckých konštruktov. Je zrejmé, že vývoj testov založených na klasickej teórii bude pokračovať, no zároveň sa budú vytvárať nové IRT modely s presahom na štúdium väčšieho počtu psychologických javov.

V klasickej teórii testov sa rozlišujú pojmy „spoľahlivosť“ a „platnosť“. Výsledky testov by mali byť spoľahlivé, t.j. výsledky počiatočného a opakovaného testovania by mali byť konzistentné. okrem toho

* ipso facto(lak) - sám o sebe (cca prekl.).

výsledky by mali byť bez (pokiaľ možno) chýb v odhade. Prítomnosť platnosti je jednou z požiadaviek na získané výsledky. Reliabilita sa v tomto prípade považuje za nevyhnutnú, no zatiaľ nie postačujúcu podmienku platnosti testu.

Platnosť predpokladá, že získané výsledky sa týkajú niečoho praktického alebo teoretického významu. Závery vyvodené z výsledkov testov musia byť platné. Najčastejšie hovoria o dvoch typoch validity: prediktívnej (kriteriálnej) a konštruktívnej. Existujú aj iné typy platnosti (pozri kapitolu 3). Okrem toho možno platnosť určiť v prípade kvázi experimentov (Cook & Campbell, 1976, Cook & Shadish, 1994). Hlavným typom validity je však stále prediktívna validita, ktorá sa chápe ako schopnosť predpovedať z výsledku testu niečo významné o správaní v budúcnosti, ako aj možnosť hlbšieho pochopenia určitej psychologickej vlastnosti alebo kvality.

Prezentované typy platnosti sú diskutované v každej príručke a sú sprevádzané popisom metód na analýzu platnosti testu. Faktorová analýza je vhodnejšia na určenie konštruktovej validácie a lineárne regresné rovnice sa používajú na analýzu prediktívnej platnosti. Tieto alebo tie charakteristiky (akademický výkon, účinnosť terapie) možno predpovedať na základe jedného alebo viacerých ukazovateľov získaných pri práci s intelektuálnymi alebo osobnostnými testami. Na určenie prediktívnej platnosti testu sa používajú techniky spracovania údajov, ako je korelácia, regresia, analýza rozptylu, analýza parciálnych korelácií a rozptylov.

Často sa popisuje aj obsahová validita. Predpokladá sa, že všetky úlohy a úlohy testu by mali patriť do konkrétnej oblasti (mentálne vlastnosti, správanie a pod.). Koncept zmysluplnej validity charakterizuje súlad každej testovej úlohy s meranou oblasťou. Platnosť obsahu sa niekedy považuje za súčasť spoľahlivosti alebo „zovšeobecniteľnosti“ (Cronbach, Gleser, Nanda & Rajaratnam, 1972). Avšak, s


Pri výbere položiek pre testy prospechu v konkrétnej tematickej oblasti je tiež dôležité venovať pozornosť pravidlám zaraďovania položiek do testu.

V klasickej teórii testov sa spoľahlivosť a validita posudzujú relatívne nezávisle od seba. Existuje však aj iné chápanie vzťahu medzi týmito pojmami. Moderná teória testov je založená na aplikácii modelov. Parametre sa vyhodnocujú v rámci určitého modelu. Ak úloha nespĺňa požiadavky modelu, potom je v rámci tohto modelu uznaná za neplatnú. Overenie konštrukcie je súčasťou overenia samotného modelu. Táto validácia sa týka hlavne overenia existencie skúmaného jednorozmerného latentného znaku so známymi škálovými charakteristikami. Škálové skóre možno nepochybne použiť na určenie vhodných kritérií a ich koreláciou s indikátormi iných konštruktov je možné získať informácie o konvergentnej a divergentnej platnosti konštruktu.

Psychodiagnostika je analogická s jazykom, opisuje sa ako jednota štyroch zložiek, zastúpených na troch úrovniach. Prvá zložka, teória testov, je analogická so syntaxou, gramatikou jazyka. Generatívna (generatívna) gramatika je na jednej strane dômyselný model, na druhej systém, ktorý sa riadi pravidlami. Pomocou týchto pravidiel sa vytvárajú zložité na základe jednoduchých kladných viet. Tento model však zároveň ponecháva bokom popis toho, ako je komunikačný proces organizovaný (čo sa prenáša a čo vníma) a na aké účely sa uskutočňuje. Aby sme to pochopili, sú potrebné ďalšie znalosti. To isté možno povedať o teórii testov: v psychodiagnostike je potrebná, ale nie je schopná vysvetliť, čo psychodiagnostik robí a aké sú jeho ciele.

1.3.2. Psychologické teórie a psychologické konštrukty

Psychodiagnostika je vždy diagnóza niečoho konkrétneho: osobnostných vlastností, správania, myslenia, emócií. Testy sú určené na meranie individuálnych rozdielov. Existuje niekoľko konceptov

individuálne rozdiely, z ktorých každý má svoje charakteristické vlastnosti. Ak sa uzná, že psychodiagnostika sa neobmedzuje len na hodnotenie individuálnych rozdielov, potom pre psychodiagnostiku nadobúdajú významný význam aj iné teórie. Príkladom je posudzovanie rozdielov v procesoch duševného vývinu a rozdielov v sociálnom prostredí. Hodnotenie individuálnych rozdielov síce nie je nepostrádateľným atribútom psychodiagnostiky, no napriek tomu existujú určité tradície výskumu v tejto oblasti. Psychodiagnostika začala hodnotením rozdielov v inteligencii. Hlavnou úlohou testov bolo „určiť dedičný prenos geniality“ (Gallon) či výber detí na tréning (Binet, Simon). Meranie inteligenčného kvocientu dostalo teoretické pochopenie a praktický rozvoj v prácach Spearmana (Veľká Británia) a Thurstonea (USA). Raymond B. Kettel urobil podobnú vec pri hodnotení osobnostných vlastností. Psychodiagnostika sa neodmysliteľne spája s teóriami a predstavami o individuálnych rozdieloch v úspechoch (hodnotenie extrémnych možností) a formách správania (úroveň typického fungovania). Táto tradícia platí dodnes. V učebniciach psychodiagnostiky sa rozdiely v sociálnom prostredí posudzujú oveľa menej často v porovnaní so zohľadnením charakteristík samotných vývinových procesov. Neexistuje na to žiadne rozumné vysvetlenie. Na jednej strane sa diagnostika neobmedzuje len na špecifické teórie a koncepty. Na druhej strane potrebuje teórie, keďže práve v nich sa určuje diagnostikovaný obsah (teda „čo“ sa diagnostikuje). Takže napríklad inteligenciu možno považovať za všeobecnú charakteristiku aj za základ mnohých nezávislých schopností. Ak sa psychodiagnostika snaží „utiecť“ z tej či onej teórie, potom sa základom psychodiagnostického procesu stávajú myšlienky zdravého rozumu. Vo výskume sa používajú rôzne metódy analýzy údajov a všeobecná logika výskumu určuje výber konkrétneho matematického modelu a určuje štruktúru použitých psychologických konceptov. Takéto metódy matematickej štatistiky


ki, ako analýza rozptylu, regresná analýza, faktorová analýza, výpočet korelácií predpokladá existenciu lineárnych závislostí. V prípade nesprávnej aplikácie týchto metód „vnesú“ ich štruktúru do prijatých dát a použitých konštruktov.

Predstavy o rozdieloch v sociálnom prostredí a o rozvoji osobnosti nemali na psychodiagnostiku takmer žiadny vplyv. Učebnice (pozri napr. Murphy & Davidshofer, 1988) berú do úvahy klasickú teóriu testov a rozoberajú vhodné metódy štatistického spracovania, popisujú známe testy, uvažujú o využití psychodiagnostiky v praxi: v psychológii riadenia, pri výbere zamestnancov, pri výbere pracovníkov, v odbore, v odbore, v odbore. pri posudzovaní psychických vlastností človeka...

Teórie individuálnych rozdielov (ako aj predstavy o rozdieloch medzi sociálnym prostredím a duševným vývojom) sú podobné štúdiu sémantiky jazyka. Toto je štúdium podstaty, obsahu a významu. Významy sú určitým spôsobom štruktúrované (ako psychologické konštrukty), napríklad podobnosťou alebo kontrastom (analógia, konvergencia, divergencia).

1.3.3. Psychologické testy a iné metodické nástroje

Treťou zložkou navrhovanej schémy sú testy, postupy a metodické nástroje, pomocou ktorých sa zbierajú informácie o osobnostných charakteristikách. Draene a Siitsma (1990, s. 31) uvádzajú nasledujúcu definíciu testov: „Psychologický test sa považuje za klasifikáciu podľa určitého systému alebo za postup merania, ktorý umožňuje urobiť určitý úsudok o jednom alebo viacerých empiricky identifikovaných alebo teoreticky podložené charakteristiky konkrétnej stránky ľudského správania (pre rámec testovacej situácie). Zároveň sa zvažuje reakcia respondentov na určitý počet starostlivo vybraných podnetov a získané odpovede sa porovnávajú s testovými normami “.

Diagnostika vyžaduje testy a techniky na zhromažďovanie spoľahlivých, presných a platných informácií o funkciách

a osobnostné vlastnosti, myslenie, emócie a správanie človeka. Tento komponent okrem vývoja testovacích postupov zahŕňa aj tieto otázky: ako sa tvoria testy, ako sa formulujú a vyberajú úlohy, ako prebieha proces testovania, aké sú požiadavky na podmienky testovania, ako sa berú do úvahy chyby merania, ako výsledky testov sa vypočítajú a interpretujú.

V procese vývoja testov sa rozlišujú racionálne a empirické stratégie. Aplikácia racionálnej stratégie začína definíciou základných pojmov (napríklad pojmov inteligencia, extraverzia) a v súlade s týmito myšlienkami sú formulované testové úlohy. Príkladom takejto stratégie je Guttmanov koncept fazetovej teórie (1957, 1968, 1978). Najprv sa identifikujú rôzne aspekty základných konštruktov, potom sa úlohy a úlohy vyberú tak, aby sa bral do úvahy každý z týchto aspektov. Druhou stratégiou je výber úloh na empirickom základe. Napríklad, ak sa výskumník pokúsi vytvoriť test odborných záujmov, ktorý by odlíšil lekárov od inžinierov, potom by mal byť postup takýto. Obe skupiny respondentov musia odpovedať na všetky položky testu a tie položky v odpovediach, v ktorých sú zistené štatisticky významné rozdiely, sú zahrnuté do finálnej verzie testu. Ak napríklad existujú rozdiely medzi skupinami v odpovediach na výrok „Milujem rybolov“, potom sa tento výrok stane súčasťou testu. Hlavným bodom tejto knihy je, že test súvisí s konceptuálnou alebo taxonomickou teóriou, ktorá definuje tieto charakteristiky.

Účel testu je zvyčajne špecifikovaný v návode na jeho použitie. Test je potrebné štandardizovať, aby mohol merať rozdiely medzi ľuďmi a nie medzi testovacími podmienkami. Existujú však odchýlky od štandardizácie v postupoch nazývaných testovanie limitov a testy potenciálu učenia. V týchto podmienkach je respondentovi v procese asistované


testovanie a následné vyhodnotenie vplyvu takéhoto postupu na výsledok. Bodovanie za odpovede na úlohy je objektívne, t.j. v súlade so štandardným postupom. Interpretácia získaných výsledkov je tiež prísne definovaná a vykonávaná na základe testovacích noriem.

Tretia zložka psychodiagnostiky – psychologické testy, nástroje, postupy – obsahuje určité úlohy, ktoré sú najmenšími jednotkami psychodiagnostiky a v tomto zmysle sú úlohy podobné fonémam jazyka. Počet možných kombinácií foném je obmedzený. Len určité fonemické štruktúry môžu vytvárať slová a vety, ktoré poskytujú poslucháčovi informácie. Tiež a testové úlohy: iba v určitej vzájomnej kombinácii sa môžu stať účinným prostriedkom na posúdenie zodpovedajúceho konštruktu.