Test teorisinin temelleri. Fiziksel kültürde test teorisinin temellerinin sunumu

Test teorisinin temelleri. Fiziksel kültürde test teorisinin temellerinin sunumu
Test teorisinin temelleri. Fiziksel kültürde test teorisinin temellerinin sunumu

Test nedir

IEEE STD 829-1983 uyarınca Test yapmak - Bu, aslında mevcut ve gerekli özellikleri (kusur) arasındaki farkları belirlemeye yönelik yazılımı analiz etmek ve yazılımın özelliklerini değerlendirmek için bir işlemdir.

GOST R ISO IEC 12207-99'a göre, yazılımın yaşam döngüsünde, diğer yardımcı doğrulama işlemlerinin yanı sıra, sertifikalandırma, eklem analizi ve denetim belirlenir. Doğrulama süreci, yazılım ürünlerinin önceki çalışmalarda uygulanan gereklilikler veya koşullara tam uyum içinde çalıştığını belirleme sürecidir. Bu işlem analiz, doğrulama ve test (test) içerebilir. Sertifika süreci, sistem veya yazılım ürünü tarafından oluşturulan yerleşik gereksinimlerin uygunluğunun tamlığını belirleme işlemidir. Ortak analiz süreci, devletlerin değerlendirilmesinin ve gerekirse, projedeki işin (ürünlerin) sonuçlarını değerlendirme sürecidir. Denetim süreci, sözleşmenin gereksinimlerine, planları ve koşullarına uyumu belirleme sürecidir. Bu işlemlerin miktarında ve yaygın olarak test edilenleri makyaj yapın.

Test, ayrı bir programın kontrol edilmesi veya belirli bir gerekliliğe uyumunu doğrulamak gibi belirli bir amaç için özel bir amaç için geliştirilen belirli giriş verileri, başlangıç \u200b\u200bkoşulları ve beklenen sonuçlara sahip test prosedürlerine dayanmaktadır. Test prosedürleri, programın uygun şekilde uygulanmasından önce ayrı bir fonksiyonun uygun şekilde çalışmasından programın çeşitli yönlerini kontrol edebilir.

Bir proje yürütürken, hangi standartlara uygun olarak, gerekliliklerin ürün tarafından test edileceğine göre dikkate almak gerekir. Hangi araçlar (varsa) aranacak ve belgelerin bulunduğu kusurları bulmak için kullanılır. Projenin en başından beri testleri hatırlıyorsanız, geliştirilen ürünün testi hoş olmayan sürprizler sunmaz. Böylece, ürünün kalitesi oldukça yüksek olması muhtemeldir.

Ürün Yaşam Döngüsü ve Test

Zamanımızda, özellikle teknolojinin yinelemeli yazılım geliştirme süreçleri tarafından kullanılır. RUP - Rasyonel Birleştirilmiş Süreç(Şek. 1). Bu yaklaşımı kullanırken, testler, programcıların gerekli tüm kodu yazdıktan sonra çalışan "Dikili" işlemi sona erer. Testler üzerinde çalışmak, gelecekteki ürün için gereksinimleri belirlemenin ilk aşamasıyla başlar ve mevcut görevlerle yakından bütünleşir. Ve testçiler için yeni şartlar yaratıyor. Rolleri, hataları mümkün olduğunca tam olarak ve mümkün olduğunca erken tanımlamaya indirgen değildir. Projenin en önemli risklerini belirleme ve ortadan kaldırma işlemine katılmaları gerekir. Bu amaçla, her bir yineleme için test edilmenin amacı ve başarısı için yöntemler belirlenir. Her bir yineleme sonunda, ek testlere ihtiyaç duyulduğunda bu amacın ne kadar elde edildiğine ve ilkeleri ve test araçlarını değiştirmek için gerekli olup olmadığı belirlenir. Sırayla her tespit edilen kusur, kendi yaşam döngüsünden geçmelidir.

İncir. 1. Rup'ta Ürün Yaşam Döngüsü

Test, genellikle her biri belirli bir görev ve amaç listesine sahip olan devirlerle gerçekleştirilir. Test döngüsü yineleme ile çakışabilir veya spesifik kısmına karşılık gelebilir. Tipik olarak, test döngüsü belirli bir sistem düzeneği için gerçekleştirilir.

Yazılım ürününün yaşam döngüsü, nispeten kısa bir yinelemeden oluşur (Şekil 2). Yineleme, nihai ürünün veya kısaltılmış versiyonunun serbest bırakılmasına yol açan eksiksiz bir geliştirme döngüsüdür, bu da, sonunda, bitmiş bir sistem haline gelecek şekilde yinelemeden yinelemeden yayılır.

Her yineleme, kural olarak, iş planlaması, analiz, tasarım, uygulama, test ve elde edilen sonuçların değerlendirilmesi görevlerini içerir. Bununla birlikte, bu görevlerin oranları önemli ölçüde değişebilir. Yinelemelerdeki çeşitli görevlerin oranı doğrultusunda, aşamalar halinde gruplanırlar. İlk aşamada - başlangıç \u200b\u200b- ana dikkat, analiz görevlerine ödenir. İkinci aşama - gelişme yinelemelerinde - odak noktası, kilit proje kararlarının tasarım ve test edilmesidir. Üçüncü aşamada - Yapı, gelişme ve test görevlerinin en büyük payıdır. Ve son aşama - iletim - sistemi müşteriye test etme ve aktarma en yüksek görevlerine çözülür.

İncir. 2. Yazılım ürününün yaşam döngüsünün yinelemeleri

Her aşamada, ürün yaşam döngüsündeki kendine özgü hedefleri vardır ve bu hedefler elde edildiğinde yapıldığı kabul edilir. Tüm yinelemeler, olabilir, faz başlangıcın yinelemeleri, geliştirilen sistemin işleyiş sürümünü oluşturarak tamamlanır.

Test Kategorileri

Testler, yardımlarıyla çözülen görevlerde ve kullanılan tekniğe göre önemli ölçüde farklılık gösterir.

Test Kategorileri Açıklama Kategoriler Test Türleri
Mevcut Test Sistemin eklenen yeni özelliklerinin performansını belirlemek için yapılan bir test seti.
  • stres testi;
  • test iş çevrimleri;
  • stres testi.
Gerileme testi Regresyon testinin amacı, sistemin eklenmesinin yeteneklerini azaltmadığını doğrulamaktır, yani. Test, yeni özellikler eklemeden önce zaten tamamlanmış şartlara göre gerçekleştirilir.
  • stres testi;
  • test iş çevrimleri;
  • stres testi.

Alt kategori testi

Alt kategori testi Test tipinin açıklaması Alt türler testi
Stres testi Uygulama işlevleri dışında herkesi test etmek için kullanılır. Bu durumda, fonksiyon test dizisi önemli değildir.
  • fonksiyonel test;
  • arayüz testi;
  • test Veritabanı
Test İş Çevrimleri Uygulama işlevlerini kullanıcının çağrılarının sırasındaki test etmek için kullanılır. Örneğin, 1. çeyrek için tüm muhasebecilerin taklidi.
  • birim Testi (Modüler Test);
  • fonksiyonel test;
  • arayüz testi;
  • test Veritabanı.
Stres testi

Test için kullanılır

Uygulama performansı. Bu testin amacı, uygulamanın istikrarlı çalışmasının çerçevesini belirlemektir. Bu testle, mevcut tüm fonksiyonlar denir.

  • birim Testi (Modüler Test);
  • fonksiyonel test;
  • arayüz testi;
  • test Veritabanı.

Test Türleri

Birim testi (Modüler Test) - Bu tür, bireysel uygulama modüllerinin test edilmesini ifade eder. Maksimum sonucu elde etmek için, testler modüllerin gelişimi ile aynı anda gerçekleştirilir.

Fonksiyonel test - Bu testin amacı, test nesnesinin uygun şekilde çalışmasını sağlamaktır. Bir nesnenin doğru şekilde seyredilmesi, ayrıca verilerin girdi, işlenmesi ve çıktısı.

Test Veritabanı - Veritabanının performansını, uygulamanın normal çalışmasıyla, aşırı yükleme ve çok oyunculu modunda kontrol edin.

Birim testi

OOP için, modüler testlerin normal organizasyonu, her sınıfın yöntemlerini, ardından her bir paketin sınıfını test etmektir. Yavaş yavaş, tüm projeyi test etmeye dönüyoruz ve önceki testler regresyon türüdür.

Çıktı vergilerinde, test verileri test prosedürleri, giriş verileri, kod çalıştırma testi, çıktı içerir. Aşağıdakiler bir tür çıktı dokümantasyonudur.

Fonksiyonel test

Test nesnesinin fonksiyonel testi planlanır ve tanım aşamasında belirtilen test gereksinimlerine dayanarak gerçekleştirilir. Gereksinimler, işletme kuralları, kullanım kasaları, iş fonksiyonları ve ayrıca etkinlik çizelgeleri vardır. İşlevsel testlerin amacı, gelişmiş grafik bileşenlerinin temin edilen gereksinimlerin uyumunu kontrol etmektir.

Bu tip test tam olarak otomatikleştirilemez. Sonuç olarak, ayrılmıştır:

  • Otomatik test (çıktı bilgilerini kontrol edebileceğiniz durumlarda kullanılacaktır).

Amaç: Verilerin girişi, işlenmesi ve çıktısı;

  • Manuel test (diğer durumlarda).

Amaç: Kullanıcı gereksinimlerinin yürütülmesinin doğruluğunu test eder.

Aşağıdaki kriterlere göre, hem sadık değerleri hem de açıkça yanlış işleyişi doğrulamak için, hem sadık değerleri hem de açıkça yanlış kullanılmasını kullanarak, kullanım kasasının her birini yürütmek (oynatmak) gereklidir.

  • Ürün, girilen tüm verilere yeterince yanıt verir (beklenen sonuçlar doğru girilen verilere cevap olarak görüntülenir);
  • Ürün yanlış girilen verilere yeterince yanıt verir (uygun hata mesajları görünür).

Test Veritabanı

Bu testin amacı, veritabanlarına erişme yöntemlerinin, verilerin bütünlüğünü bozmadan, doğru yürütülmelerinde güvenilir olduğundan emin olmaktır.

Mümkün olan maksimum temyiz sayısını veritabanına sürekli olarak kullanmanız gerekir. Testin, tabanı "yükle", hem sadık değerler hem de açıkça hatalı bir şekilde "yüklenecek şekilde" bir şekilde derlendiği bir yaklaşım kullanılır. Veri girişindeki veritabanı yanıtı belirlenir, işlemlerinin zaman aralıkları tahmin edilir.

Test testlerinin teorisinin matematiksel temelleri

Test Görevleri Türleri

Büyük ölçüde farklı görev formu vardır: kapalı (test seçenekleri seçildiğinde) ve açık (konular bağımsız bir cevap alması gerekir). Açık görevler, sırayla iki gruba ayrılabilir:

    kısa bir düzenleyici cevabı olan görevler, ifadeler geliştirici tarafından planlanan sadece bir tane üretmeli, cevap;

    İçerik ve sunum formunda herhangi bir kısıtlamaya sahip olmayan serbestçe inşa edilmiş bir yanıtla görevler.

Beş temel görev türünü tahsis edin. Diğer tüm türler, bu beş tipte varyasyonlar veya kombinasyonlardır.

    Seçim ile görev. Görevin metni sorudan oluşur. Seçim için, bir veya daha fazla doğru olanlardan birkaç cevap sunulur.

    Eklemek için görev. Görevin formülasyonunda, metnin bir parçası, altı çizili (veya aynı uzunluktaki birkaç alt çizgiyi, cevapsız kelimeler biraz) gösterir. Atla metnin herhangi bir yerinde olabilir, ancak sonunda yapmanız önerilir. Cevap olarak, konu cevapsız kelimeleri yazmalıdır.

    Doğru diziyi ayarlamak.

    Uygunluk için görev.Görevin ifadesi iki liste içeriyor. Solda, kural olarak, sorunun formülasyonunu içeren setin elemanları, seçilecek sağ elementlere verilir. Sol setin elemanları, doğru, harflerle gösterilir. İkinci setin ilk setle karşılaştırıldığında daha fazla sayıda öğe içermesi arzu edilir. Bu durumda, ilk setin her bir elemanı, ikinci setin bir veya daha fazla öğesine karşılık gelir.

    Detaylı bir cevapla görev.

Geliştirme test aşamaları

    Çalışmanın amacı ve nesnesinin formülasyonu.

Kim ve neden test edilmeye tabidir?

    Testin geliştirilmesi.

Eğitim standardının gereksinimlerini incelemek, ders kitaplarının içeriği.

Çizim Testi Şartnamesi:

    Bölümlerin seçimi (konular) ve testlerinde yüzdeleri

    Görev türlerinin seçimi

    Mastering Bilgi ve Becerileri Düzeylerinin Belirlenmesi:

    Seviye 1

    Disiplinin temel kavramlarının tanımları ve ayrıca disiplin yöntemlerinin temel iddiaları

    2 seviye

    Temel formül ve algoritmaların bilgisi; Standart görevleri çözerken onları uygulama yeteneği

    3 seviye

    Atipik görevleri çözmek için kazanılan bilginin uygulanması

  1. Testte yaklaşık görev sayısının belirlenmesi ve bu sayının bir görev türüne göre dağılımı.

    Görevlerin gelişimi.

Testin ilk versiyonu, görevlerin eksikliklerini (önerilen dağıtıcı dahil) tanımlaması gerektiğinden, her görevde, yeterince yeterince kalması için en fazla sayıda dikkat dağıtıcı için mümkün oldu.

    Çiğ hamur muayenesi.

Sınavın amacı, yanlış ve anlaşılmaz ifadeleri tanımlamak ve düzeltmektir. Sonuç olarak, herhangi bir görev testten çıkarılabilir (bu nedenle, görevler önerilir).

    Onaylama.

    Görevlerin özelliklerinin hesaplanması ve test.

Test sonuçlarına göre, görevlerin ve testlerin aşağıdaki istatistiksel özellikleri hesaplanır.

Bireysel puan alanı Göstergenin tüm değerlerinin dağılımda değiştirildiği mesafeyi ölçer (bireysel noktalar).

Dan hızlı seçici(ortalama) Bireysel noktaların kombinasyonu için H. 1 , H. 2 , …, H. K. Gruplar K. Konular formül tarafından hesaplanır

.

Miktar dağılım Göstergenin her bir değerinin sapmalarını, dağıtımdaki ortalama aritmetikten hesaplamaya dayanarak:

.

Düşük dispersiyon, düşük test kalitesini gösterir, çünkü sonuçların zayıf bir varyasyonu, testlerin hazırlık seviyesi için zayıf bir farklılaşmayı gösterir. Aşırı yüksek dispersiyon, tüm öğrencilerin gerçekleştirilen görevlerin sayısında farklı olduğunda, test edilmesini gerektiren durumun karakteristiğidir.

Hamur güvenilirliğinin test özelliklerinin değerlendirilmesini tamamlar. Güvenilirlik katsayısını hesaplamak için formülü kullanabilirsiniz. cauder Richardson Katsayısı (yalnızca görevlerin tüm ağırlıkları birine eşit olduğunda):

.

Test güvenilirliğinin nitel bir değerlendirmesini sağlamak için aşağıdaki tabloyu kullanın:

Güvenilirlik katsayısının değeri

Güvenilirliğin Değerlendirilmesi

tatmin edici olmayan

tatmin edici

mükemmel

J Gerçek Görevinin Zorluğunun Değerlendirilmesi Formül tarafından hesaplanan

.

Görevin daha kolay olduğunu unutmayın, doğru cevapların oranı ( p. j.) Bu nedenle, bu payının görev kolaylığı olarak yorumlanması doğal olur. Dengeli bir testte, testin birkaç zor görevi, birkaç akciğer olması gerekir, ancak görevlerin kütlesi 0,3 ila 0.7 arasında zorluk çekmelidir; Aynı zamanda, WA'yı, zorluklarının sonucunun sırasına göre bulunması isteniyor.

Görev geçerlilik testi Konuların farklılaşma amacının görevine uygunluk derecesi ile belirlenir. Bunun için, testi boyunca puanla ilgili görevin korelasyon derecesinin katsayıları belirlenir. Bu, formül tarafından korelasyon katsayısı kullanılarak yapılır.

,

nerede X. bEN.  Test Puanı bEN.-Ho testi Y. bEN.  top bEN.- Görev için test edildi. Görevin dikotomu tahmini durumunda, katsayının hesaplanması biraz basitleştirilmiştir. Eğer bir r.< 0, то задание следует удалить из теста, т. к. в нем побеждают слабые ученики, а сильные выбирают неверный ответ либо пропускают задание при выполнении теста. Положительные значения, но близкие к нулю (незначимые), указывают на низкую прогностическую способность задания теста; такие задания требуют доработки содержания.

Konuları en iyi ve en kötü gösterilerde ayırt etme yeteneği farklılaşma yeteneğinin katsayısı (veya ayrımcılık endeksi) görevler. Böyle bir dizin hesaplamanın en kolay yolu, zıt grupların yöntemi olarak adlandırılır ve aşağıdaki gibidir. Tüm ders grubundan, en iyi testlerden bazıları test testine tahsis edilir (onlara güçlü bir alt grup olarak adlandırılır) ve aynı en kötü (zayıf alt grup). Ardından, bu alt grupların her biri için, alt gruptaki doğru cevapların oranı hesaplanır. Belirtmek p. 1 j. doğru cevapların oranı j.-E-Güçlü bir alt grupta ve aracılığıyla görev p. 0 j. - Zayıf bir alt gruptaki doğru cevapların oranı. Sonra ayrımcılık endeksi bEN.Görev, formül tarafından belirlenir:

(r. dis) j. \u003d P. 1 j.p. 0 j. .

Tüm güçlü testlerin başa çıktığı ve zayıf olmayan görev için, ayrımcılık endeksi başa çıkmadı r. Disk 1 olacaktır; Bu durumda, görevin maksimum farklılaşma etkisine sahiptir. Tüm zayıf testlerin başa çıktığı görev için, tek bir güçlü değil, ayrımcılık endeksi -1'e eşit olacaktır. Diğer durumlarda, endeks -1 ile 1 arasında değerler alacaktır. Görevler, ayırt edici endeksin sıfır ve negatif değeri düşük farklılaştırılmış öğrencilerdir, bu nedenle testten kaldırılmaları gerekir. Endeks pozitif ise, ancak 0.2'den azsa, böyle bir görev içeriğin dikkatlice analizini gerektirir.

Bu özelliklere göre, bazı görevler, düzeltmeye tabi olan testten çıkarılabilir. Bundan sonra, 5, 6 arasındaki adımlar tekrarlanmalıdır.

Tahmin etme olasılığını hesaplamak için formüller

Testi çizerken, her bir soruya, başarılı bir şekilde geçen test olasılığının doğru cevapları tahmin edilmesi, 0.05'ten az (yani% 5'ten az) olduğu için kaçının kaçının sunulması gerektiğini belirlemek gerekir. Test daha az değilse, test etme başarıyla geçilecektir. S.% soru. Test varsa N. Sorular, sonra aşağıdaki formül, "başarılı tahmin" olasılığını hesaplamak için kullanılır:

,

nerede m. - Her soruya sunulan cevap sayısı.

Farklı görevlerde sorulara sunulan cevapların sayısının farklı olduğu durumlarda, formül daha karmaşık bir görünüme sahiptir:

,

nerede - Cevaplarını tahmin etme olasılığı j. aşağıdaki gibi hesaplanan sorunlar. Testteki tüm soruların ayrılmasına izin verilemez r. Aynı grup aynı grup aynı olasılığı ile birleştirilir. İfade etmek p. bEN. , 0< p. bEN. <1 - вероятность угадывания и k. bEN. - İçindeki soru sayısı bEN.- bu grup (
), ve

.

Bundan dolayı j. dan
n'ye:

,

nerede t. r. = j.  (t. 1 + t. 2 +…+ t. r. -1) ve eğer t. r. > k. r. O zaman düşüneceğiz
= 0 .

Örnekler.

N \u003d 10, q \u003d 2/3: m \u003d 2, p<0,2; m=3, P<0,02; m=4, P<0,004

Edebiyat

    Chelyskova M. B. Pedagojik Testler Tasarlama Teorisi ve Uygulaması: Öğretici. - m.: Logolar, 2002. - 432 p.

    Malygin A.A., Svettsov V., GSYNICINA S. V. Kontrol ve ölçüm malzemelerinin hazırlanması için pratik öneriler: Yöntem. Manuel / Ivan. Durum HIM.-TEHNOL. un-t. - Ivanovo, 2005. - 30 s.

    Bir Test Nasıl Yapılır // Sleayer K. Matematiksel Fantezi. - m.: Mir, 1993. - s.116-118.


Temel Sorular: Bir ölçüm aracı olarak test edin. Ana test teorileri. Fonksiyonlar, yetenekler ve test sınırlamaları. Personel değerlendirmesinde testlerin kullanımı. Testlerin kullanımının avantajları ve dezavantajları. Test görevlerinin formları ve türleri. Bir görevi inşa etmek için teknoloji. Test kalitesinin değerlendirilmesi. Güvenilirlik ve geçerlilik. Test testleri için yazılım. 2.




Ölçüm Aracı olarak test test Testolojideki temel kavramlar: Ölçüm, test, içeriği ve görevlerin şekli, güvenilirlik ve ölçüm sonuçlarının geçerliliği. Buna ek olarak, testoloji bu tür istatistik bilimi kavramlarını seçici ve genel agrega, ortalama göstergeler, varyasyon, korelasyon, regresyon vb. 4 olarak kullanır. 4




Test görevi, içeriğin (veya tek boyutlu), içerik ve mantıksal doğruluğun doğruluğunu, formun doğruluğunun gereksinimlerini karşılayan testin bir parçası olan didakik ve teknolojik olarak etkili bir kontrol malzemesidir. Geometrik görüntü görüntüsünün kabul edilebilirliği. 6.




Geleneksel test, hazırlığın seviyesini ve yapısını teşhis etmek için standart bir yöntemdir. Böyle bir testte, tüm konular aynı koşullarda aynı koşullarda ve cevapları değerlendirme kuralları ile aynı görevlere cevap verir. Test hedefine ulaşmak için sayısız test oluşturabilirsiniz ve hepsi görevin başarısına karşılık gelebilirler. sekiz


Profesyonel (Lat. Professio uzmanlık + gramma rekoru), bu mesleği ve bu mesleğin veya çalışanın uzmanlığı tarafından uygulanan kural ve gereksinimlerin bir listesini içerir. Özellikle, profesyonel, belirli profesyonel grupların temsilcilerinin yapılandırılması gereken psikolojik özelliklerin bir listesini içerebilir. dokuz


İlk bilimsel çalışmaların test teorisi konusundaki ilk bilimsel çalışmaların, yirminci yüzyılın başında, psikoloji, sosyoloji, pedagoji ve diğer, sözde davranış bilimleri kavşağında ortaya çıktı. Yabancı psikologlar bu bilimi psikometrik (psikometrik) ve öğretmenler - pedagojik ölçümlerle (eğitim ölçümü) çağırır. Harmansız ideoloji ve politika, "Testoloji" unvan adının yorumlanması basit ve şeffaftır: Test Bilimi. 10


İlk aşama arka plandır - Antika'dan XIX yüzyılın sonuna kadar, kıyaslama, bilgi kontrolü ve yeteneklerinin dağıtıldığı; Klasik olan ikinci dönem, 20'sinin başından 60'ların başından itibaren, klasik testlerin oluşturulduğu 60'ların sonuna kadar devam etti; Üçüncü periyod, 70'lerden başlayan teknolojik - uyarlanabilir test ve öğrenme metodolojilerinin geliştirilmesi, testlerin etkili gelişimi için metodoloji ve ölçülen gizli kalite için konuların parametrik bir değerlendirmesi için test görevleri için metodolojidir. onbir


Testlerin seçilmesi sırasında kullanılan testlerin, yetenek ve kısıtlamaları, bir adayın psikolojik bir portresini elde etmek, yeteneklerinin yanı sıra profesyonel bilgi ve becerileri değerlendirin. Testler, adayları kendi aralarında veya referanslarla karşılaştırmanıza izin verir, yani ideal bir aday. Testler, çalışmanın etkin performansı için gerekli kişinin niteliklerini ölçmek için kullanılır. Bazı testler, işverenin kendisinin test edilmesini ve sonuçları hesapladığı şekilde düzenlenir. Diğerleri, uygun kullanımlarını sağlamak için deneyimli danışmanların hizmetlerini gerektirir. 12


Testlerin kullanımına ilişkin kısıtlamalar, pahalı idareleriyle ilişkilidir; - insan yeteneklerini değerlendirmek için uygunluk; - Testler, kısa süreli mesleki görevleri içeren işteki başarıyı tahmin etmek için daha başarılıdır ve işyerinde çözülen görevlerin birkaç gün veya hafta içinde işgal ettiği durumlarda çok uygun değildir. 13








2. Kullanılan terminoloji, belirli hedef kitlende seçilmelidir. Ayrıca, bazen katılımcıyı karıştırıp yorumlamayı zorlaştırırken, iki veya daha fazla soru içeren gereksiz makaleleri veya eşyaları hariç tutmak gerekir. 17.


3. Tüm bu gereklilikleri karşılamak için, makalenin tüm sayısını makalenin makalesi tarafından görmeli ve her birinin her birinin hangi amacını analiz etmelisiniz. Örneğin, test, stajyerlerin analitik yeteneklerini ölçmek için geliştirilirse - Muhasebeciler, bu durumda "analitik yetenekler" kavramını ifade etmeyi düşünmeye değer. onsekiz




5. Sayma sonuçlarının soruları ve formatları seçildiğinde, açıkça yazılı talimatlar ve sorular içeren, kullanan dostu bir formata dönüştürülmeleri gerekir; örnekler; Böylece test adayları tam olarak gerektiğini anladılar. yirmi


6. Çok sık bu aşamada, testte gelişme, gerektiğinden daha fazla soru içermektedir. Bazı tahminlere göre, son testte veya ölçüm sisteminde üç kat daha fazla. Ardından, ilk ölçü, tüm soruların kolayca anlaşıldığından emin olmak için mevcut çalışanların sayısından nispeten geniş bir numune üzerinde geliştirilen testin testi olacaktır. 21.


7. Bilgi tanımındaki testler genellikle sonuna kadar yavaş yavaş karmaşık bir şekilde basit sorularla başlar. Testler, sosyal tutumları ve kişisel özellikleri ölçmek için tasarlandığında, kötü niyetli cevapları önlemek için olumsuz ve pozitif formüle edilmiş eşyaları alternatif olmak faydalı olabilir. 22.


8. Son adım, bir seçim aracı olarak kullanmadan önce bile yürütme, güvenilirlik ve geçerlilik kurallarını belirlemek için geniş bir temsili numune üzerindeki testin kullanımıdır. Ek olarak, nüfusun herhangi bir alt grubunu ayrım yapmadığından emin olmak için testin adaletinin belirlenmesi gerekir (örneğin, etnik farklılıklar). 23.


Test kalitesi değerlendirmesi, seçim yöntemlerinin oldukça etkili olması için güvenilir, geçerli ve güvenilir olması gerekir. Seçim yönteminin doğruluğu, ölçümdeki sistematik hataların tutarsızlığı, yani farklı koşullar altında tutarlılığı ile karakterize edilir. 24.


Uygulamada, farklı günlerde gerçekleştirilen iki veya daha fazla benzer testin sonuçlarını karşılaştırarak yargılara yargılanırken güvenilirlik elde edilir. Güvenilirliği artırmanın bir başka yolu, birkaç alternatif seçim yönteminin sonuçlarının (örneğin, bir test ve konuşma) karşılaştırılmasıdır. Sonuçlar benzerse veya aynı ise, doğru olarak kabul edilebilir. 25.


Güvenilirlik, gerçekleştirilen ölçümlerin, önceki kişilerle aynı sonucu vereceği anlamına gelir, yani üçüncü taraf faktörler sonuçları etkilemez. Geçerlilik, bu yöntemin tam olarak ne amaçlandığını ölçtüğü anlamına gelir. Bilimsel araştırmalarda özel olarak geliştirilen tekniklerle elde edilen maksimum bilgi doğrultusunda teknik faktörlerle sınırlıdır ve 0.8'i geçmez. 26.


Uygulamada, personelin seçimi, çeşitli değerlendirme yöntemlerinin güvenilirliğinin: 0.1 - 0.2 - geleneksel görüşme; 0.2 - 0.3 - Öneriler; 0.3 - 0.5 - Profesyonel testler; 0.5 - 0.6 - Yapılandırılmış bir görüşme, yetkinliklerde röportaj; 0.5 - 0.7 - Bilişsel ve kişisel testler; 0.6 - 0.7 - Yeterlilik yaklaşımı (değerlendirme - merkez). 27.


Madde altında, bu sonuç, bu sonuç, yöntem veya kriter ", insanın test edilen gelecekteki etkinliğini" tahmin ediyor. Yöntemlerin geçerliliği, prosedürün veya başka bir prosedüre dayanarak yapılan sonuçlarla ilgilidir. Yani, seçim yöntemi kendi başına güvenilir olabilir, ancak belirli bir görevi karşılamak için değil: bu durumda neyin gerekli olduğunu ölçmedi. 28.


Yurtiçi uygulamalardaki testlerin geliştirilmesi için yazılım Psikodiagnostik modül, örneğin, "1 C: Maaş ve Personel Yönetimi 8.0" Programı, Psikodiagnostik Modül ile birlikte, Kişilik Bölümü Grubu ile birlikte geliştirilen psikodiagnostik modül ile çeşitli entegre programlar sundu. Psikoloji ve Psikoloji Fakültesi Genel Psikolojisi Moskova Devlet Üniversitesi M. V. Lomonosov, Psych köyünün liderliğinde. Bilimler, Prof. A. N. Guseva. Personel değerlendirme sistemlerinin gelişimi için eğitim simülatörü ve Psikoloji Fakültesi TSU Fakültesi Test Tekniklerinin Test Teknolojilerinin, Şirket'in yazılım şirketi tarafından "1 C: Kurumsal 8.2" temelinde geliştirilmesi. 29.


Edebiyat: Seçim ve İşe Alma Çalışanı: Test ve Değerlendirme Teknolojileri / Dominik Cooper, Ivan T. Robertson, Gordon Tinline. - M., Ed - "Üstte, - 156 s. Profesyonel Faaliyetlerin Psikolojik Desteği: Teori ve Uygulama / Ed. Prof. G. S. Nikiforova. - SPB.: Konuşma, - 816 p. otuz

Bölüm 3. İstatistiksel İşleme Testi Sonuçları

Test sonuçlarının istatistiksel olarak işlenmesi bir yandan, nesnel olarak, diğerinin sonuçlarını nesnel olarak tanımlamak - testin kalitesini değerlendirmek, test görevlerini, özellikle güvenilirliğini değerlendirmek için. Güvenilirlik sorunu, klasik testler teorisinde çok dikkat edilir. Bu teori alaka düzeyi kaybetmedi ve şimdi. Görünüşe rağmen, daha modern teorilere rağmen, klasik teori konumunu korumaya devam ediyor.

3.1. Klasik test teorisinin temel hükümleri

3.2. Matris test sonuçları

3.3. Test noktaları grafik sunumu

3.4. Merkez Eğilim Önlemleri

3.5. NORMAL DAĞILIM

3.6. Dispersiyon Test Noktaları Testi

3.7. Korelasyon matrisi

3.8. Test güvenilirliği

3.9. Test geçerliliği

EDEBİYAT

Klasik test teorisinin temel hükümleri

Klasik Test Teorisinin Yaratıcısı (Klasik Zihinsel Testler Teorisi), Tanınmış Bir İngiliz Psikoloğu, Faktör Analizinin Yazarı, Kazanma Edward Spearman (1863-1945) 1. 10 Eylül 1863'te doğdu ve hayatının dörtte biri İngiliz ordusunda servis edildi. Bu nedenle, sadece 41 yaşında Felsefe Doktoru derecesini aldı. Partspirman'ın tez çalışması, Wilhelm Wundt (Wilhelm Wundt) rehberliğinde deneysel psikolojinin Leipzig laboratuarında yapıldı. Bu dönemde Francis Galton (Francis Galton), insan zekasını test etmek için Ch.Pirman (Francis Galton) üzerinde güçlü bir etkiydi. Öğrenciler partspirman, R.Cattell ve D.Wechsler idi. Onun takipçileri arasında A.Anastasi, J. P. Guilford, P.Vernon, C.Burt, A.Jensen aranabilir.

Louis Guttman, 1916-1987) 3'ün klasik test teorisinin gelişimine büyük katkı.

HAROLD GULLIXEN'in (GULLIKSEN H., 1950) 4'ün temel çalışmalarında ilk kez ilk defa klasik test teorisi ile doludur. O zamandan beri, teori biraz değiştirilmiş, özellikle matematiksel aparat iyileştirildi. Modern sunumdaki klasik test teorisi, Crocker L., Aligna J. (1986) 5'inde verilmektedir. Yurtiçi araştırmacılardan, ilk defa, bu teorinin açıklaması V.Avanesis (1989) 6'ya verildi. Chelyowkova'nın çalışmalarında. (2002) 7, testin kalitesinin istatistiksel olarak kanıtlanması hakkında bilgi sağlar.

Klasik test teorisi, aşağıdaki beş ana pozisyona dayanmaktadır.

1. Ampirik olarak elde edilen ölçüm sonucu (X), gerçek ölçüm sonucu (T) ve ölçüm hatalarının toplamıdır (E) 8:

X \u003d T + E (3.1.1)

T ve E değerleri genellikle bilinmemektedir.

2. Gerçek ölçüm sonucu, matematiksel bir beklenti olarak ifade edilebilir E (x):

3. Gerçek ve hatalı bileşenlerin bir dizi nesneye göre korelasyonu sıfırdır, yani ρ te \u003d 0.

4. Herhangi bir testin hatalı bileşenleri korelasyon yapmaz:

5. Bir testin hatalı bileşenleri, diğer testlerin gerçek bileşenleri ile ilişkili değildir:

Ek olarak, klasik testler teorisinin temeli iki tanımdır - paralel ve eşdeğer testlerdir.

Paralel testler gereksinimlere (1-5) uymalıdır (1-5), bir testin (t 1) gerçek bileşenleri, her iki testte de yanıt veren testlerin her bir örneğinde başka bir testin (T2) gerçek bileşenlerine eşit olmalıdır. T 1 \u003d T2 ve ek olarak, Dispersiyon S 1 2 \u003d S 2 2'ye eşit olduğu varsayılmaktadır.

Eşdeğer testler, birinin istisnası ile paralel testlerin tüm gereğine uymalıdır: bir testin gerçek bileşenleri, başka bir paralel testin gerçek bileşenlerine eşit olması gerekmez, ancak aynı sabiti üzerinde farklılık göstermelidir. dan.

İki testin eşdeğerlik durumu aşağıdaki biçimde kaydedilir:

c12, birinci ve ikinci testlerin sonuçlarındaki farklılıkların sabitidir.

Yukarıdaki hükümlere dayanarak, Test Güvenilirliği Teorisi 9.10'dur.

yani, elde edilen test noktalarının dağılması, gerçek ve hatalı bileşenlerin dispersiyonlarının toplamına eşittir.

Bu ifadeyi aşağıdaki gibi yeniden yazarım:

(3.1.3)

Bu eşitliğin sağ tarafı testin güvenilirliğidir ( r.). Böylece, testin güvenilirliği formda yazılabilir:

Bu formüle dayanarak, test güvenilirliği faktörünü bulmak için sonraki ifadeler vardı. Testin güvenilirliği önemli bir özelliğidir. Güvenilirlik bilinmiyorsa, test sonuçları yorumlanamaz. Testin güvenilirliği, doğruluğunu bir ölçüm cihazı olarak nitelendirir. Yüksek güvenilirlik, aynı koşullarda test sonuçlarının yüksek tekrarlanabilirliği anlamına gelir.

Klasik test teorisinde, en önemli sorun, konunun (T) gerçek test noktasını belirlemektir. Ampirik Test Noktası (X) birçok koşula bağlıdır - Görevlerin zorluğu, konuların hazırlık düzeyi, görevlerin sayısı, görev sayısı, test etme koşulları, vb. Güçlü, iyi eğitimli konular grubunda, test sonuçları genellikle daha iyi olacaktır. Gruptan daha zayıf bir şekilde hazırlanmış konular. Bu bağlamda, konuların genel popülasyonundaki görevlerin zorluğunun büyüklüğü konusu açık durumda kalmaktadır. Sorun, gerçek ampirik verilerin, konuların rastgele örneklerinde olmadığı konusunda elde edildiği gerçeğinde yatmaktadır. Kural olarak, bunlar, diğer gruplar için genellikle tekrarlanmayan koşullardaki öğretiler ve öğrenciler sürecinde kendileri aralarında oldukça güçlü bir şekilde etkileşime giren birçok öğrencidir.

Bulmak s e. Denklemden (3.1.4)

Burada, ölçüm doğruluğunun standart sapma değerinden bağımlılığını açıkça gösterir. s X. ve testin güvenilirliğinden r..

BİLDİRİ

Öğrenci 137 gr. Ivanova I.

eğitim tekniğinin etkinliğini kontrol etme hakkında
matematiksel istatistiksel yöntemleri kullanma

Rapor bölümleri, oyunun her aşamasının sonunda bu kılavuzda verilen numunelere uygun olarak yürütülür. Kredi raporları, sınavdan önce danışmadan önce biyomekanik bölümünde saklanır. İşe bildirmemiş olan ve öğretmene bir raporla bir defter teslim etmeyen öğrenciler, spor metrolojisindeki sınava girmesine izin verilmemektedir.


Ben iş oyunu sahne
Sporda Kontrol ve Ölçüm

Amaç:

1. Kendinizi, spor ve beden eğitiminde kontrol ve ölçümlerin teorik temellerini tanıtmak.

2. Sporcularda yüksek hızlı performansın becerilerini ölçün.

1. fiziksel olarak kontrol
Eğitim ve Spor

Beden eğitimi ve spor eğitimi kendiliğinden değil, yönetilen bir süreçtir. Her zaman, kişi, özellikle sağlık tarafından belirlenen belirli bir fiziksel durumda, (hayati faaliyetin göstergelerinin, organizmanın göstergelerinin, olağanüstü ani etkilere kadar sürdürülebilirlik derecesi), fiziğinin ve durumu fiziksel fonksiyonlar.

Bir kişinin fiziksel durumunu doğru yönde değiştirerek yönetmeniz önerilir. Bu yönetim, özellikle egzersizi tedavi eden fiziksel eğitim ve spor yoluyla gerçekleştirilir.

Sadece öğretmen (veya koç), bir sporcunun davranışını etkileyen fiziksel durumu yönetiyor, yani. Belirli bir egzersiz sunmanın yanı sıra, uygulamalarının doğruluğunu ve elde edilen sonuçları kontrol etmek. Aslında, sporcunun davranışları koçu yönetmiyor, ama sporcunun kendisi. Spor eğitimi sırasında, kendi kendini yönetme sistemi üzerindeki etkisi (insan vücudu) etkilenir. Sporcuların durumundaki bireysel farklılıklar, aynı etkinin aynı cevaba neden olacağına güvenmez. Bu nedenle, geri bildirim meselesi ile ilgilidir: Eğitim sürecinin kontrolü sırasında koça giren atletin durumu hakkındaki bilgiler.

Beden eğitiminde kontrol ve sporlar, göstergelerin ölçümlerine, en önemli şeylerin seçimine ve matematiksel işlemlerine dayanır.

Eğitim sürecinin yönetimi üç aşama içerir:

1) Bilgi toplama;

2) analizi;

3) Karar verme (planlama).

Bilgi toplama genellikle kapsamlı kontrol sırasında gerçekleştirilir, bunlar:

1) Rekabet Faaliyetleri;

2) Eğitim yükleri;

3) Atletin durumu.



Bir durumdan diğerine geçmek için gereken boşluğun süresine bağlı olarak üç tür bir atlet durumu vardır.

1. Farger (kalıcı durum. Kayıt etmek nispeten uzun -haftalar veya aylar. Bir sporcunun adım durumunun, spor başarılarının gösterilmesine olan yeteneklerini yansıtan kapsamlı bir karakteristik, hazırlığın hazırlığı ve optimum hali (bu eğitim döngüsü için en iyisi) denir - spor formu. Açıkçası, bir veya birkaç gün içinde, spor formunun durumu başarılamaz veya kaybedilemez.

2. Akım durum. Birinin etkisi altında değişir veya birkaç meslek. Genellikle, yarışmalara katılımın sonuçları veya bir eğitim çalışması masrafı birkaç gün gecikmelidir. Bu durumda, sporcu genellikle olumsuz doğanın (örneğin, kas ağrısı) ve pozitif (örneğin, yüksek performans hali) olgusunu not eder. Bu tür değişiklikler denir geri Çekme Eğitim Etkisi.

Sporcunun şu anki hali, en yakın eğitim oturumlarının niteliğini ve içerideki yüklerin büyüklüğünü belirler. Mevcut durumun özel bir durumu, rekabetçi egzersizin önümüzdeki günlerde maksimum yakınlığa yakın bir sonuçla gerçekleştirilmesiyle karakterize edilen özel bir durum mevcut hazırlık.

3. Operatif durum. Etkileyen değişiklikler bir defalık yürütme egzersiz ve geçicidir (örneğin, tek bir çalışma mesafesinin neden olduğu yorgunluk; bir ısınmadan sonra performanstaki geçici artış). Sporcunun operasyonel durumu, eğitim oturumu sırasında değişir ve yaklaşımlar, tekrarlanan yarışlar arasında rekreasyon aralıklarını planlarken, ek egzersizin fizibilitesinin fizibilasyonunu çözerken dikkate alınmalıdır. Bir operasyonel durumun özel bir durumu, maksimumun yakınına yakın bir sonuçla rekabetçi bir egzersiz yapmaya hemen hazırlıklıdır. operasyonel hazırlık.

Sınıflandırılmış sınıflandırma uyarınca tahsis edilir Üç ana izleme durumu türü:

1) faz kontrolü. Amacı, bir sporcunun aşamasını (hazırlık) değerlendirmektir;

2) akım kontrolü. Ana görevi, atletteki her gün (güncel) dalgalanmaları tanımlamaktır;

3) operasyonel kontrol. Amacı, şu anda Sporcu eyaletinin açık değerlendirmesidir.

Bir atletin durumunu veya yeteneklerini belirlemek için yapılan ölçüm veya testler denir hamur. Ölçüm veya test prosedürü test denir.

Herhangi bir test ölçümü içerir. Ancak herhangi bir ölçüm test olarak hizmet vermez. Sadece aşağıdaki metrolojiyi sağlayanlar test olarak kullanılabilir. gereksinimler:

2) standardizasyon;

3) Değerlendirme sisteminin kullanılabilirliği;

4) Güvenilirlik ve bilgilendirme (iyilik) testleri;

5) Kontrol türü (evre, akım veya operasyonel).

Motor görevlerine dayanan test motor denir. Üç motor test grubu vardır:

1. Bir sporcu yaparak kontrol egzersizleri, maksimum sonucu göstermek için bir görev alır. Testin sonucu bir motor başarısıdır. Örneğin, sporcunun 100 m'lik bir mesafe çalıştırdığı süre.

2. Standart fonksiyonel örnekler, görevin, herkes için de aynı olduğu, gerçekleştirilen işin büyüklüğüyle veya fizyolojik değişimlerin büyüklüğüyle dozu. Testin sonucu, standart çalışma veya motor başarılarına sahip fizyolojik veya biyokimyasal göstergelerdir. Fizyolojik değişimlerin standart büyüklüğüne sahiptir. Örneğin, 20 ağız kavgası sonrası kalp atış hızını veya atletin kalp atış hızının sabit değerinde geçtiği hızın yüzdesi, dakikada 160 atış hızı 160 atış.

3. Sporcunun maksimum sonucu göstermesi gereken maksimum fonksiyonel örnekler. Testin sonucu, maksimum çalışmada fizyolojik veya biyokimyasal göstergelerdir. Örneğin, maksimum oksijen tüketimi veya maksimum oksijen borcu miktarı.

Yüksek kaliteli testler, ölçüm teorisi hakkında bilgi içerir.