Universitatea de Stat de Tipografie din Moscova. Determinarea structurii testului. Dezvoltarea specificațiilor de testare Specificația de testare

Planificarea conținutului testului

Obiective specifice de învățare

Obiective de învăţare generalizate planificate de profesor	Exemple de obiective specifice de învățare atinse de elev
Cunoștințe la nivel de memorare și reproducere	Cunoaște semnificația termenilor folosiți, concepte și definiții de bază, formule, legi, principii
Cunoașterea la nivel de înțelegere	Înțelege și interpretează termeni, interpretează concepte și definiții, transformă materialul verbal în expresii matematice, interpretează materialul verbal în diagrame și grafice
Abilitatea de a aplica cunoștințele într-o situație cunoscută	Capabil să aplice termeni, concepte și definiții într-o situație familiară folosind un model, precum și formule, legi și principii într-o situație familiară
Abilitatea de a aplica cunoștințele într-o situație nefamiliară	Folosește legile și principiile în situații noi, transferă metode cunoscute în situații nefamiliare
Analiză	Vede erori și omisiuni în logica raționamentului, corectează enunțurile incomplete sau redundante ale problemelor, evidențiază presupuneri ascunse, distinge între fapte și consecințe.

După ce obiectivele de testare au fost determinate, tipul de test a fost selectat și abordările de creare a testelor au fost clarificate, dezvoltatorii trec la următoarea etapă - selectarea conținutului testului.

Întrucât funcția principală a testului este controlul asupra nivelului realizărilor educaţionaleîn anumite domenii de cunoștințe, materii și discipline, atunci testul ca instrument de măsurare trebuie să fie adecvat în raport cu materialul testat. Conținutul testului trebuie să corespundă în mod optim cu conținutul disciplinei academice. Pentru a realiza această corespondență, este necesar analizați conținutul subiectului, secțiunii, subiectului etc testat, evidențiați cel mai mult elemente importante care necesită testare, determinați ce cunoștințe și abilități în acest domeniu de conținut vor fi testate folosind sarcini de testare.

Pe baza analizei conținutului disciplinei se elaborează apoi un plan de testare. Dezvoltatorul trebuie să determine din câte părți (subteste) va consta testul, numărul planificat de sarcini și ce forme de sarcini de testare vor fi utilizate.

Planificarea unui test implică determinarea raportului dintre elementele de conținut și numărul necesar de sarcini pentru a le testa, care este determinat de semnificația și timpul alocat studiului.

Mai mult mod eficient planificarea testelor - atunci când nu sunt luate în considerare doar elementele de conținut, ci și tipurile de activități care sunt testate. În același timp, tipuri de activități, în funcție de nivelul de stăpânire a materialului educațional, sunt împărțite în reproductivă(cunoașterea definițiilor, formulelor, faptelor și folosirea cunoștințelor conform modelului) și productiv(aplicarea cunoștințelor într-o situație nefamiliară).

Fiecare test trebuie să fie însoțit specificație, aceste. descrierea acestuia, care indică scopurile testării, cui este destinat acest test, conținutul testului, procent teme pentru diferite secțiuni și tipuri de activități, formele de sarcini utilizate, timpul recomandat de finalizare. Specificația de testare este elaborată ținând cont documente de reglementareși standarde educaționale care sunt utilizate pentru a planifica conținutul testului. Structura testului din specificație este prezentată sub formă de tabel.

Nota. Luați în considerare exemple de specificații pentru discipline specifice: istorie, matematică, informatică etc.

Pe parcursul procesului de învățare, elevilor li se pot prezenta sarcini atât sub formă de teste, cât și nu sub formă de test (întrebări, sarcini, exerciții etc.) ca test de cunoștințe.

Din punctul de vedere al dezvoltatorului, sarcina de testare este prezentată ca o combinație de formă și conținut.

Forma este o modalitate de a exista și de a exprima conținutul, a cărui funcție principală este de a transmite subiectului de testare conținutul sarcinii cât mai clar și vizual posibil.

Combinația ideală de formă și conținut dă naștere unei sarcini de testare de înaltă calitate care poate evalua în mod adecvat cunoștințele subiectului de testare.

Această sarcină se caracterizează prin:

forma logică a enunțului;
concizia formulării;
forma optima de prezentare;
având un loc specific pentru răspunsuri;
adecvarea dispunerii elementelor sarcinii;
reguli comune de evaluare a răspunsurilor;
adecvarea instrucțiunilor la forma și conținutul sarcinii.

Pe baza formei lor, toate sarcinile de testare cunoscute în practică pot fi împărțite în patru grupuri principale: închise, deschise, secvențe și corespondență.

Formă închisă

Sarcinile din această formă se mai numesc și sarcini cu alegerea uneia sau mai multor concluzii corecte.

Constă dintr-o declarație de testare incompletă și un set de concluzii valide, dintre care una sau mai multe sunt corecte. Testerul determină concluziile corecte dintr-un set dat. Când aceste (sau acestea) concluzii sunt substituite în judecata de testare, aceasta dobândește completitudine și devine o afirmație adevărată.

Într-o formă închisă, răspunsurile nu pot fi toate adevărate sau toate false.

Exemple:

Noua pagina 1

Formular deschis

Are aspectul unui enunț incomplet în care unul sau mai multe elemente cheie(număr, literă, cuvânt). Răspunsul este formulat chiar de testatorul.

Exemple:

Noua pagina 1

Formular de conformitate

Se compune din două grupe de elemente și o formulare clară a criteriului de alegere a unei corespondențe între ele. Potrivirea poate fi unu-la-unu sau unu-la-mulți. Aceasta este determinată de numărul de conexiuni care mapează un element din primul grup la elementele celui de-al doilea. Pentru a complica alegerea răspunsului, sarcina de potrivire poate conține elemente suplimentare (alternative) care nu au o conexiune corespunzătoare.

Exemple:

Noua pagina 1

1) Corespondența dintre autori și lucrările acestora		2) Corespondența dintre autori și lucrările acestora
U. Eco	Numele lui Rose	B. Akunin	Carul cu diamante
F. Nietzsche	Așa a vorbit Zarathustra	B. Akunin	Iubitor de moarte
F. Dostoievski	Idiot	Osho	Proximitate
	Constiinta	Osho	Conștientizarea
	Război și pace	F. Nietzsche	Așa a vorbit Zarathustra
			Les Mizerabili

Vă rugăm să rețineți că, în acest exemplu, sarcina 1 este o sarcină de corespondență unu-la-unu cu două elemente alternative („Conștiință”, „Război și pace”), iar sarcina 2 este o „corespondență unu-la-mulți” cu o alternativă. element - „Les Misérables”.

numele testului;
algoritmi de testare (metoda de selectare a sarcinilor din bancă);
restricții de timp (absente, prezente, stabilite de testatorul);
informații speciale (afișarea timpului, sarcini de răspuns);
metode de evaluare a răspunsului la o sarcină;
scala de rating;
alcătuirea tematică a probei (unităţi didactice testate).

O specificație de testare este o descriere a acesteia care include informatiile necesare despre scopurile, obiectivele, planul și structura testului, precum și cerințele de bază pentru regulile de testare, prelucrare a rezultatelor testelor și interpretarea acestora. Pentru testele bazate pe criterii (CORT), pregătirea unei specificații detaliate este foarte importantă, deoarece selectarea conținutului este cea mai importantă etapă în crearea acestuia. Pentru a lua o decizie cu privire la atingerea unui anumit obiectiv de învățare (de exemplu, un standard de performanță), este necesar să se descrie suficient de precis și complet toate componentele acestui standard și să le exprime într-un set de sarcini care ar fi reprezentative pentru acest scop.

Pentru a fi siguri că toate obiectivele educaționale semnificative vor fi incluse în testul în curs de dezvoltare, este alcătuit un tabel special, care se numește matricea tehnologiei .

Conținutul rândurilor matricei tehnologice sunt domenii, secțiuni, subiecte educaționale, coloanele matricei sunt completate în funcție de relația dintre obiectivele educaționale de diferite niveluri și ierarhia acestora. Numărul total de întrebări incluse în gama de sarcini de testare trebuie distribuit astfel încât să reflecte importanța lor - „greutatea” anumitor acțiuni mentale și nivelurile acestora sau volumul și cantitatea de timp de studiu alocat studierii materialului testat. La compilarea unei matrice pentru orice subiect de testare, dezvoltatorul trebuie să se asigure că întregul subiect este acoperit de întrebările propuse. Conținutul subiectului trebuie să fie complet „acoperit” de matrice pe toate subiectele. Dacă testarea are loc pe persoană materii academice, atunci în acest caz este necesar ca toate secțiunile sale să fie acoperite de întrebările de test.

De exemplu, în testul elaborat pentru monitorizarea internațională a învățământului de matematică - T1M85, testarea realizărilor educaționale ale elevilor are ca scop atât evaluarea stăpânirii elementelor de conținut selectate, cât și evaluarea tipurilor de activități educaționale și cognitive pe care elevii care au absolvit un curs de matematică. în clasele a IV-a şi a IV-a trebuie să demonstreze. În consecință, autorii testului au identificat blocuri de conținut care reflectă complexitatea specifică a matematicii studiate la aceste grupe de vârstă educațională. Așadar, față de clasa a VIII-a, la juniori se acordă mult mai multă atenție temei „Numere”. În clasa a VIII-a, algebra și geometria sunt discipline școlare separate, deci sunt desemnate ca unități de conținut separate. În același timp, în clasa a IV-a, se studiază un curs general de matematică, astfel încât diagnosticarea realizărilor educaționale ale elevilor de clasa a IV-a este axată pe cele mai simple forme geometrice și măsurători ale elementelor acestora, precum și pe ideile inițiale despre concepte algebrice. (de exemplu, despre secvențele de numere), care sunt incluse în subiectul „Numere”. În clasa a IV-a, tema „Prezentarea datelor” este axată pe diagnosticarea capacității de a înțelege și reprezenta conditii usoareși relațiile originale ale problemei, iar întrebările legate de subiectul „Probabilitatea” nu sunt abordate deloc. Totodată, în clasa a VIII-a se pune accentul pe evaluarea abilității de interpretare a datelor și stăpânirea conceptelor inițiale ale teoriei probabilităților, clasificate la secțiunea „Șanse”.

Tipurile de activități educaționale și cognitive sunt aceleași pentru clasele a IV-a și a VIII-a, deoarece reflectă procese cognitive caracteristice la aplicarea matematicii în diferite situații în școlile primare și gimnaziale. Autorii testului au inclus cunoștințe, aplicare și raționament.

Prima activitate, cunoașterea, se concentrează pe cunoașterea de către elev a faptelor, conceptelor și procedurilor necesare. Spre deosebire de cerința obișnuită a școlii ruse numai pentru cunoașterea faptelor, în „PMZB acest tip de activitate este asociat cu utilizarea algoritmilor și metodelor standard în situații standard (de exemplu, adăugarea a două fracții, împărțirea unui număr într-un anumit număr). raport, rezolvând o ecuație liniară standard).

Categoria „cunoștințe” include cunoașterea limbajului matematicii și faptele și proprietățile matematice care stau la baza gândirii matematice. Cu cât un elev poate reproduce mai multe cunoștințe, cu atât este mai largă gama de concepte pe care le deține, cu atât este mai mare capacitatea sa potențială de a face față diferitelor probleme care necesită utilizarea matematicii.

Activitățile asociate categoriei „cunoaștere” includ reproducerea, recunoașterea, calculele, extragerea informațiilor, utilizarea dispozitivelor de calcul și a instrumentelor de măsură, clasificarea obiectelor matematice (corpuri, figuri geometrice).

A doua activitate, aplicarea, se concentrează pe capacitatea elevilor de a aplica conceptele învățate pentru a rezolva probleme și a răspunde la întrebări care implică în primul rând situații de învățare familiare sau ușor modificate.

Al treilea tip de activitate - raționamentul - depășește clar rezolvarea problemelor standard și este asociat cu aplicarea cunoștințelor într-o situație nefamiliară, cu rezolvarea unor probleme complexe și în mai multe etape. Caracteristicile activității din grupa „aplicații” la matematică pot fi caracterizate ca alegerea unei metode productive sau a unei strategii de rezolvare a unei probleme.

Raționamentul implică o varietate de activități, fiecare dintre acestea fiind un rezultat semnificativ al învățării și contribuie la dezvoltarea unui stil de gândire mai generalizat. De exemplu, raționamentul implică capacitatea de a observa, de a trage consecințe logice bazate pe presupuneri și reguli și de a explica rezultatele. Sarcinile de raționament includ sarcini de generalizare, care vă cer să extindeți sfera în care rezultatele raționamentului matematic și ale rezolvării problemelor pot fi aplicate prin formularea rezultatelor în termeni mai generali. De exemplu, se propune o problemă în care se dă o succesiune de numere: 1, 4, 7, 10. Se cere să se descrie matematic sub formă de formule relația dintre fiecare membru al șirului și membrul care îl urmează. Răspunsul corect este n + 3.

Rezultatul unei analize detaliate a conținutului și a tipurilor de activități este un tabel care reflectă caracteristicile structurii testului pentru diferite grupuri educaționale și de vârstă (Tabelul 8.1).

Tabelul 8.1. Distribuirea sarcinilor V teste de matematică TIMSS

La elaborarea unui test, este necesar să se asigure că conținutul corespunde formelor sarcinilor de testare utilizate și, de asemenea, să se asigure varietatea posibilă a unor astfel de forme. Nu trebuie să uităm că diferitele forme de sarcini sunt potrivite pentru diferite elemente ale conținutului testat. Pentru definiții complexe, verificarea înțelegerii material de fapt- sarcini cu răspunsuri alternative, pentru cunoașterea datelor - sarcini de restabilire a secvenței. Pentru capacitatea de a distinge organele sau sistemele lor în anatomie, compuși chimici în chimie, foneme în nativ sau limba straina, stiluri arhitecturaleîn istoria artei se folosesc sarcini de identificare.

De asemenea, trebuie luat în considerare faptul că atunci când se utilizează un test construit pe sarcini de un tip, există posibilitatea ca abilitatea elevilor de a lucra cu această formă particulară de sarcini să fie obținută ca componentă principală a punctajului final. Acei studenți care se adaptează mai repede la ea, pentru care această formă se dovedește a fi cea mai familiară, vor primi avantaje semnificative. Acest lucru poate fi evitat prin utilizarea sarcinilor diverse tipuri. În sfârșit, sarcinile diferite tipuri face testarea mai variată din punctul de vedere al subiecților, ceea ce vă permite să împingeți înapoi pragul de apariție a oboselii și, ca urmare, să alocați mai mult timp pentru testare.

Un aspect important al testului în curs de dezvoltare este abordarea evaluării rezultatelor acestuia. De obicei, întrebările testului sunt punctate dihotomic: fie un punct (adevărat), fie zero (fals). Cu toate acestea, unele întrebări necesită mai multă codare fracțională - polimetrică. Este necesar să se țină cont de faptul că răspunsul la o întrebare gratuită în sarcini de tip deschis poate fi incomplet, dar în același timp semnificativ. Considerarea unui astfel de răspuns ca fiind incorect (cu un scor zero) va fi nedrept. Prin urmare, pentru a evalua cel mai mult probleme complexe Testul folosește un model de notare parțială, care vă permite să faceți diferența între răspunsurile corecte complete și incomplete. Un răspuns corect complet primește două puncte, un răspuns incomplet primește un punct. Această procedură notarea este utilizată pe scară largă în testarea realizărilor și este într-un fel de preferat deoarece ține cont mai mult de informațiile conținute în răspuns. De exemplu, deja în testele TIMSS menționate mai sus, sunt date următoarele explicații pentru evaluarea performanței sarcinilor matematice cu un răspuns scurt și complet.

Un răspuns detaliat, în valoare de două puncte, este complet și corect. Răspunsul demonstrează o înțelegere completă a conceptelor și (sau) metodelor matematice necesare pentru a rezolva problema:

- răspunsul arată că elevul a îndeplinit în totalitate sarcina și a folosit metodele matematice corecte;
- răspunsul conține o explicație sau o justificare clară și completă și/sau o soluție adecvată atunci când este necesar.

Un răspuns extins în valoare de un punct este parțial corect. Răspunsul demonstrează doar o înțelegere parțială a conceptelor și (sau) metodelor matematice necesare pentru a rezolva problema, în timp ce:

- doar unele condiţii ale problemei sunt corect luate în considerare, dar soluţia fie este incompletă, fie conţine erori în utilizarea anumitor metode sau în înţelegerea conceptelor;
- se poate da răspunsul corect dacă explicația sau soluția este incorectă sau inadecvată, soluția și (sau) explicația nu este dată deloc, deși este cerută de termenii sarcinii;
- Pot exista erori în soluție, dar se folosesc metode matematice adecvate.

Un răspuns cu scorul zero este complet incorect, irelevant sau inconsecvent.

Când se evaluează finalizarea unei sarcini cu răspuns scurt, se folosesc scale de două puncte, nu de trei puncte. Un răspuns în valoare de un punct este corect un răspuns în valoare de zero puncte este complet incorect, inadecvat sau inconsecvent. O abordare similară a evaluării a fost implementată în testele PISA.

Interpretarea rezultatelor testelor de performanță nu ar trebui să se limiteze doar la înregistrarea nivelului de cunoștințe sau abilități măsurate. Este important atât pentru dezvoltatorii, cât și pentru utilizatorii de teste să înțeleagă semnificația anumitor rezultate educaționale pentru perspectivele viitoare (nu doar educaționale), atât pentru elevii înșiși, cât și pentru societatea în care vor trăi și vor lucra.

Un exemplu de interpretare în context larg a realizărilor educaționale (în cazul evaluării competenței de citire) îl reprezintă următoarele caracteristici ale grupurilor de cititori cu diferite niveluri identificate prin testul de competență în citire din programul PISA. Astfel, cititorii care au ajuns la a 6-a etapă de cel mai înalt nivel sunt considerați cititori de înaltă competență. Capacitatea lor de a extrage informații noi din text și de a gândi critic despre acestea este extrem de valoroasă pentru societatea modernă; unde este dezvoltarea economică şi structura sociala depinde de capacitatea de a îmbunătăți și de a lua decizii bazate pe luarea în considerare a tuturor informațiilor disponibile. Cititorii etapei a 5-a a acestui nivel sunt pregătiți pentru educație ulterioară și pot deveni printre profesioniștii de talie mondială. Cititorii care au atins nivelul 4 nivel înalt alfabetizarea citirii, și-au demonstrat capacitatea de a învăța cu ajutorul textelor, dobândind nu numai cunoștințe cotidiene, comune, ci și cunoștințe formale, de specialitate. Cititorii intermediari demonstrează o formă rudimentară a capacității de a învăța din texte. Ei sunt capabili să navigheze în situații noi de zi cu zi cu ajutorul textelor. Cititorii care nu au atins acest nivel pot întâmpina dificultăți în sarcinile de zi cu zi (personale, sociale, de afaceri și educaționale) care necesită cunoștințe minime de citire. Nivelul mediu de alfabetizare în lectură este considerat „condiția de prag pentru funcționarea cu succes a unui adult modern în viața de zi cu zi sunt identificate încă două niveluri sub-prag (1a și 16), indicând probleme serioase în formarea competenței de citire”.

Pe măsură ce se dezvoltă itemii de testare, se determină opțiuni pentru evaluarea și interpretarea lor, se pregătește o specificație, care este un fel de termenii de referință la text. Acesta include scurtă descriere aria de conținut pentru care testul este destinat studiului, mostre ale sarcinii, stimuli-semne ale criteriului, răspunsuri tipice pe care subiecții le pot da într-o situație de testare.

Mayorov L.P. Teoria și practica creării de teste pentru sistemul de învățământ. Cum să selectați, să creați și să utilizați teste în scopuri educaționale. M., 2000.
Abordări conceptuale pentru evaluarea realizărilor educaționale în matematică și știință în studiul comparativ internațional TIMSS / Kovaleva G. S. [et al.| M.. 2008. URL: hUp://enteroko.ru/public.htm
Tsukerman G. A. Capacitatea de citire a studenților ruși: materiale pentru discuții. M., 2010. URL: strategy2020.rian.ni/load/366070484

specificație funcțională produs, cerințele produsului sunt sursa primară care determină ce teste vor fi dezvoltate. Pentru fiecare cerință sunt scrise una sau mai multe teste, care împreună ar trebui să verifice îndeplinirea acestei cerințe în produs.

Să fie dat următorul fragment dintr-un set de cerințe pentru modelul de schimb de tranzacții:

Funcția DoTransaction trebuie să accepte o adresă și date în conformitate cu parametrii, să creeze un nou element în coadă, să completeze partea de adresă și o parte a câmpurilor de date cu informațiile transferate și să inițieze o tranzacție.
Funcția DoAddressTenure trebuie să accepte o adresă în conformitate cu parametrii, să creeze un nou element în coadă și să completeze partea sa de adresă
Funcția DoDataTenure trebuie să primească date în conformitate cu parametrii, să găsească primul element din coadă cu câmpuri de date parțial goale, să îl completeze cu informațiile transmise și să inițieze o tranzacție

O descriere conceptuală a unei suite de teste care verifică o specificație ar putea arăta astfel:

Apelați DoTransaction cu adresa și datele. Verificați dacă un alt element să apară în coadă. Verificați dacă pe autobuz apare o tranzacție cu adresa și datele corecte.
Apelați DoAddressTenure cu adresa. Verificați dacă un alt element să apară în coadă. Verificați dacă nu există nicio tranzacție nouă în autobuz.
Apelați DoDataTenure cu date. Verificați dacă câmpurile de date sunt completate. Verificați dacă pe autobuz apare o tranzacție cu adresa și datele corecte

Scenarii de testare

Elaborarea de teste bazate pe utilizarea scenariilor se realizează conform următoarei metodologii:

Este definit un model de utilizare, incluzând mediul de operare al produsului și „actorii”. Un actor poate fi un utilizator, un alt produs, o piesă hardware etc., adică orice cu care produsul comunică. Împărțirea în mediu și actori este arbitrară și servește pentru a descrie modalitățile optime de utilizare a produsului.
Scenarii de utilizare a produsului sunt în curs de dezvoltare. Descrierea scenariului, în funcție de produs și de abordarea aleasă, poate fi strict definită, parametrizată sau permite un anumit grad de incertitudine. De exemplu, descrierea scriptului în limbajul MSC permite definirea scripturilor parametrizate cu posibilitatea de a reordona evenimente.
Este dezvoltat un set de teste care acoperă scenarii specificate. Luând în considerare gradul de incertitudine inerent scenariului, fiecare test poate acoperi un scenariu, mai multe scenarii sau, dimpotrivă, o parte a scenariului.

Utilizarea scripturilor nu necesită complet specificație formală cerințe, dar poate necesita mai mult timp pentru dezvoltare și analiză.

O altă caracteristică testarea scriptului este că această metodă direcționează testarea pentru a testa modele specifice de utilizare ale produsului, ceea ce îi permite să găsească defecte pe care metoda de testare a cerințelor le-ar putea rata.

Un exemplu de utilizare a specificațiilor cerințelor pentru dezvoltarea testelor.

Deci, pentru exemplul discutat mai sus, este posibil să creați următorul script și teste.

Scenariu: utilizatorul are două fire de control independente, dintre care unul este responsabil pentru generarea de tranzacții complete prin DoTransaction , iar celălalt este responsabil pentru colectarea tranzacțiilor din partea de adresă și partea de date atunci când aceste informații provin din surse diferite. Deci, al doilea thread folosește apeluri la DoAddressTenure și DoDataTenure.
Descrierea testelor: Apelați DoAddressTenure cu adresa A1, apelați DoTransaction cu adresa A2 și datele D2, apelați DoDataTenure cu datele D1. Verificați apariția secvențială a două tranzacții pe autobuz: (A1, D1) și (A2, D2)

La efectuarea acestui test, s-a descoperit, în special, că funcția DoTransaction a fost implementată prin apeluri către DoAddressTenure și DoDataTenure, ceea ce a dus la apariția tranzacțiilor de forma (A1, D2) și (A2, D1) pe magistrală. Un astfel de defect poate fi dificil de detectat dacă testele sunt dezvoltate numai pe baza specificațiilor cerințelor.

Dezvoltare manuală a testelor

Cea mai comună modalitate de a dezvolta teste este crearea manuală a codului de test. Aceasta este cea mai flexibilă modalitate de a dezvolta teste, dar productivitatea tipică a inginerilor de testare în crearea codului de testare nu este cu mult mai mare decât viteza de creare a codului de produs, iar volumul codului de testare în practică depășește adesea volumul codului de produs cu 10 ori. Având în vedere acest fapt, industria modernă înclină din ce în ce mai mult către modalități mai inteligente de obținere a codului de testare, cum ar fi utilizarea codurilor de testare speciale. limbi (scripte) și generarea testelor.

Generarea testelor

În prezent, unele limbaje de specificații utilizate pentru a descrie algoritmii de testare pot fi folosite pentru a genera codul de testare. Să luăm în considerare generarea de cod din limbajul MSC. Testul descris mai sus este formalizat în limbajul MSC (Fig. 9.3). Aici, fiecare săgeată etichetată DoTransaction , DoAddressTenure sau DoDataTenure reprezintă un apel către funcția de produs corespunzătoare care trece parametrii. Săgeata checkTr corespunde verificării dacă o tranzacție a trecut prin autobuz cu parametrii corespunzători. Fiecare dintre săgețile din diagramă este convertită în cod executabil de către generatorul de test, în timp ce săgețile care reprezintă apelurile de funcții pot corespunde unei secțiuni destul de simple și mici de cod care apelează funcția corespunzătoare și verifică valoarea de ieșire a acesteia pentru erori.

Orez. 9.3.

Trebuie remarcat faptul că săgețile corespunzătoare verificării tranzacțiilor pot fi, după generare, transformate într-un cod destul de complex care va aștepta ca tranzacția să apară pe magistrală pentru un timeout specificat în timpul generării, să verifice fazele tranzacției și să compare valori ale parametrilor calculate cu valorile de referință specificate. Par este un construct formal utilizat pentru a reprezenta paralelismul în limbajul MSC. La generarea testelor folosind diagrama Fig. 9.4, generatorul de teste enumeră toate opțiunile posibile și nerepetate pentru apelarea funcțiilor testate, menținând în același timp ordinea corectă a testelor, care în acest exemplu oferă trei teste generate. Este ușor de observat că costul creării diagramei Fig. 9.4 nu sunt foarte diferite de costurile din diagrama din Fig. 9.3, în timp ce numărul de teste se triplează.

Astfel, folosirea tehnicii de generare a codului de testare folosind diagrame MSC formalizate poate crește semnificativ productivitatea testării, precum și transforma formalizarea (codificarea) scripturilor într-o activitate destul de inteligentă.

Înainte de a începe să creați un test, trebuie să știți clar pentru ce este acesta. Un răspuns clar la această întrebare este o condiție necesară pentru muncă. Prin urmare, primul pas ar fi formularea scopului viitorului test. După aceasta, ar trebui să te orientezi către dezvoltare caietul de sarcini test viitor. Cel mai convenabil este să faceți acest lucru sub forma unui tabel, în care pe orizontală domenii de conținut, care ar trebui să fie măsurate, iar vertical - lor manifestări, sau modurile în care se pot manifesta zonele de conținut.

De exemplu, la construirea „chestionarului privind starea conjugală”, J. Rust și S. Golombok (Rust, Golombok, 1988) s-au bazat pe un sondaj de experți, care erau terapeuți și consilieri de familie, precum și pe datele primite de la clienții acesti specialisti. Experții au fost rugați să numească acele domenii ale relației dintre un bărbat și o femeie pe care le consideră cele mai importante pentru o căsnicie armonioasă. Informațiile de la clienți ne-au permis să identificăm zonele cu probleme viata de familie, în care soții ar dori să facă modificări. Pe această bază, au fost identificate domenii precum „interesele comune și gradul de dependență – independență”, „comunicarea verbală și non-verbală”, „încrederea și respectul”, etc. O înțelegere clară a scopului viitorului test , în mod firesc, facilitează construirea unei liste a ceea ce urmează să vină măsura. La specificarea manifestărilor, este important să se asigure că diverse forme implementarea acestora. Astfel, la construirea chestionarului sus-menționat, „atitudinile și sentimentele manifestate în relații” au fost considerate ca manifestări ale „comunicațiilor verbale și nonverbale” între soți.

Din motive practice, de obicei sunt dezvoltate 4 până la 7 categorii pentru fiecare axă. Un număr mai mic de categorii duce adesea la un chestionar prea restrâns, în timp ce un număr mai mare poate îngreuna procesul de construire a chestionarului. Rezultatul este un fel de rețea, numărul de celule în care va fi egal cu numărul de parametri planificați pentru studiu, înmulțit cu numărul manifestărilor lor comportamentale (Tabelul 3.1).

În proiectarea chestionarului, o dimensiune a grilei de 16 până la 25 de ochiuri (de exemplu, 4 x 4, 4 x 5, 5 x 4 sau 5 x 5) este în general considerată ideală pentru lungimea testului care este fezabil de construit, prezentat și procesat. .

Apoi, trebuie să determinați câte sarcini, cum ar fi întrebări, trebuie create pentru fiecare dintre celule. Atunci când rezolvăm această problemă, trebuie să ne ghidăm după cât de important i se pare cercetătorului să măsoare unul dintre parametri în comparație cu altul sau alții. În zăbrelele prezentate în tabel. 3.2 (Rust, Golombok, 1989), se presupune că zonele de conținut desemnate ca Ai V, ar trebui să li se acorde 40% greutate și CUŞi D– 10% În același timp, fiecare manifestare A, B, CŞi D Se atribuie 25% greutate. Este necesar să se acorde atenție faptului că, în general, ponderea procentuală a tuturor zonelor de conținut (orizontal) și a tuturor manifestărilor (vertical) ar trebui să fie de 100%. Această aranjare a ponderilor procentuale vă va spune ce parte din toate sarcinile ar trebui creată pentru fiecare celulă. Următorul pas este să decideți câte elemente ar trebui incluse în test. În acest caz, este necesar să se țină cont de factori precum dimensiunea grilei și timpul așteptat pentru finalizarea sarcinilor. Este bine cunoscut faptul că în determinarea numărului de sarcini, cercetătorul se confruntă cu o dilemă: asigurarea, pe de o parte, a fiabilității testului, care necesită o creștere a sarcinilor, și pe de altă parte, reducerea la minimum a numărului de sarcini pentru asigurarea lucrului eficient al subiectului cu ei, ceea ce presupune în primul rând menținerea concentrării în timpul examinărilor. Astfel, pentru a obține fiabilitatea satisfăcătoare a chestionarului, sunt necesare cel puțin 20 de sarcini, a căror finalizare nu durează, de obicei, mai mult de 10 minute. In sfarsit, rol important Caracteristicile populației care se presupune a fi examinată joacă un rol în determinarea numărului de itemi de testare. De obicei, într-un studiu pilot realizat de dezvoltatori, numărul de articole din versiunea preliminară a testului ar trebui să fie cu cel puțin 50% mai mare decât cele care vor fi incluse în versiunea finală.

Odată ce ponderea procentuală a fiecărei celule de grilă a fost determinată și a fost stabilit numărul total de articole pentru versiunea pilot a testului, este ușor de calculat câți articole ar trebui dezvoltate pentru fiecare celulă. Grila de mai jos (Rust, Golombok, 1989) conține numărul de sarcini pentru fiecare celulă care este necesar pentru studiu pilot folosind un chestionar format din 80 de întrebări (Tabelul 3.2).

Universitatea de Stat de Tipografie din Moscova. Determinarea structurii testului. Dezvoltarea specificațiilor de testare Specificația de testare

În m Cerneţov. Biografie. Primul partizan alb. Despre pământul Don: cazaci și țărani

Retete de rulouri de vinete cu diverse umpluturi

Bulgur - ce fel de cereale este și cum se gătește delicios

Rețete de gulaș cu file de pui cu fotografii

De ce visezi mărar conform cărții de vis?

Semnificația numerelor de ceas în numerologie

scurtă biografie a lui Kharms