Kriterium refererede test

Sprog :

Encyclopedia samfund |Encyclopedia Svar |Indsend spørgsmål |Ordforråd Viden |Upload viden

Forrige 1 Næste Vælg sider

Kriterium refererede test (Kriterium-Henvist Test), også kendt som kriterium omtalte tests. En velforberedt, i bestemte områder af adfærdsmæssige standarder for adfærd i overensstemmelse med det niveau af testresultaterne er at forsøge at foretage en direkte fortolkning af testen. Den indeholder oplysninger om de mennesker, der bliver testet har nået et vist niveau eller standard adfærd kræves, er en klassisk test teori og baseret på de relative norm refererede test quiz-typer.

Kriterium refererede test gennemgang

Criterion-refereres test kan spores dybe ideologiske kilde for langt, men fremkomsten og udviklingen af kriterium refererede test teori i 1950'erne er, hvad der skete bagefter. Ebel Flanagan i 1951 og i 1962 de to var at sammenligne værdien af information, information, der både er: Ræsonnement Test oplysninger er lavet af et bestemt område eller indhold vedrørende forholdet mellem midten af en gruppe er den første forsøg information. Men "Kriteriet-refereres test," udtrykket klart skal henføres til Glaser og Klaus (1962), og vilkårene er tydeligt forklaret Glaser bidrag. Glaser i 1963 om "amerikanske psykolog" tidsskrift Forfatteren diskuterer definitionen af disse to typer oplysninger, og sammenlignet. Men på grund af den uklare og esoteriske diskurs Glaser, og denne mærkelige nye ideer, så denne idé er ikke blevet omsat til praksis med det samme, da Popham og 赫塞克 's kommentarer: "Ud over en stigning i både det tekniske ordforråd uden for et nyt koncept, i praksis ikke sondrer målingen mellem dem. "1969 Popham og 赫塞克 på "Educational Measurement Magazine" udgivet "kriterium refererede testapplikationer," artiklen, at artiklen ikke blot gennemgår tidligere udvikling, og yderligere uddybet Glaser tænkning, og citeret i instruktions beslutninger ofte af normer refereres og kriterium omtalte og fordele og ulemper ved de to metoder. Dette papir rejser pædagogiske og psykologiske måling eksperter stor opmærksomhed, hvilket gør 1970'erne blev standardreferenceperioden test til at måle arbejdsløsheden vinde opmærksomhed i 10 år. Dette kan fås ved henvendelse bekræfter begge statistikker: Glaser 1963 papirer offentliggjort indtil august 1986 er blevet citeret 124 artikler, hvoraf kun 10 er udgivet før 1971 1967-1978 20 år US Education Resource Information Center (ERIC) indsamlet 1913 papirer om forskningsemner i kriterium omtalte tests.

I løbet af 1970'erne, uddannelsesmæssige og psykologiske måling ekspert på begrebet kriterium omtalte forsøg udført for yderligere at udforske og afprøve de principper og metoder til forberedelse, den standard metode til at fastlægge omfanget, reliabilitet og validitet estimater kontrollere andre aspekter af undersøgelsen og foreslået en række matematiske modeller. I 1980 har den standard felttest henvisning blevet meget kompleks, og selv skrev en kommentar Nite Ke papirer op til 24, for at hjælpe os med at skelne mellem forskellige typer af kriterium omtalte test af forskelle.

Siden 1968 efter den praksis standard henvisning test er også blevet udviklet. Popham og hans kolleger til at bygge og distribuere en række kriterium omtalte tests, hver prydet med en målelig (eller detaljerede) mål knyttet. Disse test er blevet brugt i mange klasseværelser, og blive en standard henvisning testbruger klasseværelset fanatiske tilhængere. En undersøgelse i 1982 viste, at National Education Association talsmand gjorde det klart, at de ville foretrække at være standardreferenceperioden test snarere end normen-refereres tests, har mange statslige uddannelse afdelinger også udviklet en standard udarbejdet af staten læseplan med tilhørende henvisning test.

Criterion-refereres test fra stigningen i udviklingen er så hurtig, der er dybe grunde. Halvtredserne og tresserne af dette århundredes amerikanske uddannelsesreform kraftig, massiv, folk made "til mastering og undervisning", "individualiseret undervisning" og undervisning reform fortalere. For effektivt at gennemføre disse reformer, skal læreren være i stand til en slags viden og færdigheder "master" definition, og i praksis være i stand til at identificere, om den studerende har nået et niveau af beherskelse og. Dette er den traditionelle målemetoder og udfordringer. På dette tidspunkt, hvis de scores er stadig forholdsvis vurderingskriterier, konkurrencedygtige, at i henhold til den relative position af de studerende i regelmæssig modul til at bedømme hans præstation, selvom den prioriterede rækkefølge ændringer i elev lokalgrupper også kan illustrere deres læring om fremskridt at fremlægge beviser, men kun hvis ændringen ses som konkurrencedygtig, så dette kan ødelægge kriterierne for vurdering af ydeevnen af studerende i læring og udvikling. Årsagen er: For at kontrollere elevernes beherskelse af et emne, er emner som brug af traditionel programmering test til at skelne indeks baseret på en norm-refereres test, vil det være, at folk ville have ønsket titel, der er indeholdt i testen udelukket og kan derfor ikke opfylde formålet med målingen, mens indholdsområder norm omtalte tests er normalt større, er det svært at sige præcist, hvor mange fag faktisk mestret, bør resultaterne ikke bruges til at afgøre, om de snesevis af studerende har nået de ønskede krav. Således er det gjorde absolut standard vurderinger, tænker, at dette er en relativ udelukkelseskriterier for vurdering af præstation, opfordre eleverne til at gå gennem de bestræbelser på at opnå denne standard. Således er de nye test-typer - standardreferencetestmetode kommet i stand, og fordi dens en traditionel norm omtalte test, der ikke har visse fordele, såsom den enkelte bliver testet uddannelsesniveauet direkte kan forklare den sande niveau af deres situation, såsom at have osv., hundred opnås hurtigt.

Den grundlæggende idé med kriterium omtalte test

1.. De grundlæggende principper for forberedelse. Hovedformålet er at bestemme kriteriet refererede testpersoner at beherske viden eller færdigheder af en virkelig situation, og dermed de grundlæggende principper for dets etablering som følger: (1) måler mål skal være klar og specifik, og i en test ikke kan indeholde for meget måling målsætninger. Måling mål fuzzy eller for meget, er ikke befordrende for de testresultater præcist beskriver den sande tilstand af fagets viden eller evne. (2) test spørgsmål skal have en høj sammenhæng mellem mål og målinger. Hver testpersonens svar skal afspejle det, som skal måles for target resultatmåling. I mellemtiden er antallet af testspørgsmål måle de samme mål både tilstrækkelig, men har også stor homogenitet. Men mellem måling af forskellige mål quizspørgsmål ikke kræver homogenitet.

2. Projekt analyseparametre. Criterion-refereres tests også brug vanskeligheder, diskrimination og andre parametre for projektets analyse, men betydningen er forskellig fra betydningen af disse parametre er blevet norm omtalte test i vanskeligt at skelne mellem grader.

Vanskeligheder kan ikke forklares blot som emnet eller motivets sværhedsgrad pass sats, men skal forstås som en test af krav til niveau test indhold, hvilket afspejles i målet for målingen. Tests var højere på de krav test indhold, vanskelighederne ved at måle tilsvarende større problem, ellers lavere. I løbet af analysen af emnet er ofte brugt af den kontrol rate gruppen og har ikke forstået gruppen er repræsenteret med den sats, og dermed sværere at vælge størrelsen på koefficientværdierne kan følge ensartede standarder, men også forsøge at afspejle det mål at måle graden at mestre.

Diskrimination er afspejlet i titlen på foranstaltningen er evnen til at skelne graden af forskel mellem test og evnen til at mestre to motivtyper ikke fatte, snarere end henviser generelt. Fordi folk normalt forsøger at forstå eller at blive beskyldt faktorer forståelse af undervisning, for at hjælpe "Undervisning følsomhed factor" ofte brugt som et indeks for punkt diskrimination, og folk gjorde en række undervisning følsomhedskoefficienter . Fælles med D-indekset, B-indeks.

3. Standard niveau mislykkedes. Kriterium refererede prøveresultater fortolkning afhænger ikke testgruppen normen, men undlod standard niveau af forberedelse før testen er normalt gennemføres i overensstemmelse med formuleringen af testen blev, tilsyneladende, passerer testen afhænger ikke af, om resultaterne af de følgesvend test, helt afhængig resultaterne af sin egen adfærd.

Standard niveau er et punkt i forbifarten prøveresultater på skalaen ifølge denne stilling på skalaen blev individer opdelt i par til at måle indholdet af forskellige færdighedsniveauer af forskellige typer. Passing standard niveau er en direkte fortolkning af resultater baseret på den test, hvordan man kan formulere et rimeligt niveau passerer standard er et spørgsmål, der kræver tankevækkende regnskabsaflæggere quiz. Etableret som indeholder en standard niveau af menneskelig subjektivitet flere komponenter. Hidtil har der været foreslået mange metoder godtgjort standard plan.

4.. Gyldighed verifikation. Gyldighed er en vigtig indikator for effektiviteten af testen, det henviser sædvanligvis til det omfang, det ønskes at teste egenskaberne af målingen kan sanses. Ligeledes med henblik på kriteriet-refereres test, er du nødt til at vurdere dens indhold gyldighed, kriterium relateret gyldighed og konstruere gyldighed. Men understregede, at fokus er forskellig fra fortiden. Kriterium refererede test er mere fokuseret på kravene til dens indhold gyldighed.

Indhold gyldighed henviser til indholdet af testmaterialet til det ønskede niveau for repræsentation af målingen, og derfor undersøgte indholdet gyldigheden af kriterium omtalte tests hovedsagelig fra følgende to aspekter: quiz spørgsmål og quiz spørgsmål rigtigheden af repræsentation. Titlen refererer til korrektheden af de målte test spørgsmål korrekt afspejler målingen objektivt mål for viden ønskede grad af dygtighed, IT kontrollen omfatte: graden af overensstemmelse mellem den tekniske kvalitet af test-og test spørgsmål og måling mål. I overensstemmelse med kravene for det tidligere, er det lettere at forstå. Vurderes ved måling af graden af sammenhæng mellem titel og målene er vanskeligere at måle, som regel kun vurderes ved hjælp af nogle tommelfingerregler, eksperter og studerende Dom Dom to klasse-metoden. Består af en repræsentativ undersøgelse stillede spørgsmål for de standard test test spørgsmål henvisning test skal omfatte visse områder af det samlede repræsentation, således at prøven har et højt indhold gyldighed. For at sikre repræsentativitet teststof, kriterium refererede prøveforberedelse ofte kræver udvikling af to-vejs opdeling, samme tid, folk også gjort brug af "gentagne eksperiment"-metoden til at kontrollere repræsentativitet kriterium refererede forsøg målte emnet.

Ud over at sikre indholdet gyldigheden af kriterium-refereres tests, men også skal verificeres ved henvisning kriterium relateret gyldighed og konstruere gyldigheden af test standard. Fordi indholdet gyldighed og selvom meget vigtigt, men det er kun beskæftiger sig med test indhold snarere end prøveresultater, ændrer det ikke med en anden gruppe af fag eller varierer, men nøjagtigheden af fortolkningen af testresultater, men med ændringer i test-situationer og ændre, og dermed indholdsvaliditet tests alene kan ikke sikre gyldigheden af tests. Authentication metode kriterium relateret gyldigheden af de almindeligt anvendte metoder fra fortiden er stadig i brug, det centrale spørgsmål er stadig i effekt på effektiviteten af den underliggende genstand for rigtigheden af deres valg.

Construct validitetskriteriet omtalte test for at kontrollere de midler til at forklare teoretisk bevise rationalitet prøveresultater. Da indholdet validitetskriteriet omtalte test fancy gren synes at give tilstrækkelig dokumentation for gyldighed, homogenitet kriterium refererede prøveresultater korreleret med fordelingen af at begrænse gyldigheden af kontrollen af de strukturelle måder, hvilket kriterium refererede test teori om struktur måde at verificere gyldigheden og dermed afprøve gyldigheden af teorien om strukturen af standardreferenceperioden valideringsundersøgelse er stadig et relativt svagt felt, men fremkomsten af en så de fleste mennesker kan acceptere konstruktionen gyldigheden af effektive verifikationsmetoder. Hambleton har foreslået at bruge Guttman volumen diagram analyse og faktor analyse metode til at konstruere gyldighed verifikation er mulig. Som en særlig kategori af konstruktion gyldighed, gyldigheden af beslutningen er kriteriet refererede prøveresultater baseret på nøjagtigheden af testen skal foretages ved afgørelser master klassificering. Dens inspektion proces er at indsamle beviser og ikke fatte fatte rigtigheden klassificeringsbeslutninger, sandsynligheden for en korrekt klassificering tilgængelig eller forkert klassificering sagde, men det centrale spørgsmål i spil: For det første, hvordan kan vi bevise, at kriterierne de etablerede klassificering er korrekte, for det andet Hvordan kan vi vide det sande tilstand af de emner, nemlig mestre eller ikke master.

Kom standardforsøg at verificere gyldigheden af teorien ikke er blevet udviklet og forbedret, behov for yderligere forskning og bred udvidelse, uddyber den generelle sagde.

5.. Pålidelighed skøn. Hidtil har forskningslitteraturen givet flere standardiserede tests af pålidelighed estimationsmetoder, disse metoder og norm refererede test pålidelighed estimationsmetoder er helt anderledes. Kriteriet omtalte test er normalt pålidelige estimationsmetoder er opdelt i tre kategorier:

Først beslutningsprocessen konsistens pålidelighed. Et af formålene med kriterium omtalte test, som Notes standard niveau, vil blive opdelt i forskellige typer af test, såsom kontrol og har ikke forstået, så kan du bruge master klassificeringsbeslutning konsistens indeks angiver pålidelighed kriterium refererede tests. Metode til beregning af Cronbach er en masse beslutning konsistens, begge med to eksemplarer af i form af test lighed eller re-test for at vurdere, kan det ikke nødvendigt at teste eller re-test, den direkte anvendelse af resultaterne af en test beslutningstagere konsistens pålidelighed skøn. Normalt PO og u sagde beslutning konsistens pålidelighed koefficienter, men der er mange forskellige måder at PO og u vurderer i denne forbindelse, afhænger af betingelserne for den test, på den anden side, afhænger af den grad af nøjagtighed, der kræves konsistens pålidelighed. Hvor Ha Yien Saab testmetoder og metoder er især nyttige for Vick.

For det andet er området anslåede reliabilitetsscores. Et andet vigtigt mål kriterium omtalte test, der måler elevernes forståelse af, hvordan indhold testen. I almindelighed, den målte prøve fra måleproblemet er, at alt indhold ud af titlen, så ifølge forsøgspersonernes prøveresultater spekulere dens domæne scores på tværs af faglige områder (dvs. ordentlig fraktion) i processen, uundgåeligt indebærer prøveresultater skøn over graden af pålidelighed, og skal derfor estimeres i marken anslå reliabilitetsscores. Pålideligheden af dette skøn kan anvendes både standard målefejl estimering, estimering metoder, såsom Millman og Hambleton, Cronbach og fremlægge, men kan også bruges til at angive generalizability koefficient ρX. Den tidligere afspejler hver enkelt domæne scoringer for pålidelighed estimering, der afspejler de overordnede prøveresultater afspejles i alle områder af estimering pålidelighed.

For det tredje, konsistens koefficient kvadrerede fejl tab. Når du bruger standard-niveau fag har undladt at foretage mester klassificering, klassificering fejlhåndtering, er der to situationer: den første er, at når de træffer beslutninger klassificering, uanset emnet niveau af observerede scoringer og standard afstand tilfælde, hele fejl som havende lige sværhedsgrad. Ved beregning af beslutningen konsistens pålidelighed, Fejlhåndtering på denne måde. Det andet tilfælde er, at alvoren af de fejl, som de emner, væk fra den standard klassifikationsgrad end standard niveau af alvoren af de emner tæt på kategoriseret større. Folk beskriver ofte denne slags niveau scoringer og standardafvigelse kvadreret pålidelighed koefficient kendt som konsekvens koefficient kvadrerede fejl tab. Livingston fælles beregningsmetode foreslået af K2 (X, T) og M koefficienter foreslået af Brenner og Kane (C) koefficienter. Begge koefficienterne er estimeret ved anvendelse af variansanalyse at opnå.

6.. Kriterium refererede standardiserede tests. Standardiserede test er en klassisk test teori metode et vigtigt aspekt. Ved anvendelsen af kriteriet-refereres tests, det skal også være standardiseret og dermed forbedre nøjagtigheden af fortolkningen af testresultaterne. Det samme kriterium, der refereres til standardiserede tests omfatter følgende aspekter: (1) standardiserede test forberedelse proces, er parat til at yde en ensartet test til at måle præcist definerede mål, der prøver at måle indholdet af emnet typisk målt med spørgsmål høj teknisk kvalitet osv. Standardisering (2) test gennemføres der testes for at give den samme vejledning sprog, de ydre fysiske forhold af test falder sammen osv. Standardisering (3) test score, bør score være forenet ratingkriterier, udelukkelse score subjektive forudindtagethed, standardisering (4) fortolkning af prøveresultater, der passerer dom standard niveau for hvert niveau af testresultaterne skal være konsekvente.

Criterion-refereres tests Prospect

I de sidste 20 år har standardreferenceperioden test forskning givet store fremskridt, og mere i i praksis, men det vigtigste punkt, fordi undersøgelsen fokuserer på norm-refereres tests og kriterium refererede test sammenligning mellem teori og kriterium omtalte test på, og dermed dens tilgang er stadig i en forholdsvis svag position. Fra den nuværende udvikling af hele området for Psykologi og Uddannelsesforskning måling, vil studiet blive vist i standardreferenceperioden test følgende tendenser:

1.. Vare respons teori og metoder vil blive anvendt til studiet af flere kriterium refererede testområder. For eksempel brugte element respons model for at vælge test spørgsmål, elementet respons information funktion, der bruges i projektet, analyser, punkt respons teori evne til at vurdere parametre for kriterium refererede prøveresultater skøn og så videre. Vare svar teoriprøven i standard reference inden for ansøgningen, kunne det have gjort fremragende bidrag til modne og forbedre som en standard henvisning test teori og metoder.

2. Criterion-refereres tests vil studere matematiske metoder til at indføre mere og mere. Fakta har vist, at indførelsen af matematiske metoder (såsom faktor analyse, variansanalyse, osv.) berige og styrke de teoretiske kriterium refererede tests. Bayesianske estimationsmetoder såsom fremtiden også vil komme ind på området af kriterium omtalte tests. Criterion-refereres tests for at kontrollere gyldigheden af sådanne spørgsmål må ty til mere matematisk tilgang til at modnes.

3. Konsekvent med hele måling område vil computerteknologi udstillingen også teste makroen i offer i standard reference i området. Dette indebærer udarbejdelse af standard henvisning test spørgsmål, udvælgelse, kombineret test, implementere og test score, og så videre.

4.. Criterion-refereres og norm refererede test forholdet mellem den umulige quiz, som vil win situation, de er bare to forskellige typer af tests kun mellem forskere, vil nå til enighed blandt praktikere. Det vil sige, de har hver deres egne fordele og ulemper, at spille deres respektive fordele i forskellige situationer. På området for uddannelsesmæssige måling må i stigende grad bruge kriteriet-refereres test form, men inden for psykometri, kan norm refererede test stadig udgør langt hovedparten.

Forrige 1 Næste Vælg sider

Bruger Anmeldelse

Ingen kommentarer endnu

Jeg ønsker at kommentere [Besøgende (18.190.*.*) | Logon ]

Sprog :
| Tjek kode :