[IAN]Uvodnik o vyhazovani dat

Jan Skalicky janskalicky na centrum...
Středa Prosinec 8 21:55:41 CET 2004


Ahoj,
Pokousel jsem se (zatim neuspesne :) zjistit, kdo se skryva pod nickem maud lebowski, ale zminena nechtela byt prozrazena (pze na muj mejl forwardovany od kodla neodpovedela:). jen me zajima, ktery z prednasejicich to byl. ja si totiz zadneho takoveho nevybavuju... pokud nekdo z vas vi, tak pls napiste, jsem zvedavej :)

s pozdravem
honza
============================================================
JAN SKALICKY (JS), janskalicky na centrum...,skalicky na physics....cz
+420-777-641477 Address: P. Bezruce 440, 563 01 Lanskroun, Czech republic
student @ Masaryk University Brno, astronomer, member of
Astronomical Society in Hradec Kralove (ASHK), MEDUZA group
Czech Astronomical Society (CAS) - Variable Star Section (B.R.N.O.)
============================================================



______________________________________________________________
> Od: "Lukas Kral" <lkral na centrum...>
> Komu: <ian na amper....muni.cz>
> Datum: Wed, 08 Dec 2004 21:09:22 +0100
> PÖedm©t: Re: [IAN]Uvodnik o vyhazovani dat
>
> Neodpust§m si pÖisp©t svou troíkou do mlna, protoe s t§mhle problřmem pracuji skoro denn© :-)
> 
> Naprosto souhlas§m s t§m, e nelze bez rozmyslu vymazat z jakřkoli nam©Öenř zívislosti bod jen kvli tomu, e se ním "nel§b§".  Obĺas se ale pÖi m©Öen§ ojedin©le vyskytne tzv. hrubí chyba (nikoli systematickí, PetÖe, to je n©co jinřho, viz díle), tÖeba ten mrak na CCD sn§mku, a vsledkem je, e jeden bod je vrazn© jinde ne víechny ostatn§. Pokud bychom jej brali v vahu napÖ. pÖi proklídín§ nam©Öench dat n©jakou kÖivkou, negativn© by ovlivnil vsledek vpoĺtu (metoda nejmení§ch ĺtverc zm§n©ní Maude si s "ul§tlmi" body neporad§!).
> 
> Je tedy nutnř se t©chto tzv. odlehlch bod zbavit. Na to existuj§ v zísad© dva postupy:
> 1) dohledat pÖ§ĺinu monř hrubř chyby (pokud to jde), a pokud je nalezena, bod vyÖadit (to je to co popsal Petr -- prohlřdnout dan sn§mek, jestli nen§ n©co ípatn©)
> 2) identifikovat odlehlř body na zíklad© statistiky
> 
> Druh postup se pou§ví, pokud nelze zp©tn© dohledat pÖ§ĺiny hrubch chyb, a pokud míme dostatek spolehlivch bod. PÖedpokladem je, e sprívn© nam©Öenř body jsou gaussovsky rozloeny kolem stÖedn§ hodnoty A se stÖedn§ kvadratickou odchylkou S. Statistika Ö§kí, e 99 % bod bude leet v intervalu <A - 3*S; A + 3*S>. To znamení, e pokud n©jak bod le§ díle ne 3*S od prm©rnř hodnoty, s 99% pravd©podobnost§ je to hrubí chyba (ípatnř m©Öen§). Meme tedy s klidem vyhízet víechny body lií§c§ se o v§ce ne 3*S od stÖedn§ hodnoty A.
> 
> Pokud je odlehlch bod mnoho, d©lí se tento postup iterativn© -- spoĺ§tí se A a S, vyhod§ se odlehlř body, znovu se spoĺ§tí A a S, znovu se vyhod§ odlehlř body, atd., dokud je co vyhazovat. V pÖ§pad© e je odlehlch bod jeít© v§ce (funguje to a do zhruba 50 %!), lze pou§t razantn©jí§ vyhazovac§ kritřrium (napÖ. m§sto 3*S jen 2,5*S nebo dokonce 2,2*S).
> 
> Pokud proklídíme n©jakou zívislost kÖivkou (pÖ§mkou, polynomem, sinusovkou apod.), lze oboj§ spojit dohromady: prolo§me data, spoĺ§tíme rozptyl bod S kolem proloenř kÖivky, vyhíz§me víechny body kterř jsou díle od kÖivky ne 3*S a to víe opakujeme znovu a znovu.
> 
> Na zív©r jeít© n©co o typech chyb pÖi m©Öen§, ĺasto se to plete. Ilustrujme si to na pÖ§kladu, kdy chceme dÖev©nm metrem zm©Öit dřlku stolu:
> 1) níhodnř chyby
> -- napÖ. ne vdy se na znaĺky metru d§víme pod stejnm hlem
> -- zpsobuj§ rozptyl m©Öen§ kolem sprívnř hodnoty
> -- daj§ se redukovat opakovín§m m©Öen§ a zprm©rovín§m vsledk
> 2) systematickř chyby
> -- napÖ. míme ípatn metr, kter vdy ukíe mení§ hodnotu ne je skuteĺní
> -- zpsobuj§ systematick posun nam©Öenř hodnoty vĺi sprívnř
> -- nelze odstranit opakovín§m a prm©rovín§m m©Öen§!
> -- Öeíen§m je pouze kontrola a kalibrace pouitch m©Ö§tek
> 3) hrubř chyby
> -- napÖ. se spleteme a m§sto 132 cm si zap§íeme 123 cm
> -- pÖ§ĺina vskytu odlehlch bod
> -- Öeíen§ viz víe
> 
> Pokud jste doĺetli a sem, zdrav§ vís
> Lukíí
> 
> _______________________________________________
> Ian mailing list
> Ian na amper....muni.cz
> http://amper.ped.muni.cz/mailman/listinfo/ian
> 




More information about the Ian mailing list