Arbejd med data |
forrige | næste |
Indholdsfortegnelse
For øjeblikket understøtter Kst ASCII-tekstfiler, BOOMERANG rammefiler og BLAST dirfile-filer som datakilder, samt PIOLib- og FITS-filer med passende biblioteker. Dette afsnit beskriver grundlæggende begreber for datakilder som er fælles for alle filtyper, og specifikke detaljer for ASCII- og BLAST dirfile-filer.
En datakilde i Kst er helt enkelt en datafil som understøttes. Følgende begreber er vigtige for at forstå hvordan Kst arbejder med forskellige datakilder. Noget terminologi introduceres også i dette afsnit.
En sampling betragtes som den grundlæggende enhed med hensyn til datafiler. Hver sampling består af en dataværdi i filen. Bemærk dog at en sampling måske ikke svarer til en værdi i en datavektor i Kst, afhængig af begrebet rammer.
Et felt svarer oftest til en vektor i Kst. En søjle i en ASCII-datafil anses for eksempel at være et felt. Hvert felt kan have et eksplicit eller implicit navn. Datakildelæsere sørger for funktioner til at læse og hente felt og feltnavn.
En ramme svarer til et fast antal samplinger, og hvert felt i en datafil kan have sit eget antal samplinger pr ramme. Størrelsen på en datafil måles i antal rammer den indeholder. I de fleste tilfælde er antallet af samplinger pr ramme 1, men for visse datafiler kan der være flere samplinger pr ramme. I illustrationen nedenfor vises de tre første rammer i en tænkt datafil. I denne specielle datafil har felt 1 forholdet 5 samplinger pr ramme, felt 2 har forholdet 2 samplinger pr ramme, felt 3 har forholdet 3 samplinger pr ramme og felt 4 har forholdet 1 sampling pr ramme.
Afhængig af specifikke indstillinger for datavektorer i Kst, kan data fra filer læses som rammer i stedet for samplinger, hvor enten den første sampling i en ramme eller middelværdien af alle samplinger i en ramme svarer til rammens værdi.
Det enkleste inddatafilformat er ASCII-tekstfiler. Disse filer kan oftest læses af mennesker og kan nemt laves i hånden eller med enkle scripter hvis det ønskes. Det følgende er et eksempel på en ASCII-inddatafil:
112.5 3776 428 187.5 5380 429 262.5 5245 345 337.5 2942 184 412.5 1861 119 487.5 2424 138 567.5 2520 162 637.5 1868 144 712.5 1736 211 787.5 1736 211 862.5 2172 292 937.5 1174 377 1000.5 499 623
Hver søjle i filen repræsenterer et felt, mens hvert linje repræsenterer en ramme. Søjler adskilles med tabulatorer eller mellemrum, og rækker adskilles med returtegn. Bemærk at afhængig af deres struktur, kan ASCII-filer ikke have flere samplinger pr ramme. Desuden, eftersom søjlerne ikke har etiketter, tildeles feltnavne af Kst baseret på søjlernes rækkefølge (søjlen længst til venstre har feltnavnet 1
).
Kommentarlinjer i ASCII-filer begynder med et af tegnene i sættet {#, !, /, ;, c}
. Alle kommentarlinjer og tomme linjer ignoreres af Kst. Gyldige tal omfatter de med decimaler, minustegn eller e
for at angive videnskabelig notation. Ugyldige tal (såsom engelske ord) erstattes med 0 af Kst.
Datakilderne med BLAST dirfile-filer er virkeligheden mapper med filer. Hver mappe repræsenterer en datakilde, og hver fil i mappen, med undtagelse af en fil som hedder format
, repræsenterer et enkelt felt. Filen som hedder format
giver en liste med hvert felt og dets egenskaber. Nedenfor vises et eksempel på en sådan fil:
scount RAW f 1 fcount RAW f 20 sine RAW f 20 ssine RAW f 1 cos RAW f 20
I dette eksempel er scount
, fcount
, sine
, ssine
og cos
feltnavne. RAW
angiver at filen er skrevet i et ubehandlet format, og det sidste tal på hver linje er antal samplinger pr ramme.
Når en BLAST dirfile-fil vælges til brug i Kst skal mappen som indeholder feltfilerne vælges. Kst leder automatisk efter filen format
, hvis den findes, for at afgøre felterne og deres egenskaber.
forrige | hjem | næste |
Brug ag Kst fra kommandolinjen | op | Dataguiden |