Kapitel 4. Arbejd med data

Indholdsfortegnelse

Filformater som understøttes
Datakildebegreber
ASCII-inddatafiler
BLAST dirfile-filer
Dataguiden
Datahåndteringen
Lav nyt dataobjekt
Redigér og fjern eksisterende dataobjekter
Datatyper
Vektorer
Kurver
Ligninger
Histogrammer
Effektspektrum
Plugin
Begivenhedsovervågninger
Matricer
Billeder
Menuen Data

Filformater som understøttes

For øjeblikket understøtter Kst ASCII-tekstfiler, BOOMERANG rammefiler og BLAST dirfile-filer som datakilder, samt PIOLib- og FITS-filer med passende biblioteker. Dette afsnit beskriver grundlæggende begreber for datakilder som er fælles for alle filtyper, og specifikke detaljer for ASCII- og BLAST dirfile-filer.

Datakildebegreber

En datakilde i Kst er helt enkelt en datafil som understøttes. Følgende begreber er vigtige for at forstå hvordan Kst arbejder med forskellige datakilder. Noget terminologi introduceres også i dette afsnit.

Samplinger

En sampling betragtes som den grundlæggende enhed med hensyn til datafiler. Hver sampling består af en dataværdi i filen. Bemærk dog at en sampling måske ikke svarer til en værdi i en datavektor i Kst, afhængig af begrebet rammer.

Felter

Et felt svarer oftest til en vektor i Kst. En søjle i en ASCII-datafil anses for eksempel at være et felt. Hvert felt kan have et eksplicit eller implicit navn. Datakildelæsere sørger for funktioner til at læse og hente felt og feltnavn.

Rammer

En ramme svarer til et fast antal samplinger, og hvert felt i en datafil kan have sit eget antal samplinger pr ramme. Størrelsen på en datafil måles i antal rammer den indeholder. I de fleste tilfælde er antallet af samplinger pr ramme 1, men for visse datafiler kan der være flere samplinger pr ramme. I illustrationen nedenfor vises de tre første rammer i en tænkt datafil. I denne specielle datafil har felt 1 forholdet 5 samplinger pr ramme, felt 2 har forholdet 2 samplinger pr ramme, felt 3 har forholdet 3 samplinger pr ramme og felt 4 har forholdet 1 sampling pr ramme.

Afhængig af specifikke indstillinger for datavektorer i Kst, kan data fra filer læses som rammer i stedet for samplinger, hvor enten den første sampling i en ramme eller middelværdien af alle samplinger i en ramme svarer til rammens værdi.

INDEX-felt

Visse datafiler har måske ikke et felt som repræsenterer X-aksen i et plot. Kst laver implicit et INDEX-felt for alle datakilder. INDEX-feltet indeholder simpelthen heltal fra 0 til N-1, hvor N er antal rammer i datafilen.

ASCII-inddatafiler

Det enkleste inddatafilformat er ASCII-tekstfiler. Disse filer kan oftest læses af mennesker og kan nemt laves i hånden eller med enkle scripter hvis det ønskes. Det følgende er et eksempel på en ASCII-inddatafil:

112.5 3776 428
187.5 5380 429
262.5 5245 345
337.5 2942 184
412.5 1861 119
487.5 2424 138
567.5 2520 162
637.5 1868 144
712.5 1736 211
787.5 1736 211
862.5 2172 292
937.5 1174 377
1000.5 499 623

Hver søjle i filen repræsenterer et felt, mens hvert linje repræsenterer en ramme. Søjler adskilles med tabulatorer eller mellemrum, og rækker adskilles med returtegn. Bemærk at afhængig af deres struktur, kan ASCII-filer ikke have flere samplinger pr ramme. Desuden, eftersom søjlerne ikke har etiketter, tildeles feltnavne af Kst baseret på søjlernes rækkefølge (søjlen længst til venstre har feltnavnet 1).

Kommentarlinjer i ASCII-filer begynder med et af tegnene i sættet {#, !, /, ;, c}. Alle kommentarlinjer og tomme linjer ignoreres af Kst. Gyldige tal omfatter de med decimaler, minustegn eller e for at angive videnskabelig notation. Ugyldige tal (såsom engelske ord) erstattes med 0 af Kst.

BLAST dirfile-filer

Datakilderne med BLAST dirfile-filer er virkeligheden mapper med filer. Hver mappe repræsenterer en datakilde, og hver fil i mappen, med undtagelse af en fil som hedder format, repræsenterer et enkelt felt. Filen som hedder format giver en liste med hvert felt og dets egenskaber. Nedenfor vises et eksempel på en sådan fil:

scount RAW f 1
fcount RAW f 20
sine RAW f 20
ssine RAW f 1
cos RAW f 20

I dette eksempel er scount, fcount, sine, ssine og cos feltnavne. RAW angiver at filen er skrevet i et ubehandlet format, og det sidste tal på hver linje er antal samplinger pr ramme.

Når en BLAST dirfile-fil vælges til brug i Kst skal mappen som indeholder feltfilerne vælges. Kst leder automatisk efter filen format, hvis den findes, for at afgøre felterne og deres egenskaber.