Kapitel 12. Sæt dokumentets tegnsæt

Indholdsfortegnelse

Pakken ucs
Støtte for CJK
Fejlsøgning af CJK
Hvordan indtaster man CJK med Unicode?

Kile's editor tillader dig at læse, konvertere og indstille teksten til det tegnsæt som dokumentet behøver. Det giver dig mulighed for at bruge bogstaver og symboler som ikke er standard. Du kan for eksempel bruge tegn med accent for italiensk, fransk og æøå for dansk. Valg at tegnsæt for et dokument kan gøres på tre måder:

LATEX selv forstår kun ASCII, et meget begrænset sæt af tegn, så du har ikke mulighed for at bruge bogstaver med accent eller specialtegn direkte. For at bruge bogstaver med accent, lavede LATEX en bestemt syntaks for at komme uden om problemet og kunne inkludere sådanne tegn, f.eks. \ae for æ. Der er en pakke til at hjælpe dig med dette, som hedder inputenc, som kan indsættes i preamblen med \usepackage[latin1]{inputenc}, hvor det valgfrie argument er tegnsættet som du vil bruge (i de fleste tilfælde latin1). Dette beder LATEX om at oversætte alle æ i dokumentet til \ae. Kig venligst i dokumentationen for inputenc for mere information om dette. Sidst men ikke mindst: husk at sikre dig at filen virkelig er kodet med det tegnsæt du angiver til inputenc!


Valg af kildekodefilens tegnsæt

Valg af kildekodefilens tegnsæt


Mængden af forskellige tegnsættabeller har givet problemer for mange programmer: for eksempel kan du ikke skrive et kursus i tyrkisk på fransk uden at tabe et af sprogenes særlige tegn. Der er almindelig enighed om at alle, før eller senere, vil skifte til Unicode. Der er mange implementeringer af Unicode, og UTF-8 er den mest vellykkede på Linux. Windows(R) forlader sig på det mere uhåndterlige og mindre fleksible ucs-2. Visse distributioner, såsom RedHat, er allerede begyndt at indstille tegnsæt til utf-8 som standard, og derfor kan det være meget interessant at bruge utf-8-argumentet med pakken inputenc.

De dårlige nyheder er at det endnu ikke indgår i teTEX mens dette dokument skrives. De gode nyheder er at der findes en LATEX-pakke som kan gøre præcis dette, og du kan selv installere den.

Pakken ucs

Du kan hente ucs-pakken fra hjemmesiden for Unicode støtte for LATEX af Dominique Unruh fra universitetet i Karlsruhe.

For at installere den, pakkes den hentede fil op og det ukomprimerede indehold flyttes til en mappe som TEX kan se. Du vil for eksempel kunne bruge /usr/share/texmf/tex/latex/ucs/ (sørg dig at den virkelig er din søgesti i $TEXMF, eftersom den sommetider ændres afhængig af distributionen du bruger.) Gør mappen læsbar af alle hvis den ikke allerede er det, og undermapperne kørbare, med chmod. Du skal udføre alle handlinger som systemadministrator, så vær forsigtig.

Når du er klar, startes kommandoen texhash for at få TEX til at gennemse sine filer, og forhåbentlig finde den nye pakke. Kig i pakkedokumentationen for detaljer, men generelt behøver du intet mere end at indstille følgende i indledningen:


                \usepackage{ucs}
                \usepackage[utf8x]{inputenc}