(Pdf)LaTeX i j�zyk polski

Dokumentacja niniejsza omawia pokr�tce generowanie format�w do tworzenia plik�w DVI oraz PDF, ze wsparciem dla j�zyka polskiego i ich u�ycie w �rodowisku opartym na Web2c (TeX Live) lub MiKTeX. Od wersji 7.5.5 Web2c oba typy plik�w generowane s� jednym programem pdftex. Om�wiono teori� co dzieje si� za kulisami. Obecnie w dystrybucji TeX Live ca�y proces generowania format�w zosta� zautomatyzowany: po instalacji pakietu do obs�ugi danego j�zyka aktualizowane s� odpowiednie pliki konfiguracyjne, po czym generowne s� pliki format�w dla wszystkich dost�pnych odmian-silnik�w TeX-a.

Poni�ej pokazano prosty przyk�ad tworzenia pliku z u�yciem pakietu Polski. Pakiet ten dostarcza narz�dzi potrzebnych do sk�adu dokument�w w j�zyku polskim LaTeXem 2e.
Autorzy pakietu: Mariusz Olko i Marcin Woli�ski.
Wi�cej informacji na temat samego pakietu -- patrz plik czytaj.txt dystrybucji pakietu Polski (dawniej PLaTeX).

Ponadto w dystrybucjach do��czono przyk�adowy plik doc/latex/polski/sample-polski.tex. s�u��cy do przetestowania poprawnego dzia�ania formatu LaTeX. Pocz�tkuj�cym u�ytkownikom zaleca si� zapoznanie z zawarto�ci� tego pliku. Techniczne szczeg�y dotycz�ce u�ycia pakietu polski.sty (g��wny element pakietu polski) dost�pne s� po dwukrotnym uruchomieniu:
latex polski.dtx
latex polski.dtx
i wy�wietleniu wynikowego polski.dvi.


I. Przygotowanie formatu LaTeX2e do obs�ugi j�zyka polskiego

Format w systemie TeX to wst�pnie prekompilowany (aby przyspieszy� jego analiz� przez program tex/pdftex) zestaw makrodefinicji oraz regu� przenoszenia wyraz�w dla wybranego zestawu j�zyk�w. Plik formatu z regu�y posiada rozszerzenie .fmt. Tworzenie formatu to, w skr�cie, uruchomienie programu tex/pdftex z opcj� --ini i wczytanie odpowiedniego pliku inicjuj�cego (dla LateX jest to plik latex.ltx). W LaTeX 2e zestaw regu� przenoszenia wyraz�w jest zwyczajowo deklarowany w pliku o nazwie language.dat. Plik ten znajduje si� zwykle w podkatalogu tex/generic/config/language.dat lokalnej konfiguracji systemu TeX b�d� w identycznym podkatalogu katalogu g��wnego instalacji. Modyfikacja language.dat polega na usuni�ciu w tym pliku znaku komentarza `%' w wierszu
polish plhyph.tex i ewentualnym zablokowaniu takim znakiem niepo��danych deklaracji wzorc�w dzielenia wyraz�w.

Przygotowanie formatu:

W teTeX/TeX Live nale�y uruchomi� program texconfig, uaktywni� regu�y dzielenia wyraz�w dla j�zyka polskiego -- menu Hyphenation uruchamia edycj� pliku language.dat; po zapisaniu zmian w pliku i zako�czeniu edycji, zostanie automatyczne wygenerowany format latex.fmt zawieraj�cy wybrane wzorce dzielenia oraz mechanizm Babel prze��czania j�zyk�w; texconfig tworzy ponadto dowi�zanie (lub program) latex.
Dla dociekliwych: powy�sze odpowiada uruchomieniu z linii polece�:
fmtutil --byfmt latex; texlinks
za� na ni�szym poziomie -- poleceniu
pdftex --ini --progname=latex latex.ini
(od Web2c wer. 7.5.5 u�ywamy jednego programu pdftex).

W instalacji MiKTeX nale�y uruchomi� menu MiKTeX Options, zaznaczy� w podmenu Languages: polish regu�y przenoszenia wyraz�w, po czym w menu TeX Formats wygenerowa� (przyciskiem Build) nowy format latex.fmt, zawieraj�cy polskie wzorce.
Format pdflatex.fmt dla tworzenia plik�w PDF tworzony jest analogicznie.

W omawianych wy�ej przypadkach tworzony jest plik formatu latex.fmt (lub pdflatex.fmt), kt�ry jest umieszczany w katalogu w�a�ciwym dla tego rodzaju plik�w, oraz tworzony jest program latex lub pdflatex


II. U�ycie

Aktualne implementacje, oparte na Web2c, a tak�e MiKTeX pozwalaj� na prawid�owe przekodowanie znak�w diakrytycznych w pliku TeX-owym na wewn�trzn� reprezentacj�, stosowan� przez programy. W Polsce, niestety, stosowane s� r�ne ,,standardy'' kodowania diakrytyk�w w tworzonych przez u�ytkownika plikach, zale�nie od systemu operacyjnego. Dla potrzeb systemu TeX u�ywamy zewn�trznych, tekstowych plik�w TCX, pozwalaj�cych ,,obs�u�y�'' r�ne spotykane ,,standardy''. Dzi�ki temu przekodowanie dzia�a te� w drug� stron�, kiedy TeX wy�wietla komunikaty i zapisuje pliki .log, a tak�e pliki ze spisem tre�ci, skorowidzem itp.

Uruchomienie polecenia:
latex --translate-file=TCXFILE myfile.tex
oznacza uruchomienia TeX-a z formatem latex.fmt i z odpowiedni� tablic� przekodowa� (ich lista znajduje si� poni�ej).

Przekodowanie (plik TCX) mo�e by� deklarowane bezpo�rednio w pliku TeX-owym. Przyk�adowo, je�li pierwszy wiersz pliku zawiera komentarz strukturalny postaci
%&latex --translate-file=il2-pl
to plik mo�e by� przetworzony za pomoc� polecenia pdftex plik.tex; zostanie wtedy wczytany format latex.fmt oraz tablica il2-pl.tcx przekodowania z uk�adu iso8859-2 do uk�adu font�w PL (wewn�trznego dla programu TeX; w LaTeX-u ma on kryptonim OT4).

Tym samym zb�dna jest deklaracja w preambule pliku LaTeX-owego:
\usepackage[latin2]{inputenc}

\usepackage[OT4]{fontenc}

W dystrybucjach dostarczono szereg plikow TCX. Mo�na je znale�� w katalogu texmf/web2c/:
amiga-pl.tcx AmigaPL do PL
il2-pl.tcx iso8859-2 (latin2) do PL
cp1250pl.tcx Windows cp1250 do PL
cp852-pl.tcx IBM cp852 do PL
macce-pl.tcx Apple MacCE do PL
maz-pl.tcx Mazovia do PL

A oto przyk�ad pliku LaTeX-owego:

        %& --translate-file=cp1250pl
        \documentclass[a4paper]{article}
        \usepackage{polski}
        \begin{document}
          Polskie literki piszemy w standardzie Windows cp1250: .....
        \end{document}
Jak wida�, nasz plik ma kr�tk� preambu�� -- pakiet polski korzysta domy�lnie z zainstalowanych font�w PL (odpowiada mu uk�ad OT4, wi�c zb�dna jest deklaracja \usepackage[OT4]{fontenc}). Je�li korzystamy z font�w EC nasza preambu�a powinna zawiera� dodatkowy wiersz:
\usepackage[T1]{fontenc}

III. Polskie fonty PostScriptowe

Aktualne dystrybucje zawieraj� fonty w wersji Type 1 (postscriptowe) serii PL (spolonizowane standardowe dla TeX-a fonty CM), a tak�e znacznie rozszerzone i obecnie zalecane fonty Latin Modern. Mo�na je tak�e znale�� w najbli�szym w�le CTAN lub jego kopii, np.:
ftp://ftp.gust.org.pl/pub/CTAN/language/polish/plpsfont/.
ftp://ftp.gust.org.pl/pub/CTAN/fonts/lm/.

Przedstawimy tu przyk�ad dotycz�cy instalacji font�w PL. Pliki .pfb powinny znale�� si� w podkatalogu texmf/fonts/type1/public/pl/ naszej instalacji, pliki map fontowych (.map) w katalogu texmf/fonts/map/dvips/pl/ za� wektory kodowa� (.enc) -- w katalogu texmf/fonts/enc/dvips/pl/

W dystrybucjach opartych na Web2c zautomatyzowano, poprzez u�ycie programu updmap, proces tworzenia map fontowych dla program�w dvips, pdftexdvipdfmx. Poni�ej om�wiono wi�c tylko, czego ten proces dotyczy.

Sterownik dvips (zamieniaj�cy wynik pracy TeX-a, plik DVI, do formatu PostScript) wymaga aby deklaracje map fontowych (dla font�w PL konkretnie zawarto�� texmf/fonts/map/dvips/pl/pl.map) by�y do��czone do pliku texmf/fonts/map/dvips/updmap/psfonts.map. Mapy fontowe mo�na alternatywnie do��czy� w pliku texmf/dvips/config/config.ps (lub jego lokalnej kopii), dopisuj�c wiersz:
p +pl.map
po deklaracji g��wnej mapy fontowej: p psfonts.map.

Aby fonty Type 1 by�y u�yte przez program pdfTeX, nale�y sprawdzi� jakie mapy fontowe s� deklarowane w pliku texmf/fonts/map/pdftex/updmap/pdftex.map -- powinien on tak�e zawiera� deklaracje map fontowych dla font�w PL.

W dystrybucjach wszystkie aktualnie dost�pne polskie fonty Type1 s� gotowe do u�ycia zar�wno przez program dvips, pdftex, jak i dvipdfmx .

Bardziej szczeg�owe om�wienie instalacji font�w Type1 zawarte jest w artykule Instalowanie font�w Type1/True Type.


Staszek Wawrykiewicz (StaW at gust dot org dot pl), 30.05.2008.