Linux v slovenčine

Obsah

 

Úvod

Na to, aby operačný systém umožnil používanie národného jazyka a abecedy, sú potrebné dva dôležité komponenty. Systém musí byť v prvom rade internacionalizovaný, čím sa umožní používanie národnej abecedy a klávesnice. Inými slovami, internacionalizovaný systém používateľovi umožní písanie nových textov a zobrazovanie textov napísaných inými autormi v jeho vlastnom jazyku, so správnou interpunkciou či v jeho abecede. Za internacionalizáciu zodpovedajú programátori a vývojári systému.

Internacionalizovaný systém však ešte nemusí s používateľom komunikovať v jeho vlastnom jazyku. Na to je potrebný druhá súčasť, lokalizácia programov, ktorá spočíva v preklade používateľského rozhrania a návodov. Tu ide bezpochyby o omnoho náročnejšiu úlohu, lebo programov a jazykov je veľa. Zatiaľ čo všetky moderné systémy dnes sú plne internacionalizované (so všetkými, pre nás neobvyklými vlastnosťami, ako je napríklad písanie sprava doľava a rôzne abecedy - hebrejská, arabská čínska či japonská), s lokalizáciou to býva horšie. Pokiaľ za lokalizáciu zodpovedá výlučne dodávateľ, sme odkázaní na jeho ponuku - tu sme obvykle "vďační" aj za českú verziu, ktorá síce nie je ideálna, ale mnohokrát prijateľnejšia, ako štandardná anglická verzia.

V prípade otvoreného softvéru je lokalizácia, obdobne ako aj všetko ostatné, v našich rukách. Len na nás používateľoch záleží či budú naše obľúbené programy prístupné v slovenčine a aká bude kvalita prekladov. Na Slovensku preto vzniklo viacero lokalizačných tímov, ktorá sa zameriavajú na preklady jednotlivých aplikácií a komponentov - OpenOffice.org, Firefox, Gnome, či KDE. Prekladateľská práca však nikdy nebude ukončená - vznik nových programov, či zmeny v existujúcich vyžadujú stále nové preklady a prekladateľov stále nie je dostatok.

Samotná lokalizácia Linuxu a otvorených programov nespočíva len v prekladaní používateľského rozhrania. V širšom zmysle je jej súčasťou aj tvorba voľne šíriteľných slovníkov pre kontrolu pravopisu, slovensko-... a ...-slovenských slovníkov či pravidiel pre delenie slov. Tu ide z technického hľadiska o pomerne málo náročnú činnosť - o to je však dôležitejší obsah a zapojenie sa učiteľov slovenčiny či študentov jazykových odborov.

V tomto dokumente by sme radi priblížili detaily súvisiace s internacionalizáciou a lokalizáciou, zoznámili našich čitateľov s postupmi, ako sa programy prekladajú, v nádeji, že pre jednotlivé tímy získame ďalších prekladateľov a že celková slovenskej lokalizácie sa tak postúpi ďalej. V neposlednom rade chceme prostredníctvom propagácie prekladania oboznámiť širokú verejnosť s princípmi, na ktorých vývoj otvoreného a slobodného softvéru stojí - najmä s jeho základom, spočívajúcim v dobrovoľnej účasti, pri ktorej si každú môže vybrať to, čo ho najviac baví a čo považuje za najdôležitejšie.

Internacionalizácia systému

Ako sme už v úvode spomenuli, na to, aby sme mohli písať a čítať slovenský text so všetkým, čo k tomu patrí, operačný systém musí byť internacionalizovaný (v tejto súvislosti sa môžme stretnúť so zaujímavou skratkou [b]i18n[/b] - keďže slovo internationalization je dlhé, skracuje sa na [i]i-18 písmen-n[/i]) Internacionalizácia spočíva najmä v podpore národnej klávesnice a vybavení písmami (fontami) s podporou národnej abecedy a interpunkcie. Základom oboch je však kódovanie jednotlivých národných abecied.

Krátka história kódovania znakov

Zrejme nikoho neprekvapí, že spočiatku počítače a ich operačné systémy používali len základnú sadu znakov bez diakritiky. Táto sada je definovaná v norme ASCII (American Standard Code for Information Interchange) a definuje kódy pre 128 znakov - teda presne polovicu počtu, ktorý sa zmestí do jedného bajtu. Zvyšok bol voľný a spočiatky sa využíval viac-menej náhodne, napr. pre grafické znaky (Norton commander, NC). U nás trochu neskôr vznikol tzv. kód Kamenických, ktorý túto sadu doplnil tak, aby pri zachovaní grafiky pre NC bolo možné zobrazovať aj našu (českú a slovenskú) diakritiku. [h2]Normalizácia v 8 bitoch[/h2] Ak si majú viacerí používatelia navzájom vymieňať údaje, musia sa dohodnúť na ich formáte - tak vznikajú normy. Milou vlastnosťou noriem je, že ich býva viac a že sú navzájom nekompatibilné. Oblasť kódovania znakov je vynikajúcim príkladom. Pre 8-bitové znaky a slovenčinu (či presnejšie: stredoeurópske jazyky) sa bežne používajú dve normy. Jedna z nich v prostredí OS Windows - CP1250, druhá je normou Medzinárodnej organizácie pre normalizáciu - ISO-8859-2. Obdobné normy sú definované aj pre ostatné jazyky s hláskovou abecedou - ISO-8859-1 pre západoeurópske jazyky, ISO-8859-7 pre gréčtinu a tak podobne ďalej. Pre správne zobrazenie textu samozrejme musíme jeho kódovanie vopred poznať, čo je dôležité najmä v prostredí Internetu. Preto každý HTML dokument má svoje kódovanie uvedené v hlavičke: [code] [/code] Poznámka: Ak sa stránka nezobrazí správne a uvedený alebo podobný riadok na nej nenájdete (vo Firefoxe si možno pozrieť kód stránky stlačením CTRL-U), je to jednoznačne chyba autora stránky. Napíšte mu e-mail s upozornením. [h2]Ako zmeniť kódovanie textového súboru[/h2] Ak poznáme aktuálny kód súboru, môžme ho ľahko zmeniť pomocou programu recode. Napríklad pre zmenu z cp1250 na ISO-8859-2 (známy tiež ako latin2) na príkazovom riadku zadáme [code] recode cp1250..latin2 subor.txt [/code] Aj je to. Po vykonaní je subor.txt uz v novom kodovani. [h2]Unicode[/h2] 8-bitové kódy majú dva závažné nedostatky: [list] [*]Pre mnohé jazyky neposkytujú dostatočný priestor (čínština) [*]Neumožňujú kombinovať rôzne písma v jednom súbore (stále hovoríme o textových súboroch, napr. HTML stránkach. Pre dokumenty pre OpenOffice a iné podobné systémy toto obmedzenie neplatí) [/list] Norma [url=http:en.wikipedia.org/wiki/Unicode]UNICODE[/url] tieto nedostatky odstraňuje. Namiesto špeciálneho kódovania pre jednotlivé jazyky zavádza jedno kódovanie pre všetky. Samozrejme, že to nejde pomocou reprezentácia jedným bytom (8 bitov), unikód ich používa štyri, čo je priestor pre milióny rôznych znakov - to bezpochyby stačí pre pre všetky dnešné, ale aj budúce abecedy. Ale aby to zase nebolo také jednoduché aj UNICODE existuje vo viacerých formách [list] [*] UTF-16(Unicode Transformation Format) používa podľa potreby 1 alebo 2 byty a je štandardom pre Windows API a Javu [*] UTF-8 používa podľa potreby 1, 2 alebo 4 byty, pričom jednobajtové znaky (kód 0-127) sa zhodujú s kódovaním ASCII. Je to najekonomickejšie riešenie a je preferovaným kódovaním pre Internet a pre novšie distribúcie Linuxu (staršie používali ISO-8859-2) [/list] [h2]Krátka ukážka[/h2] Vďaka unikódu je dnes písanie v rôznych písmach a jazykoch a ich vzájomné kombinovanie jednoduché. Stačí si nainštalovať podporu pre danú klávesnicu a možno hneď písať [list] [*]Slovenčina: ďťňľ [*]Ruština: йцукенгш [*]Hebrejčina: 'שדגכעידאט (píše to odzadu!) [*]Arabčina: ضصثقفغ (aj tu) [*]Arménčina: ճփբսմուկըթ [/list] [h1]Vzájomná kompatibilita[/h1] Na úrovni [i]textových súborov[/i] o možno o kompatibilite asi sotva hovoriť. Treba poznať ich kódovanie a v prípade potreby použiť recode na jeho zmenu. Inde by s kompatibilitou nemali byť žiadne problémy. Aplikácie ako OpenOffice či Firefox poznajú kódovanie editovaného dokumentu, rovnako ako aj kódovanie lokálneho počítača - takže prenositeľnosť je zaručená, rovnako ako medzi rôznymi linuxovskými systémami, tak aj smerom k Windows.

Slovenčina pre GNOME

[h1]Nastavenie klávesnice[/h1] Tu sa môžeme s dôverou obrátiť na [url=http://people.tuke.sk//peter.mann/ubuntu/klavesnica.html]návod Petra Manna[/url].

Slovenčina pre KDE

KDE logoUvedený postup bol testovaný s distribúciou Kubuntu 6.10 (jeseň 2006). Mal by byť použiteľný pre všetky novšie distribúcie, ktoré už majú štandardne podporu [url=/node/101]kódovania utf-8[/url]. V prípade starších distribúcií je potrebné voliť kódovanie ISO-8859-2 manuálne, čo nie je celkom triviálne. Odporúčame preto prechod na niektorú z novších. Oplatí sa. [h1]Základné nastavenie klávesnice[/h1] Postup uvádzame pre anglickú lokalizáciu desktopu. Niekto by to mohol prepísať aj pre poslovenčený desktop - nájde sa? Postupne treba vybrať [b]K[/b] (menu) -> [b]System Settings[/b] -> [b]Regional & Languages[/b] -> [b]Keyboard layouts[/b] Otvorí sa okno [i]Keyboard Layouts[/i], v ktorom treba zvoliť [list=1] [*] [b]Enable Keyboard Layouts[/b] [*] V ľavom paneli [b]Available layouts[/b] vybrať [b]Slovakia[/b] [*] Kliknutím na [b]add>>[/b] preniesť do pravého panelu [*] Vpravo dolu kliknúť na [b]Apply[/b] [/list] Tým je slovenská (alebo hocijaká) iná klávesnica povolená. Na spodnom paneli vpravo sa objaví ikonka so zástavkou, kliknutím na ňu prepneme klávesnicu na požadovanú. Obdobne môžme klávesnice prepínať klávesovou skratkou [b]CTRL-ALT-K[/b]. Ovládací panel rozloženia kláves [i]Keyboard layout[/i] otvoríme aj kliknutím pravým tlačítkom myši na zástavku a voľbou [b]Configure[/b] [h1]Ďalšie možnosti nastavenia klávesnice[/h1][list] [*]Základné rozloženie kláves je QWERTZ. Voľba QWERTY je prístupná cez [b]Layout variant[/b]. [*]Rýchle prepínanie slovenského a štandardného (latin) rozloženia kláves pomocou špeciálnej klávesovej skratky. [list=1] [*] V okne [i]Keyboard layout[/i] zvolíme [b]Include latin layout[/b] [*] Zvolíme záložku [b]Xkb Opbtions[/b] a vyberieme si jednu z možností v menu [b]Group Shift-Lock Behavior[/b]. Populárne je prepínanie súčasným stlačením oboch Shift kláves. Volíme teda [b]Both shift keys together change group[/b] [/list] [*]Rozloženie klávesnice nemusí byť jednotné pre všetku okná. Napríklad, slovenskú môžme mať pre OpenOffice, pre ostatné to môžeme mať štandardné rozloženie. Túto voľbu robíme v záložke [b]Switching layouts[/b]/[b]Switching Policy[/b]. Výhodné je voliť [b]Application[/b], lebo v tom prípade sa použije rovnaké nastavenie pre všetky okná daného programu - aj pre tie, ktoré boli otvorené po prepnutí klávesnice. [*]Ďalšie voľby: treba preskúmať [/list] [h1]Používateľské rozhranie v slovenčine[/h1] chystáme...

Slovenčina pre ostatné grafické prostredia

[h1]Nastavenie klávesnice[/h1] Aj u sa môžeme s dôverou obrátiť na [url=http://people.tuke.sk//peter.mann/ubuntu/klavesnica.html#xorg]návod Petra Manna[/url]. V uvedenom prípade sa klávesnice prepínajú súčasným stlačením kláves [b]Alt[/b] a [b]Shift[/b]. Ďalšie možnosti sú uvedené napr. na http://gentoo-wiki.com/HOWTO_X11_Keyboard

Lokalizácia pracovnej plochy a aplikácií

Linux nie je homogénne prostredie, jednou z jeho čŕt je, že v ňom paralelne existuje viacero systémov a programov, ktoré majú podobný účel. Je to dôsledok slobody, ktorú majú vývojári pri svojej práci. My používatelia z toho máme prospech - môžme si vybrať to, čo nám viac vyhovuje. Jednotlivé podsystémy (prostredia KDE, Gnome) či väčšie programy (OpenOffice.org, Mozilla, LaTeX) preto aj majú svoj vlastný mechanizmus, ako sa robia ich preklady. Radi by sme ich tu predstavili. (Zatiaľ sú jednotlivé časti prázdne a možno iné celkom chýbajú. Hľadajú sa dobrovoľníci, ktorí by ich napísal.)

Lokalizácia prostredia GNOME a jeho aplikácií

GNOME je grafické používateľské rozhranie, ktoré pozostáva z veľkého počtu rôznych programov a nástrojov. Všetky potrebné informácie sa nachádzajú na stránke https://live.gnome.org/SlovakTranslation

Lokalizácia prostredia KDE a jeho aplikácií

Coming soon...

Firefox

Prehliadač Firefox, jeho rozšírenia a ďalšie súvisiace programy sa prekladajú prostredníctvom portálu www.babelzilla.org. Slovenská komunita okolo Firefoxu je veľmi aktívna, o čom svedčí aj úroveň ich stránky. Prekladateľské fórum je na stránke forum.mozilla.sk

Viac sa o prekladaní Firefoxu dozviete v príručke Miloša Karasa (pdf, odt).

 

LaTeX

coming soon

OpenOffice.org

Čoskoro...

Slovníky a kontrola pravopisu

Jednou z hlavných požiadaviek pri písaní textových dokumentov je schopnosť editora kontrolovať pravopis. Dobre si to uvedomujú i programátori, ktorí takéto editory vytvárajú. Tvorcovia uzatvorených programov vytvárajú slovníky kontrolujúce pravopis buď sami, alebo v spolupráci s inou firmou. Výsledkom je to, že každý uzatvorený program má svoje vlastné slovníky na kontrolu pravopisu a tiež to, že mnohé z nich slovník na kontrolu slovenčiny nemajú.

Vo svete slobodného softvéru to funguje inak. Existuje niekoľko otvorených slovníkov, ktoré sú používané ostatnými otvorenými programami. Nástroje, ktoré podporujú aj slovenčinu, sú tieto:

  • Ispell je pomerne známy Open Source spell checker (doslovný preklad kontrola hláskovania) pre Unix, ktorý podporuje veľké množstvo európskych jazykov. Zodpovedajúci slovenský slovník nájdete na stránke http://www.sk-spell.sk.cx/ispell-sk
  • GNU Aspell je slobodný spell checker s otvoreným zdrojovým kódom. Bol navrhnutý ako náhrada za Ispell. Môže byť použitý ako knižnica alebo ako samostatný program vo všetkých operačných systémoch. Je navrhnutý tak, aby pri nájdení chyby ponúkol správne slovo na čo najlepšej pozícii. Medzi jeho výhody oproti Ispellu patrí podpora UTF-8 kódovania bez potreby špeciálneho slovníka a možnosť použiť viacero slovníkov naraz. Použitý je napríklad v programe na interaktívnu komunikáciu Pidgin. Slovenský slovník nájdete na stránke http://www.sk-spell.sk.cx/aspell-sk
  • Myspell je nový spell checker, ktorý bol vytvorený Kevinom Hendricksom pre projekt OpenOffice.org. Vo svojej podstate kombinuje pozitíva svojich dvoch predchodcov – vyhľadávací algoritmus Aspellu a affix kompresiu Ispellu. S použitím Myspell sa okrem OpenOffice.org 1 a 2 môžete stretnúť aj v programoch Mozilla Suite 1.7 a Mozilla Thunderbird. Slovenský slovník nájdete na stránke http://www.sk-spell.sk.cx/myspell-sk
  • Hunspell je vylepšenie predchádzajúceho slovníka, o ktoré sa postarali naši južní susedia. Používajú ho najnovšie verzie OpenOffice.org a produkty Mozilly.

V prípade, že používate kontrolu pravopisu v niektorom slobodnom programe a narazíte na slovo, o ktorom ste si istí, že by v slovníku nemalo chýbať, môžete ho do slovníka pridať pomocou online verzie, ktorá je umiestnená na stránke http://www.sk-spell.sk.cx/speller/. Ak naopak zistíte, že sa v slovníku nachádza slovo, ktoré tam nemá čo hľadať, je možné kontaktovať pána Zdenka Podobného zdposter(zavinac)gmail(bodka)com. Pred tým ako to urobíte, môžete si správnosť/nesprávnosť slova overiť pomocou niektorého zo slovníkov, ktorých zoznam je na stránke http://www.sk-spell.sk.cx/externe-projekty, alebo i telefonicky v Jazykovednom ústave Ľudovíta Štúra na čísle +421 2 54431761-2 kl. 124 v pracovných dňoch od 8.00 do 12.00 hodiny alebo na e-mailovej adrese poradna(zavinac)juls.savba.sk.

Pri tvorbe dokumentov je niekedy potrebné hľadať i synonymá slov, aby sme stále dookola neopakovali to isté slovo. Na takýto účel slúži OpenThesaurus-SK - Otvorený slovenský synonymický slovník, ktorý nájdete na adrese http://www.sk-spell.sk.cx/~zdpo/thesaurus/ Myslíme, že bude ku prospechu všetkých, keď vo voľnej chvíli dopíšete nejaké synonymum - stačí sa zaregistrovať a môžete začať vkladať. I tento slovník má na starosti Zdenko Podobný.

Ďalším Zdenkovým dielom je Malý anglicko-slovenský a slovensko-anglický slovník (mass/msas). Za komerčný slovník zaplatíte tisíce korún, no tu máte k dispozícii jeden, ktorý je otvorenýn a teda zadarmo. Je ho možné vložiť do rôznych slovníkových rozhraní, pretože je uložený v otvorenom formáte dict.org. Jedným zo známejších je Stardict (Windows, Linux, FreeBSD, Solaris), ktorý môžete nájsť na adrese http://stardict.sourceforge.net/. Slovník nájdete na adrese http://www.sk-spell.sk.cx/mass-msas. i s návodom ako ho do rozhrania Stardict vložiť. Ak sa vám zdá, že je v slovníku málo slov, nemusí to tak ostať navždy. Z malého slovníka sa kľudne môže s vašou pomocou stať veľký (alebo aj obrovský). Ak máte chuť Zdenkovi pomôcť, môžete tak urobiť aj online na stránke slovníka http://sk-spell.sk.cx/slovniky/index.php/index/mass.xhtml.

V prípade, že chcete aktívne prispievať, musíte sa stať “redaktorom”. Prístup môžete získať, ak pošlete svoju e-mailovú adresu na zdposter(zavináč)gmail.com. Jedinou podmienkou je súhlas s licenciou a s tým, že budete posielať “svoje” preklady a nie výsledok práce niekoho iného. Viac informácií na http://www.sk-spell.sk.cx/mass-je-online.