Käytännön ohje käännöstyöhön

Kotoistuswiki

Loikkaa: valikkoon, hakuun

Sisällysluettelo

[muokkaa] Perusasiat

[muokkaa] Käännöstiedoston, eli fi.po-tiedoston anatomia

Suurin osa vapaista ja avoimen lähdekoodin ohjelmista käyttävät monikielisen käyttöliittymän luomiseksi GNU gettext -ohjelmointikirjastoa. Se toimii rankasti yleistettynä siten, että ohjelman lähdekoodia käyttäen luodaan POT-mallitiedosto, joka sisältää kaikki ohjelman käyttöliittymässä esiintyvät sanat ja lauseet (eli viestit, jotka lähdekoodissa ovat yleensä englanniksi). POT-mallitiedostoa käyttäen luodaan jokaista kieltä kohden oma PO-käännöstiedosto, johon viestien käännökset kirjoitetaan.

Esimerkki 1: otos PO-tiedoston sisältä (tavallisesti PO-tiedostossa on satoja tai tuhansia rivejä)

#: modules/gui/qt4/components/interface_widgets.cpp:483
#: modules/gui/wxwidgets/input_manager.cpp:288
msgid "Previous track"
msgstr "Edellinen raita"
#: modules/gui/qt4/components/interface_widgets.cpp:484
#: modules/gui/wxwidgets/input_manager.cpp:289
msgid "Next track"
msgstr "Seuraava raita"

Jokaisen kohdan alussa on viittaus siihen, millä rivillä ja missä lähdekooditiedostossa sanaa tai lausetta käytetään. Samaa sanaa voidaan käyttää useammassa paikassa, jos niiden merkitys on molemmissa yhteyksissä täsmälleen sama. Msgid-rivillä on teksti alkuperäisessä muodossa, ja vastaavasti msgstr-rivillä on sen kotoistus eli lokalisointi.

Esimerkki 2: pikanäppäimen merkitseminen

#: modules/gui/wxwidgets/dialogs/vlm/vlm_panel.cpp:412
msgid "&Clear"
msgstr "&Pyyhi"

Viesteissä voi olla myös erikoismerkkejä. Esimerkiksi &- tai _-merkki (et tai alaviiva) tarkoittaa, että sitä seuraava kirjain toimii pikanäppäimenä. Esimerkin suomenkielisessä käyttöliittymässä siis P-napin painallus suorittaisi Pyyhi-toiminnon. Käyttöliittymässä pikanäppäimet näkyvät siten, että kirjaimen alla on pieni alleviivaus (esim. Pyyhi).

Esimerkki 3: paikkamerkki

#: src/extras/getopt.c:633
msgid "option `%s' is ambiguous\n"
msgstr "valitsin ”%s” ei ole yksiselitteinen\n"

Erikoismerkki %s on paikkamerkki, jolla ohjataan mihin kohtaa ohjelma täyttää jonkin syötteen. Se on tarpeellinen, koska eri kielissä on erilainen sanajärjestys.

Esimerkkinä kokonaisesta PO-tiedostosta voi katsella vaikkapa Evolution-sähköpostiohjelman PO-tiedostoa, joka löytyy Gnomen versionhallinntajärjestelmästä. Katselemalla tätä tiedostoa huomaa, että yllä esitettyjen periaatteiden lisäksi PO-tiedoston alussa on aina hieman projektiin liittyvää tietoa ja mm. kääntäjien nimet. Osissa käännöksistä on merkintä fuzzy eli sumea tai epätarkka. Se tarkoittaa, että käännös ei ole hyvä, ja jonkun tulisi paneutua siihen tarkemmin.

[muokkaa] Uusimman PO-tiedoston hankkiminen

Aloittelijan kannattaa aloittaa suomentamalla sellaista ohjelmaa, jonka suomennoksen joku muu on jo pannut alulle. PO-tiedostot löytyvät yleensä samasta paikasta kuin ko. projektin muutkin lähdekoodit eli versionhallintajärjestelmästä. Sen voi myös saada vaikkapa sähköpostitse, jos sitä pyytää suomennoksesta vastaavalta henkilöltä. Pääasia on varmistaa, että PO-tiedoston lähde on virallinen ja että PO-tiedosto on uusin mahdollinen (ettei kaksi ihmistä tekisi päällekkäistä työtä kääntäessään jo käännettyjä tekstejä).

Suomenkielisen tiedoston nimi on aina fi.po.

[muokkaa] PO-tiedoston muokkaaminen, eli varsinaisen käännöstyön tekeminen

PO-tiedosto on aivan tavallinen tekstitiedosto, joten sitä voi muokata millä tahansa tekstieditorilla. Käännöstyötä varten on kuitenkin tehty erityisiä ohjelmia, joiden avulla se on nopeampaa.

[muokkaa] Sanastot

Pyri noudattamaan oikeakielisyyden lisäksi niitä yhtenäisiä tietotekniikan käännössanastoja, joita ovat tämän wikin Sanakirja ja http://www.lokalisointi.org/sanakirja/kaikki.html. Vasta näistä sanakirjoista katsottuasi kannattaa kääntyä yleisempien sanakirjojen puoleen. Jos termivaihtoehtoja on useita, katso kumpaa Google pitää yleisempänä. Vaikeimmat kohdat kannattaa merkitä sumeiksi ja jättää hautumaan. Apua voi myös pyytää kokeneemmilta kääntäjiltä.

Jukka Korpelan sivuilla on myös erinomainen listaus tietotekniikan alan sanastoista. Lisäksi kannattaa tarkistaa Sanastokeskus TSK:n Tietotekniikan termitalkoot -projektin sanasto, jonka laadinnassa on ainakin ollut mukana monta tahoa.

[muokkaa] PO-tiedoston oikoluku

PO-tiedostolle voi ajaa automaattisen oikoluvun, joka etsii kirjoitusvirheitä. Ks. http://voikko.sourceforge.net/po-oikoluku.html

[muokkaa] MO-tiedoston luonti ja käännöksen testaaminen

Kun PO-tiedosto on valmis, voi siitä luoda konekielisen MO-tiedoston komennolla msgfmt -c -o ohjelmannimi.mo fi.po. Tämän jälkeen tiedosto pitää kopioida hakemistoon, jossa käyttöjärjestelmä säilyttää suomennoksia. Ubuntussa päähakemisto on /usr/share/locale/fi/LC_MESSAGES. Kun tämän jälkeen käynnistää suomennettavan ohjelman, näkyy siinä tuoreet käännökset.

Kaikki käännökset kannattaa tarkistaa käytännössä ohjelmaa käyttämällä, koska vain siten selviää eri sanojen ja ilmaisujen tarkka asiayhteys ja se sopivatko ne siihen.

[muokkaa] Laadunvalvonta

Kun olet itse tarkistanut suomennoksesi, pyydä siihen kommentteja laatulistoilta:

[muokkaa] PO-tiedoston lähettäminen takaisin projektille (upstream)

Kun PO-tiedosto on mielestäsi valmis, tai et jaksa enää suomentaa enempää, kannattaa se lähettää takaisin projektille, jotta tekemäsi työ tulisi käyttöön tai muut suomentajat voisivat jatkaa työsi jalostamista. PO-tiedoston lähetys onnistuu helpoiten sähköpostin liitetiedostona sille henkilölle, jolla on pääsy projektin versionhallintajärjestelmään.

[muokkaa] poEdit

Oma suosikkini on poEdit lähinnä sen selkeyden ja helppokäyttöisyyden takia. Siinä on myös kaikki käännöstyötä helpottavat ominaisuudet, joita itse tarvitsen, kuten merkkijonojen helppo etsiminen, kursorin automaattinen keskittäminen suomennoskenttään, tekstiluettelossa liikkuminen Ctrl+ylös/alas-näppäimillä, käännettyjen, sumeiden ja kääntämättömien tekstien selkeä erottelu, käännösmuisti jne. Se soveltuu todennäköisesti hyvin myös tämän wikin lukijalle, koska se toimii niin Linux-, Mac- kuin Windows-ympäristössäkin.

Jos käytät Ubuntua, asenna ohjelma valitsemalla Sovellukset-valikosta Lisää/poista..., ja hae sanaa "poedit" kaikista saatavilla olevista sovelluksista. Asennuksen jälkeen poEditin pitäisi löytyä Sovellukset-valikon kohdasta Ohjelmointi. Käynnistä se ja lue ohjeet läpi, koska ne ovat varsin hyvät ja hyödylliset.

Kuva:Http://linux.sange.fi/muut/Kuvakaappaus-Poedit.png

[muokkaa] poEdit ja MO-tiedostot

Asetuksia muokkaamalla poEditin voi asettaa toimimaan siten, että se luo automaattisesti mo-tiedoston auki olevasta po-tiedostosta, kun Tallenna-nappia painetaan. Tämän jälkeen ei tarvitse muuta kuin kopioida mo-tiedosto järjestelmän siihen kansioon, josta ohjelmat lukevat käännöstiedostoja.

Itse ajoin Ubuntussa VLC:tä suomentaessa komennon sudo ln -s /home/otto/lokalisaatio/vlc/fi.mo /usr/share/locale/fi/LC_MESSAGES/vlc.mo, jolloin kyseisen symbolisen linkin kautta VLC lukee käynnistyessään aina uusimman suomennoksen. Sitten oli helppo testata suomennosta, kun po-tiedoston tallennuksen jälkeen ei tarvinnut kuin käynnistää VLC uudestaan, ja uudet tekstit olivat heti näkyvissä.

[muokkaa] poEdit ja käännösmuisti (TM)

Koska useimmissa ohjelmissa toistuu samat sanat ja lauseet, on käännöstyö usein saman asian toistamista uudestaan ja uudestaan. Koska tietotekniikassa usein toistuvat asiat kannattaa automatisoida, on poEditissäkin käännösmuisti-toiminto (translation memory). Se lukee läpi kaikki olemassa olevat käännökset, ja muodostaa niistä sanastotietokannan, jota voi käyttää käännösten automatisoimiseen.

Avaa valikosta Tiedosto > Omat valinnat. Käännösmuisti (TM) -välilehdellä lisää kielivalintoihin "fi", ja paina Luo tietokanta. Ohjelman sitä kysyessä lisää polut /usr/share/locale/ ja /use/share/locale-langpack, koska Ubuntussa näissä hakemistoissa sijaitsee suurin osa mo-tiedostoista.

Tämän jälkeen voit ajaa, po-tiedoston auki ollessa, valikosta toiminnon Katalogi > käännä automaattisesti käyttäen TM, jolloin poEdit yrittää arvata suuren määrän suomennoksia. Suurin osa suomennoksista menee tietysti pieleen, mutta ne vähentävät silti työmäärää. Kaikki tietokoneen tekemät suomennokset merkitään sumeiksi (fuzzy) eikä ne näy käyttöliittymässä, ennen kuin ihminen on tarkistanut käännöksen ja poistanut sumea-merkinnän.

Myös ihmisen tekemän käännöksen voi merkitä sumeaksi, jos se vaatii lisää miettimistä. Jokaisen käännöksen yhteyteen voi myös kirjoittaa kommentteja. Molemmat toiminnot löytyy valikosta Muokkaa (tosin poEditissä sumeasta käytetään termiä epätarkka).

Kuva:Http://linux.sange.fi/muut/Kuvakaappaus-Poedit-TM.png

[muokkaa] Lisätietoja

Henkilökohtaiset työkalut