Tihtipeale on internetist tõmmatud filmil kaasas subtiitrid .SUB/.IDX formaadis. Mitmed programmid oskavad neid kohe kasutada (näiteks VLC) ja mõned vajavad lisaprogrammide abi. See eest SRT formaadis subtiitritega saavad pea kõik meediamängijad ilma mingeid lisasid nõudmata hakkama.
Olen proovinud mitmeid programme ja lõpuks on minu lemmikuks saanud Subtitle Edit. Tema teisi vingeid võimalusi, peale .IDX/.SUB .SRT formaati konverteerimise pole ma proovinud aga need ei ole ka praegu teemaks. :) Subtitle Edit kasutab konverteerimiseks optilist märgituvastust (OCR, Optical character recognition). See on küll natuke ebamugav aga paremat moodust ma leidnud ei ole.
Hakkame aga pihta:
Programm tuleb kasutamiseks lihtsalt lahti pakkida. Mingit installeerimist pole vaja.
Käivita programm ja sulle avaneb umbes niisugune aken:
Pane paika filmi kaadrisagedus (1) ja vali teksti kodeeringuks ANSI (2).
Vajuta Open (3) ja näita programmile ette .SUB fail.
Küsimusele "Import this VobSub subtitle" vasta "Yes" (4).
Avanenud aknas vali sobiv keel (5) ning vajuta "OK" (6).
Pane paika tuvastusmeetod (7), millist andmebaasi kasutada (8) ning vajuta "Start OCR" (9). Mina kasutan meetodit "OCR Via image compare", st võrreldakse subtiitris ja programmi andmebaasis olevaid märke. Kui ette tuleb mõni tundmatu märk, siis küsitakse minu käest, et millise märgiga tegu on. Minu vastus salvestatakse samuti andmebaasi.
Järgmisel pildil näidatakse mulle subtiitrist leitud tundmatut märki kontekstis (10) ja eraldi (11). Minu sisestatud vastus läheb kasti 12 ning selle kinnitamiseks tuleb vajutada OK (13). Kui subtiitrites on ka kaldkirjas märke, siis pane nende käsitsi tuvastamise ajaks linnuke kasti "Italic" ja ära unusta seda pärast ära võtmast.
Nüüd tuleb aidata programmil subtiiter aidata lõpuni kodeerida, lõpuks "OK" vajutada ning .SRT formaadis subtiiter Fail menüü -> "Save As..." kaudu salvestada.
Muud tähelepanekud:
- Programmiga algselt kaasas olev andmebaas ei ole kuigi hea. Esimestel kordadel tuleb kõik suur- ja väiketähed, numbrid ja erimärgid (püstises ja kaldkirjas eraldi) programmile ette näidata. Hiljem läheb juba libedamalt.
- Mina olen tavaliselt kõik "OCR Auto Correction" asjad ära keelanud.
- Kui vähegi võimalik, siis käin ma programmi poolt toodetud .SRT faili õigekirjakontrolliga üle - vahest kipuvad programmil ikka suured i’d ja väikesed l’id segi minema.
- Programm pakub võimalust kasutada Microsoft Office Document Imaging märgituvastust. Ei saanud head tulemust.
- OCR via Tessaract on uus ja kõvasti parem meetod aga siis jääb ikka spellerile väga palju tööd. Sellega pole ma jõudnud veel eriti mängida.
- Postituses kirjeldatud meetod on minul siiani kõige parema tulemuse andnud.
- Programm võtab protsessorist, mis võtta annab. Arvutit pole kokku jooksutanud aga ventilaatorite kiire vuhin on tahtnud kasti pea laualt õhku tõsta.
Järgmise sammuna võiks filmi ja subtiitrid pakkida ühisesse MKV (maktroska) konteinerisse, et subtiitrid ja film tulevikus lahku ei läheks.