Paistab, et internetis on inimestel mure sellega, kuidas mõne veebisaidi sisu koos lehekülgede struktuuriga kätte saada. Kuna ma pole progeja, siis ei oska ma ühtegi klik-klik-klikk-tehtud lahendust pakkuda aga mõned mõtted mul selle kohta siiski on.
* * *
Kogu veebisaidi sisu saab alla tõmmata niisuguse programmiga, nagu HTTrack. Kui parameetrid osavalt paika panna, siis tulevad kaasa nii pildid, dokumendid ja kogu muu kraam, mida saidi omanik on otsustanud veebi panna.
Lõpuks saad oma kõvakettale veebilehe, kus kõik lingid jms töötavad aga näiteks kui sait kasutab kõvasti dünaamilisi URL’e, siis on sul igast lehest mitu koopiat ja failinimed on täiesti mitte midagi ütlevad. Selleks, et saadud materjalist töötav staatilise HTML’iga kodulehekülg saada, tuleb seal pärast käsitsi nii palju tööd teha, et suuremat mõtet sellel pole.
Vähegi suurema saidi puhul ei ole seda meetodit mõtet kasutada. Samas sobib HTTrack hästi siis, kui sa tahad mingist saidist kõik .zip, .pdf või pildifailid kätte saada.
* * *
Kunagi olen ma ühe niisuguse mitmesjalehelise saidi, mille kõik andmed olid ühes tabulaatoritega eraldatud TXT failis, WordPressi üle kantinud. Võtsin selle .TXT faili Excelisse, lisasin kõvasti veerge kuhu kirjutasin XML tagid ning lõpptulemuseks sain XML faili, mida WordPress oli nõus importima. Selle meetodiga ei saanud ma kommentaare kaasa aga sellest polnud tookord lugu. Kategooriad, kuupäevad-kellaajad, pildid, jne olid pärast kenasti paigas.
* * *
Peale seda, kui sa oled oma sisu mingist eksporti mittevõimaldavast CMS’ist ükskõik millisesse tuntumasse CMS’i (WordPress, Joomla, Drupal, jne) saanud, ei tohiks nende omavahelise andmevahetusega enam eriti probleeme olla. Goolge otsing esimeseCMSinimi teineCMSnimi import aitab terve hunniku erinevate õpetustega. Kui kahe CMS’i vahel import/eksport otse ei tööta, siis on kindlasti olemas mingi lahendus seda asja läbi kolmanda CMS’i teha.
* * *
Kiire otsing andis mulle tulemuseks, et kõik suuremad CMS'id on nõus importima / eksportima XML'i. Seega on tegelikult probleemiks see, kuidas olemasolev sisu ilusasti XML'iks teha. Muidugi tuleb siinkohal eriti tähele panna seda, millise struktuuriga XML faili uus CMS kasutada oskab ja tahab. Mõningase dokumentatsiooni lugemise ja käsitsitööga peaks asja korda saama ning midagi kaelamurdvat ei tohiks siin olla.
Käesolev postitus on inspireeritud abiraha.blogspot.com postitusest Kodulehe ümbertõstmine.
Seda kõik siis juhul kui ei pääse FTP’d pidi kataloogi sisse, mida saaks klikates alla laadida (kogu struktuur ja failinimed nagu peab).
muidugi aitab ilma progeta ka see, kui avatud veebilehel kasutada File -> Save Page As. aga seda peab siis iga alamlehe peal kasutama :)
Kui sul on dünaamiline leht, siis on FTP ligipääsust vähe abi sest sisuandmed on ju tegelikult andmebaasis.
Andmebaasi saab küll phpMyAdmin’i kaudu eksportida aga seda eksporditud faili pole tavaliselt teine CMS nõus sööma.
Noh, asja teevad keerukamaks kinnine kood ja ülejala kokkukäkerdatud andmebaas. Nagu ühel teataval S-tähega CMS-il.
Ok, oma isiklikku CMS-i olen ma hea meelega nõus häkkima, aga ametiveebi küll mitte :)
Aga kui kood on suletud ja mingit eksporterit pole, siis ei jäägi muud üle, kui läbi ussi organite häkkida.
Vabandust, rõhk oli siin *ise* häkkima :)