Tegin väikse katse ning võtsin delfi.ee, epl.ee ja postimees.ee esilehe ning kopeerisin kogu lehel oleva teksti Wordi. Peale seda eemaldasin ma sealt kõik numbrid, kirjavahe- ja muud erimärgid nii, et järele jäid ainult lehel kasutatud sõnad.
Seejärel sisestasin erinevate väljaannete lehtedelt saadud sõnad ükshaaval wordle.net sõnapilve koostamise tööriista, keelasin omavolilise sõnade väljajätmise, muutsin fondi Lucida Sans peale, keerasin kõik sõnad horisontaali ja määrasin kasutatavateks värvideks musta ja valge. Üksikuks jäänud tähed on siiski automaatselt välja jäetud.
Delfi.ee
Pole suuremaks üllatuseks, et enim on kasutatud sõnu ON ja JA. Enimkasutatud sõnad ja (57), on (54) eesti (30), delfi (30) ja vaata (25). Delfile meeldib endast kirjutada, nemad on ainukesed, kellel väljaande nimi Top5 figureerib.
Epl.ee
Võiks arvata, Epl.ee on otsingu "avalda arvamust" kindel liider aga ei ühti, Googles pole nad selle otsinguga isegi esilehel. Kõige rohkem kasutati sõnu arvamust (72), avalda (63), eesti (26), on (26) ja ja (21).
Postimees.ee
Postimees on kõige negatiivsemate uudistega - ainult neil pääses EI esimese viie enimkasutatava sõna hulka. Sõnadest kasutati kõige tihedamalt on (22), ja (27), eesti (26), uudised (16) ning ei (12).
Ma oleks side, määr- ja asesõnad ka välja visanud. Ja artiklid võtnud stiilis wget -r -L2 delfi.ee
Edasine puhastamine oleks liiga ajamahukas olnud. Wget võtab ju lehe HTML koodi, st ma oleks selle puhastamisega veel rohkem pidanud vaeva nägema.
Ja ERR uudised?
Nüüd on juba 2 päeva möödas ja praegu err.ee’d analüüsida ei oleks enam õiglane.