Tegin väikese katse ja vaatasin, et millest meie põhiseadus ka koosneb. Sõnadest ikka, aga millistest?
Tulemused on siin:
Kõige pikem Eesti Vabariigi põhiseaduses kasutad sõna on 28 tähemärgine "riigikaitseorganisatsioonide". Sellele järgnevad kohe "riigikaitseorganisatsioone" (26) ja "mittetulundusühendustesse" (25).
Kõige rohkem on seaduses kasutatud järgmiseid sõnu:
- ja (288)
- on (191)
- riigikogu (138)
- vabariigi (127)
- või (110)
- eesti (92)
- ei (84)
- seadus (77)
- ning (59)
- kui (58)
- õigus (54)
- põhiseaduse (50)
Kokku on seaduses kasutatud 1994 erinevat sõna. Sõnade erinevad käänded ja pöörded on arvestatud unikaalsete sõnadena.
* * *
Huvilistele on kõik sõnad tähestiku järjekorras saadaval siin: Põhiseaduse sõnad. Nende abil saad ise igasugust statistikat teha. Kui kasutad, siis võiksid ka käesolevale postitusele viidata.
* * *
Võtsin Riigiteatajast Põhiseaduse teksti ja kopeerisin selle plain text’ina Word’i. Word’i statistika näitas, et tekst koosneb 6864 sõnast ja 48 436 märgist. Eemaldasin kõik numbrid, kirjavahemärgid, reavahetused, tabulaatorid, jutumärgid, jms mittesõnalise kraami. Peale seda jäi seadusest alles 6294 sõna ja 46 185 märki. Majandasin saadud teksti Excelis et eeltoodud numbrid leida. Mõlemad pildid on tehtud Wordle.net abil.
Idee leidsin ühest blogist mille aadressi ma kahjuks ei mäleta. :(
Kas Sul tõepoolest mitte midagi targemat teha pole, kui semantilisele reguleeritud üllitisele matemaatilist analüüsi teha?
Anna kannatust…
Parasjagu polnud jah.
No ja vahest harva võib mõnest kasutust teadmisest ka kusagil kasu olla.
Oleks pidanud sidesõnad jms samuti eemaldama
… ja kõik erinevad sõnavormid ühele kujule viima?
Nii palju mul kah vaba aega polnud ja igale huvilisele on ju ettevalmistatud materjal saadaval.
Said siis targemaks?
Mina küll ei saanud.
Mina sain. Ennem ma neid numbreid ei teadnud. Ma olen muidugi nõus, et tegu pole maailma kõige vajalikuma teadmisega.