Pro zjednodušené vyjádření textu se někdy používá metoda tzv. wordclouds, tedy mraků nebo shluků slov. Slova, která jsou v textu častá, se zobrazí velkým písmem, méně časté výrazy pak menším písmem nebo se neobjeví ve vizualizaci vůbec.
Jako způsob analytického zpracování textu je tato metoda možná trochu kontroverzní. Pro jedny elegantní a jednoduchá pro jiné zjednodušující až zavádějící. Ale každopádně zajímavá. Při vytváření wordcloudů je třeba (stejně jako před jiným analytickým zpracováním) z textu odstranit pomocná slova (tzv. stop words), která nenesou žádný význam, tedy zvratná zájmena, spojky atd. Jenže, co když chcete zobrazit známá literární díla. Tady možná stojí zato ponechat i pomocná slova. Ať je vidět, čím si kdo vypomáhá.
Já jsem naopak odstranil vlastní jména nebo tituly a některá příliš specifická toponyma, ale jinak jsem texty ponechal beze změny. Podaří se vám uhodnout, která díla se skrývají pod jednotlivými wordcloudy?
Pod čísly 1 až 7 se nachází:
- Údolí strachu – Arthur Conan Doyle
- Jak chutná moc – Ladislav Mňačko
- Zápisky z mrtveho domu – Fjodor Michajlovič Dostojevskij
- Sestřička – Raymond Chandler
- Máj – Karel Hynek Mácha
- R.U.R. – Karel Čapek
- Konec starých časů – Vladislav Vančura
Kliknutím zvětšíte obrázek