Teksto statistikos pateikimas politinei analizei
Teksto statistikos atvaizdavimas panaudojant "žodžių debesį" yra paprastas ir pakankamai informatyvus įrankis leidžiantis greitai apžvelgti politikoje vyraujančias temas. Didžiausias tokios analizės trūkumas yra tai, kad nesimato žodžių vartojimo konteksto. Analizuojant LR Seimo svarstomas temas atrodo, kad viena iš pagrindinių šios institucijos užduočių yra "komisijos". Tačiau gali būti kad žodis "komisija" tebuvo labai dažnai minimas viename posėdyje. Visų kitu šimto ir daugiau posėdžių metu tokia tema nebuvo svarstoma. Tačiau statistikoje tai neatsispindėtu. Tada teiginys kad Seimas užsiima tik komisijomis, būtų neteisingas. Taip pat ir patys žodžiai gali turėti skirtingas reikšmes skirtinguose kontekstuose, todėl turėtų būti galimybė pamatyti teksto dalį kurioje žodis yra varytojams. Būtent tokie teksto statistikos pateikimo patobulinimai yra padaryti The New York Times JAV prezidento kalbų analizės įrankyje. (Priminimui tos pačios informacijos pateikimas panaudojant žodžių "debesį")