ЗАСТОСУВАННЯ СТАТИСТИЧНИХ МЕТОДІВ ДЛЯ АНАЛІЗУ ТЕКСТІВ ПЕРЕДВИБОРЧИХ ПРОГРАМ
DOI:
https://doi.org/10.31471/2304-7410-2019-4(56)-109-115Ключові слова:
передвиборча програма, метод багатовимірного шкалювання, кореляційний аналіз, кластерний аналіз, хмарка слів.Анотація
Сучасна статистика має в своєму арсеналі методи формалізації (вимірювання) об’єктів найрізноманітнішої природи. Зокрема це стосується текстів, так званої, природної мови. В статті за допомогою статистичних методів проаналізовано тексти передвиборчих програм кандидатів на пост Президента України на виборах 2019 року. Застосовуючи метод багатовимірного шкалювання утворено набір даних, який складається з двох числових характеристик, що описують особливості розглянутих текстів програм. За допомогою кореляційного аналізу встановлено зв’язок між текстами передвиборчих програм кандидатів та офіційними результатами першого туру виборів, а також результатами загальнонаціонального екзит-полу. Застосовуючи процедури кластеризації методом Уорда, виділено чотири групи кандидатів на пост Президента України. Встановлено особливості текстів програм побудованих груп і створено хмарки ключових слів для швидкого сприйняття найбільш вживаних слів і їх розподілу за популярністю відносно один одного. Підготовку даних та всі статистичні обчислення здійснено з допомогою середовища статистичних розрахунків R.
Посилання
R Core Team (2018). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL https://www.R-project.org/.
UGTag – a morphological tagger for Ukrainian language. – Режим доступу: http://www.domeczek.pl/~polukr/parcor/