ТЕОРЕТИЧНІ ОСНОВИ КОРПУСНОЇ ЛІНГВІСТИКИ: ПРИНЦИПИ ПОБУДОВИ ТЕКСТОВИХ КОРПУСІВ
DOI:
https://doi.org/10.31471/2304-7402-2025-21(77)-33-48Ключові слова:
корпусна лінгвістика, текстовий корпус, репрезентативність, машиночитаність, корпусна розмітка, цифрові технології.Анотація
У науковій статті розглянуто теоретичні засади корпусної лінгвістики, окреслено основні принципи побудови текстових корпусів, визначено провідні напрями сучасних корпусних досліджень. На основі аналізу праць українських та зарубіжних дослідників уточнено поняття «текстовий корпус», визначено його ключові параметри (машиночитаність, автентичність, репрезентативність, збалансованість, відібраність, стандартизованість, оперативність опрацювання матеріалу тощо). Розглянуто типові етапи побудови корпусу, зокрема токенізацію, лематизацію, синтаксичний аналіз та розмітку, а також труднощі, пов’язані з формуванням масштабних корпусних ресурсів. Особливу увагу зосереджено на практичному застосуванні корпусів у різних галузях: лексикографії, перекладознавстві, соціолінгвістиці, лінгводидактиці, стилістиці, судовій лінгвістиці та мовній варіантології. У статті також окреслено значення корпусного підходу для сучасної лінгвістики, що передбачає відхід від інтроспекції на користь емпіричних методів аналізу великих обсягів реального мовного матеріалу. Систематизовано основні вимоги до корпусів, подано огляд типологічних характеристик та перспектив подальшого розвитку корпусних досліджень в Україні та світі.
Посилання
1. Войтко Г. Корпусна лінгвістика: історія формування і перспективи розвитку. Теоретичні засади лінгвістичних досліджень. 2014. № 6. С. 208-214.
2. Демська О. М. Текстовий корпус: поняття і визначення. Дивослово. 2011. № 10. С. 35-37.
3. Демська-Кульчицька О.М. Британський національний корпус і національний корпус української мови. Філологічні студії. Луцьк, 2004. № 4. С. 89-95.
4. Демська-Кульчицька О. Основи національного корпусу української мови: монографія. К.: Інститут української мови HAH України, 2005. 218 с.
5. Карпіловська Є. Лексична картотека і корпус як інструмент лексикографічного моделювання слова. Лексикографічний бюлетень. 2015. Вип. 24. С. 15-22. Режим доступу: http://nbuv.gov.ua/UJRN/lecbu_2015_24_5
6. Лук’янець Г. Основні напрямки сучасних корпусних досліджень мови. Наукові праці НУХТ. 2012. № 44. С. 127–132.
7. Лінгвістично-інформаційні студії: праці Українського мовно-інформаційного фонду НАН України: у 5 т. / В. А. Широков та ін. Т. 4: Корпусна та когнітивна лінгвістика. Київ: Український мовно-інформаційний фонд НАН України, 2018. 246 с.
8. Луцак С. М., Юрчак Г. М. Тенденції розвитку прикладної лінгвістики в контексті розвитку наукових галузей. Digital transformations in culture: Scientific monograph. Riga, Latvia: «Baltija Publishing», 2023. P. 255-268.
9. Таран А. Пошукова система й корпус як інструмент дослідження семантики слів. Вісник Черкаського національного університету імені Богдана Хмельницького. Серія: Філологічні науки. 2019. Вип. 1. С. 99-103. Режим доступу: http://nbuv.gov.ua/UJRN/VchuF_2019_1_16
10. Жуковська В. В. Вступ до корпусної лінгвістики. Житомир: Вид-во ЖДУ ім. І. Франка, 2013. 142 с. Режим доступу: https://doi.org/10.30525/978-9934-26-319-4-15
11. Baker M. Corpora in translation studies. An overview and suggestions for future research. Target. 1995. № 7(2) . P. 223-243.
12. Biber D., Conrad S., Reppen R. Corpus linguistics: Investigating language structure and use. Cambridge: Cambridge University Press, 2001. 312 p.
13. Busa R. The Annals of the Index Thomisticus. In: Computers and the Humanities. 1980. 14(2), pp. 83–90.
14. Chomsky N. Syntactic Structures. Second Edition With an Introduction by David W. Lightfoot. Mouton de Gruyter. Berlin, New York, 2002. 119 р. https://tallinzen.net/media/readings/chomsky_syntactic_structures.pdf
15. Hunston S. Corpora in Applied Linguistics. Cambridge: Cambridge University Press. 2012. 477 р.
16. Kennedy G. An Introduction to Corpus Linguistics. II. Series: Studies in language and linguistics (London, England). Routledge, 1998. 328 р.
17. McEnery T., Hardie, A. Corpus Linguistics: Method, Theory and Practice. Cambridge: Cambridge University Press, 2012. 294 р.
18. McEnery T., Wilson A. Corpus Linguistics. An Introduction. Edinburgh: Edinburgh University Press, 2001. 234 p. https://uogbooks.wordpress.com/wp-content/uploads/2014/10/tony_mcenery_andrew_wilson_corpus_linguisticsbook4you-org.pdf
19. The Brown Standart Corpus of American English. Brown, 1964. 386 р.