Τι είναι τα σώματα κειμένων;
Ως σώμα κειμένων (corpus, πληθ. corpora) ορίζεται ένα αντιπροσωπευτικό σύνολο κειμένων (συχνά ψηφιοποιημένων από έντυπη μορφή), το οποίο χρησιμοποιείται ως δείγμα με αντικείμενο τη γλωσσολογική έρευνα και ανάλυση. Τα σώματα κειμένων είναι το αποτέλεσμα ειδικής ηλεκτρονικής επεξεργασίας με ειδικά προηγμένα λογισμικά, τα οποία δίνουν τη δυνατότητα στον χρήστη να αντλήσει φωνολογικές, γραμματικές, συντακτικές και υφολογικές πληροφορίες από το κείμενο, να κάνει παρατηρήσεις σχετικά με τη συχνότητα χρήσης ενός τύπου, το συμφραστικό περιβάλλον του, καθώς και πληροφορίες για την πρώτη εμφάνιση ή σημασία ενός τύπου και τις τυχόν αλλαγές του.