ХАБАРЛАНДЫРУ! АЛМАТЫ ҚАЗАҚ ТІЛІ КОРПУСЫНЫҢ БАСТАПҚЫ НҰСҚАСЫ ІСКЕ ҚОСЫЛДЫ!
Алматы қазақ тілі корпусының бастапқы нұсқасы орналастырылған сайт іске қосылды. Қазіргі таңда корпустың көлемі 1миллионға жуық сөзқолданыстарынан тұрады. Корпус мәтіндері автоматты морфологиялық талдағыш көмегімен белгіленген, корпус сөзформаларының 75%-ының грамматикалық талдауы бар. Корпуста омонимия алынған жоқ, яғни әрбір сөзформа талдауының барлық мүмкін деген нұсқалары контексті ескермей тіркелген.
Бұл Қазақстан Республикасының мемлекеттік тілі қазақ әдеби тілінің тіркелген кең көлемді мәтіндер қоры негізіндегі анықтамалық-ақпараттық жүйе— Ұлттық қазақ тілі корпусының (ҰҚТК) алғашқы нұсқасы. Корпустың толықтырылатындығы, сандық және сапалық тұрғыдан жаңартылатындығы сөзсіз, сондай-ақ келешекте корпустың іздеу жүйесінің қолданысы айтарлықтай жетілдіріледі.
ҰҚТК-нің келешектегі негізгі даму бағдары төмендегідей:
- · лингвистикалық тұрғыдан көрнекті корпус;
- · күрделі лексика-морфологиялық сұрақтарды жүзеге асыруға арналған пәрменді іздеу аппараты;
- · сөзформаларының басым көпшілігіне лексика-морфологиялық талдау және орыс/ағылшын тілдеріне аударма баламалары берілетін қазақ тілін өз бетінше үйренуге арналған ыңғайлы құрал;
- · қазіргі қазақ тілі тарихының әртүрлі кезеңдерін қамтитын диахрониялық тұрғыдан бағдарланған корпус;
- · әртүрлі жанрлы жазбаша және ауызша мәтіндердің түрлі типтерін қамтитын әртарапты корпус;
- · грамматикалық және библиографиялық белгімен жабдықталған аннотациялық корпус;
- · қолжетімді ашық корпус;
- · қазақ әдебиетінің 100-ден аса классикалық шығармаларынан тұратын электронды кітапхана.
Корпус жобасы бойынша жұмыс әл-Фараби атындағы Қазақ ұлттық университетінің ректоры Ғ.М.Мұтановтың қолдауымен және ҚазҰУ-дың филология, әдебиеттану және әлем тілдері факультеті жалпы тіл білімі және шетел филологиясы кафедрасының күшімен, кафедра меңгерушісі Г.Б.Мадиеваның жетекшілігімен ҰЗУЭЖМ (Мәскеу) филология факультеті қызметкерлерінің қатысуымен 2012 жылдың мамыр айында басталды.
Аталмыш корпус Шығыс армян ұлттық корпусының (EANC) іздеу жүйесіне бейімделіп жасалған болатын.
Корпус сілтемесі:
http://web-corpora.net/KazakhCorpus/search/?interface_language=kz