ЖИ: ұлттық код пен цифрлық өркендеу жолы
Бүгінде жасанды интеллект (ЖИ) – технология ғана емес, өркениеттің дамуындағы жаңа бетбұрыс. Әлем елдері білім, ғылым, мәдениет пен экономика салаларында ЖИ-дің әлеуетін тиімді пайдаланып келеді. Ал Қазақстан үшін бұл үдеріс ерекше мәнге ие. Себебі біз тек технологияны меңгеріп қана қоймай, оның көмегімен қазақ тілінің өміршеңдігін арттыруды, ұлттық болмысымызды сақтауды мақсат тұтамыз.
Қазақ тілін дамыту тіл мамандары мен филологтардың ғана міндеті емес. Бұл – елдің мәдени қауіпсіздігі мен экономикалық дамуының кепілі. ЖИ технологияларын қазақ тіліне бағыттау арқылы тілімізді сақтап, цифрлық кеңістіктегі орнын берік ете аламыз.
Соңғы жылдары елімізде осы бағытта елеулі жұмыстар жалғасуда. Мысалы, Institute of Smart Systems and Artificial Intelligence (ISSAI) әзірлеген KAZ LLM тілдік моделі қазақ тілінде мәтін өңдеу, аударма және мазмұн генерациясын жасай алады. Ал мемлекет қолға алған «Ұлттық сөздік қор» жобасы – қазақ тілін ЖИ жүйелерінде тануға және қолдануға мүмкіндік беретін үлкен бастама.
ЖИ қазақ тілін үйрету мен оқыту процесін түбегейлі өзгерте алады. Қазірде тіл үйренушілерге арналған виртуалды көмекшілер, жекелендірілген оқу платформалары, автоматты бағалау жүйелері қолға алынып жатыр. Мысалы, ЖИ қазақ тіліндегі оқу материалдарын талдап, әр оқушыға жеке оқу траекториясын ұсына алады. Бұл әсіресе ауыл мектептері мен қашықтан оқитындар үшін зор мүмкіндік.
Осы бағытта Әл-Фараби атындағы Қазақ ұлттық университетінде ашылған «Цифрлық қазақ тілі» мамандығы да маңызға ие. Бұл мамандықта студенттер тілдің өміршеңдігін сақтау, оны цифрлық ортада дамыту және ЖИ жүйелеріне бейімдеу жолдарын үйренеді. «Қазақ тілі және жасанды интеллект», «Цифрлық филологияның даму бағыттары» т.б. пәндер сияқты өзекті бағыттар бар. Ал бұл болашақта қазақ тілін ЖИ жүйелерінде толық қолжетімді етудің басты тетігі болары сөзсіз.
Енді қазақ тілінің цифрлық кеңістіктегі салмағын арттыру үшін нақты әрі қарапайым қадамдар қажет екенін айтқымыз келеді. Солардың бірқатарына тоқтап өткім келеді:
• Қазақша деректер базасын құру
Онда кітап, мақала, радиобағдарламалар, аудио және видеоконтент жинақталып, ашық платформада қолжетімді болуы керек.
• Тілдік стандарт пен орфографиялық бірізділікті сақтау
Қазіргі қазақ басылымдарында бір сөздің бірнеше нұсқасы қатар жүреді және тыныс белгісі де әртүрлі қойылады. Бұл мәселені ЖИ арқылы шешуге болады. Орфографияны тексеретін ЖИ жүйесі сөздің дұрыс жазылуын көрсете алады. Ол үшін заманауи үлкен тілдік модельдерге қазақша орфография ережелерін үйрету қажет.
• Қазақша сапалы контент өндірушілерге қолдау көрсету
YouTube, TikTok сияқты платформаларда қазақ тіліндегі контентті көбейту үшін грант пен марапат жүйесін енгізу пайдалы болар еді.
• Мәдени және жергілікті тіл ерекшеліктерін сақтау
ЖИ-ге ресми тілді ғана емес, диалектілер мен ауызекі тілді де үйрету керек. Бұл тілдің табиғи, ұлттық сипатын сақтайды.
• Қоғам болып атсалысу және ашық дереккөздер
Кез келген адам қазақша мәтін, жазба, видео жүктей алатын ашық тілдік платформа жасалса, онда қазақ тілінің дерекқоры жылдам өседі. Сондай-ақ бұл үшін әр контенттің сауатты жазылуын қадағалайтын немесе тексеретін жүйе қажет.
Дегенмен ЖИ мен тіл технологиясын дамытуда қиындықтар да жоқ емес:
• Қазақ тіліндегі мәтіндер мен деректердің аздығы;
• Кадр тапшылығы. ЖИ мен лингвистика саласын қатар білетін мамандар жоқтың қасы;
• Мәдени және этикалық нормаларды сақтау. Автоматтандыру барысында тілдің табиғи реңкін жоғалтпау маңызды.
Осындай мәселелерді шешу үшін мемлекет, университеттер және ІТ-компаниялар бірігіп «Тіл және технология» экожүйесін қалыптастыруы қажет. Мұндай әріптестік тілдің цифрлық дәуірдегі өміршеңдігін қамтамасыз етеді.
Қорыта келгенде, жасанды интеллект қазақ тілінің болашағы үшін қауіп емес, зор мүмкіндік екенін айтқымыз келеді. ЖИ-дің адам сенгісіз мүмкіндіктерін дер кезінде пайдаланып, әр саланы дамытуға бейімдей алсақ, еліміздің инновациялық имиджі де жарқырай түседі. ЖИ-ді қазақ тілін дамыту үшін қолдану экономикалық мүмкіндіктерге жол ашары даусыз. Қазақ тілінде әзірленген тілдік технологиялар (чат-бот, автоматтандырылған құжат өңдеу, аударма жүйесі) стартаптар мен ІТ-сектор үшін жаңа нарық болар еді. Ал бұл Қазақстандағы цифрлық экономиканың дамуына үлес қосады.
Мөлдір ҒАБИТҚЫЗЫ,
«Цифрлық қазақ тілі» мамандығының 1-курс магистранты
Басқа жаңалықтар