Ұлттық сөздік қор: қазақ тілі жасанды интеллектке бейімделеді

/uploads/thumbnail/20250303141505965_big.webp

Қазақстанда Қазақ тілінің ұлттық сөздік қорын құру жоспарланып отыр. Тиісті жобаны Ғылым және жоғары білім министрлігі әзірледі.

Құжатқа сәйкес, ұлттық сөздік қоры академиялық және аударма сөздіктер, Қазақ тілінің ұлттық корпусы, терминологиялық база және әртүрлі форматтағы деректер жиынтығын қамтитын дата-сеттер негізінде қалыптастырылады.

"Жобаның маңызды аспектісі – Қазақ тілінің ұлттық сөздік қоры ашық қолжетімді мемлекеттік ақпараттық жүйе болатыны. Бұл оны білім беру және ғылыми мақсаттарда, сондай-ақ қазақ тілін өңдеу технологияларын дамыту үшін барынша тиімді пайдалануға мүмкіндік береді", – делінген құжатта.

Қазіргі ережелерде мынадай негізгі ұғымдар пайдаланылады:

  • Генерация – деректер мен алдын ала белгіленген ережелер негізінде жаңа контентті (мәтін, сурет, дыбыс) автоматты түрде жасау процесі;
  • Жасанды интеллект (ЖИ) модельдері – қазақ тіліндегі деректерді өңдеу технологиялары мен алгоритмдерін түрлі жүйелерге, қосымшаларға немесе платформаларға енгізу процесі.
  • Ұлттық сөздік қорын қалыптастырудың мақсаттары:

    • Қазақ тілін мәдени құндылық ретінде сақтау, қорғау және дамыту;
    • Мемлекеттік тіл мәртебесін нығайту;
    • Қазақ тілінің барлық қолдану салаларын қамтитын ресурстарды жинақтау;
    • Қолданыстағы лексикалық құрамды жүйелеу, цифрландыру және генерациялау;
    • Қазақ тілін жасанды интеллектке және заманауи технологияларға бейімдеу;
    • Тілдік деректерді өңдеу үдерістерін автоматтандыру.

    Жоба "Ашық НҚА" порталында 2025 жылдың 19 наурызына дейін қоғамдық талқылау үшін орналастырылған.

Пікір қалдыру

Қатысты Мақалалар