Инновация OMSystem – қазақ тілінде талдау жасайтын жүйе

13 тамыз, 2021

Бүгінде интернет беттеріндегі ақпараттарға мониторинг жүргізетін жүйелер сұранысқа ие. Себебі билік те, бизнес те қоғамның өзіне деген көзқарасын білуге құштар. Университетіміздегі деректерді талдау және өңдеу орталығының мамандары Opinion monitoring system деп аталатын жоба жасап шығарды. Бұл жүйенің басты артықшылығы – қазақ тіліндегі деректерді өңдеуге қауқарлы.   

Деректерді талдау және өңдеу орталығының жүйелік-әкімшісі Шыңғыс Рабаттың айтуынша, әлеуметтік онлайн-сервистердің қарқынды таралуы және Big Data технологияларының дамуы әлеуметтік желілерден алынған мәліметтерді түрлі салаларда пайдалануға қызығушылық тудырған.

– Бүгінгі таңда «әлеуметтік желілерді бақылау» (social listening) және контент-талдау технологиялары танымал болуда. Бұл қызметтер негізінен шетелдік әзірлемелермен, ағылшын тілінде құрылған лингвистикалық сөздіктермен ұсынылған және олар қазақ және орыс тілдеріне нашар бейімделген. Ал университетіміздегі бағдарлама жасаушы мамандар әзірлеген OMSystem пікірлерді бақылаудың отандық ақпараттық жүйесі мынадай мүмкіндіктер ұсынады:

  • ·  ақпараттық кеңістікті бақылау және мәселенің ауқымын анықтау;
  • ·  қоғамның пікірін біліп және тез арада түсініктеме беру;
  • ·  пайдаланушылардың тақырыпқа қатысуын бағалап, негізгі ықпалды тұлғалардың қоғамдық пікір қалыптастыратын талқылау тақырыптары бар-жоғын анықтау;
  • ·  ақпараттық себептер мен оларға деген қатынастарды анықтау;
  • ·  дұрыс басқару шешімдерін қабылдау;
  • ·  бренд/оқиғалар/іс-шаралар туралы ескертулер динамикасын талдау;
  • ·  «лакмус сынағы» қағидаты бойынша қоғамның әлеуметтік әл-ауқатын бағалау.

OMSystem жаңа сервисі еліміздің жетекші жаңалықтар порталын, Facebook, Instagram, Vkontakte, Telegram, Youtube, Twitter сияқты әлеуметтік желілерді, сондай-ақ танымал блогерлердің аккаунттарын, пікір сайттарын, оппозициялық ресурстар мен тұлғалардың аккаунттарын, әкімдіктердің әлеуметтік желілерінің сайттары мен аккаунттарына мониторинг жүргізеді.

– Opinion monitoring system – интернет кеңістіктегі пайдаланушылардың кез келген жаңалық немесе оқиғаға қатысты ой-пікірін талдауға және белсенділерді қолданушыларды анықтауға арналған жүйе. Қазіргі таңда бұл өте маңызды, өйткені әлеуметтік желілер  ауқымды дерек көзіне айналып отыр. Себебі қолданушылар кез келген жағдайға өз пікірін білдіріп отырады. Демек, мұндай ақпараттың барлығына мониторинг жүргізіп отыру қажет, – дейді орталықтың инженер-аналитигі Мадияр Тасболатов.

Президентіміз Қ.Тоқаев Қазақстан халқына жолдауында «Азаматтардың барлық сындарлы өтініш-тілектерін жедел әрі тиімді қарастыратын «Халық үніне құлақ асатын мемлекет» тұжырымдамасын іске асыру – бәрімізге ортақ міндет» деп атап өткен болатын. Осы тұрғыда орталық мамандары осындай жоба жасап, қоғамға ұсынуды қолға алған.

– Тағы бір айта кетерлігі – қазір қазақ және орыс тілдерін жақсы түсінетін технологиялар жоқтың қасы. Біздің жобамыз дәл осы олқылықтың орнын толтыра алады. Өйткені ол қазақ, орыс және ағылшын тілдерін терең түсініп талдау жасайды. Одан бөлек, статистикалық мәліметтерді де ұсына аламыз. Мәселен, бір жаңалықты қанша адам көрді, қандай танымал топтар бар немесе қанша адам пікір қалдырды дегендей. Ал демографиялық тұрғыдан алсақ, оның қаншасы ер, қаншасы әйел, қай аймақтар белсенді дегендей сұрақтарға жауап таба аламыз. Тіпті қай әлеуметтік желіде пайдаланушылар белсенді екенін де анықтауға болады. Белгілі бір оқиғаға барлығы негатив пікір қалдырды немесе жағымды сөздер айтылды деген секілді үндестіктерді де байқайтын мүмкіндік бар. Нәтижесінде тапсырыс беруші болып жатқан оқиғаларға сай қалай әрекет ету керегін саралайды, – дейді инженер-аналитик.

Ең бастысы, жүйе талдау нәтижесін боямасыз көрсетіп береді. Маманның айтуынша, жүйені алдай алмайсың, ол әрдайым тура ақпаратты ұсынады. «Бір артықшылығы – осы жұмыстардың барлығы жылдам жасалады. Сіздің әрекетіңіз бар болғаны жүйені іске қосып, нәтижесін күту ғана», – дейді ол.

– Сонымен бірге сарапшы ретіндегі саясаттанушылардың көмегіне жүгінуге болады. Олар жүйеде жасалған есептерге қарап, қорытынды жасай алады. Мұның барлығын келісімшарт негізінде жасайсыз. Мәселен, платформаға тіркелген соң, сіздің электронды поштаңызға белгілі бір уақытта өзіңіз қалаған тақырыптағы талдаулар келеді. Серверлерге орнатылған жүйе әрдайым жұмыс істейді және командамыз кез келген сұрақтарыңызға жауап беруге дайын, – дейді Мадияр Даниярұлы.

Оның айтуынша, OMS жүйесі Social Listening, Machine Learning, Big Data және т.б. технологияларды пайдалана отырып әзірленген.

– Жүйе үш модульден тұрады: біріншісі – жаңалықтарды іздеп табу. Сіз тақырыпты енгізген соң, жүйе автоматты түрде ақпараттық порталдар мен барлық әлеуметтік желілерден кілт сөздер арқылы жаңалықтарды іздейді. Содан кейін оның авторлары мен пікірлерді жинап, соның негізінде талдау жасайды. Ол адамдардың белгілі бір оқиғаға қатысты жағымды-жағымсыз ой-пікірін көрсетіп бере алады, – дейді маман.

Сондай-ақ бұл жүйе мына идея жақсы немесе келесі бір идея нашар деген секілді жалпылама қорытынды да жасай алады. Орталық өкілдерінің айтуынша, Parsers – бұл арнаулы модуль. Ол интернет ресурстардан ақпарат жинайды. Одан бөлек, жасанды интеллект негізінде жасалған лингвистикалық конструктор бар. Ол әрбір сөзді оқып, жинақталған мәліметтерге талдау жүргізеді. Ең соңында дайын болған есеп генерацияланады. Ал жасанды интеллект белгілі бір ақпаратты адамдардың қалай қабылдағанын анықтайды. Алынған мәліметтер өңделген күйде PDF немесе Word форматта тапсырыс берушінің электронды поштасына жіберіледі.

Мәселен, карантин кезінде Деректерді талдау және өңдеу орталығы осындай талдау жүргізген. Коронавирус, пневмония туралы ақпараттардың статистикасын анықтаған. Бірақ қолданушылар мұндай ақпараттарға аз пікір қалдырған. Орталық мамандары тест режимінде бірнеше клиенттен тапсырыс қабылданғанын да сөз етті.

Нарықтағы бәсекелестік туралы сұрағанымызда орталық мамандары OMS жүйесінің артықшылықтары бар екенін алға тартты.

– Әрине, мұндай сервистер кездеседі. Бірақ Opinion monitoring system толық функционалды жүйе деп сеніммен айта аламыз. Өйткені әлеуметтік желілерге мониторинг жүргізетін өзге платформалардың кейбірі қазақ тілінде қызмет көрсетпейді. Сол үшін біздің ең басты артықшылығымыз – жасанды интеллектінің көмегімен қазақ тіліндегі ақпараттарды да өңдеп, қорытынды жасай алуымызда. Одан бөлек, Opinion monitoring system сурет бетіндегі мәтінді де таниды. Бұл Instagram секілді негізгі контенті фото болып саналатын әлеуметтік желілерде толыққанды талдау жүргізуге таптырмас мүмкіндік. Қарапайым жүйелер фотоның бетіне жазылған мәтіндерді оқи алмайды. Ал OMS жүйесі оны оқып, талдай алады, – дейді М.Тасболатов.

Сөзіміздің дәлелі ретінде OMS жүйесі арқылы қазір актуалды болып отырған «Қазақстандағы құрғақшылық» деген тақырыпта талдау жүргіздік. Деректерді талдау және өңдеу орталығының инженер-аналитигі Жанерке Сүндетова талдау нәтижесі көрсетілген есептік баяндама әзірледі. Құжаттан көргеніміздей, 2021 жылдың 1-12 шілде аралығында құрғақшылық, засуха, сельское хозяйство және т.б. кілтсөздер арқылы 165 жазба және 393 пікір анықталды. Оның ішінде мәтіндер оң, ал комментарийлер теріс тоналдылық көрсеткен.

Мұндай қызмет түріне деген сұраныс алдағы уақытта арта бермек. Мысалы, Fortune Business Insights компаниясының болжамына сүйенсек, 2027 жылы бұқаралық ақпарат құралдарына мониторинг жүргізу нарығы дүниежүзілік деңгейде 6,51 миллиард АҚШ долларына жетпек. 2019 жылы бұл көрсеткіш 2,48 млрд АҚШ долларын құраған. Демек, орташа есеппен нарық жыл сайын 13,2 пайыз өсім көрсетіп отырады.

Кәмила ДҮЙСЕН