RGB және RGBD камераларының бейне ағынынан қол қимылдарды тануға арналған Python қосымшасын әзiрлеу
Қаралымдар: 201 / PDF жүктеулері: 157
DOI:
https://doi.org/10.32523/bulmathenu.2021/3.1Кілт сөздер:
тереңдiк камерасы, қимылдарды тану, орамдық нейрон желi, RealSense, OpenCV, Python, VGG16Аңдатпа
Соңғы кезде деректердi түсiретiн заманауи құрылғылардың (датчиктердiң) дамуына және тану
алгоритмдерiнiң жаңадан әзiрлеуiне байланысты ым-ишараны тану жүйелерi айтарлықтай өзгердi. Мақалада RGB
және RGBD камераларынан, яғни Logitech HD Pro Webcam C920 веб-камерасынан және Intel RealSense D435
тереңдiктi сезетiн камерасынан алынған бейне ағынынан статикалық және динамикалық қол қимылдарын тануға
арналған зерттеу нәтижелерi келтiрiлген. Программалық iске асырылуы Python 3.6 құралдарының көмегiмен
орындалды. Python-ның ашық кiтапханалары кескiндердi өңдеу мен сегменттеу алгоритмдерiн сенiмдi түрде жүзеге
асырады. Қимылдарды бөлiп алу және жiктеу iшжүйесi TensorFlow және Keras терең оқыту фреймворкелер көмегi
арқылы жүзеге асырылған, VGG-16 нейрондық желiсiнiң архитектурасына негiзделген. Камералардың техникалық
сипаттамалары келтiрiлген. Қосымшаның жұмыс тәртiбi сипатталған. Әртүрлi эксперименттiк жағдайлардағы
(қашықтықты және жарықтандыру өзгерту арқылы) деректердi түсiретiн құрылғыларды салыстыруға бағытталған
зерттеулер ұсынылған. Эксперимент нәтижелерi көрсеткендей, Intel RealSense D435 тереңдiк камерасы әртүрлi
эксперименттiк жағдайларда қимылдарды дәлiрек тануға мүмкiндiк бередi.