본문 바로가기
테크요약

노타, 퀄컴 엣지 AI 디바이스서 VLA 추론 속도 최대 7배 개선

노타가 퀄컴 드래곤윙(Dragonwing) IQ-9075 환경에서 VLA 모델 SmolVLA 0.45B를 최적화했다고 29일 밝혔다. 로봇 동작 생성 단계 처리 시간은 218ms에서 31ms로 줄었다.

노타, 퀄컴 엣지 AI 디바이스서 VLA 추론 속도 최대 7배 개선 — 모노라 편집부 codex hero
사진 · 모노라 편집부 (codex CLI / gpt-image 활용) (ai_generated)

AI 보조 편집 이미지 · 모노라 편집부

생성형 AI 도구로 제작한 편집 그래픽 · 실제 현장/제품 사진 아님

크레딧
모노라 편집부 (codex CLI / gpt-image 활용)
라이선스
editorial_use_ai
출처
codex CLI · gpt-image lane

AI 작성·편집

이 기사는 AI 자동화 도구로 작성·편집되었습니다. 사실 확인과 편집 책임은 모노라 편집부에 있으며, 민감하거나 확인이 필요한 사안은 사람이 검토한 뒤 발행합니다.

노타는 로봇 동작 생성에 쓰이는 시각언어행동(VLA) 모델을 퀄컴 최신 엣지 AI 디바이스 드래곤윙(Dragonwing) IQ-9075에서 구동하도록 최적화했다고 29일 밝혔다. 대상 모델은 SmolVLA 0.45B다.

이번 작업은 모델 전체를 축소하는 방식이 아니라 속도 개선 효과가 큰 구간을 골라 조정하는 방식으로 진행됐다. 노타는 로봇 동작 생성 단계의 반복 연산을 줄이는 실시간 추론 최적화와 신경망처리장치(NPU) 기반 그래프 최적화를 적용했다.

최적화 결과 액션 헤드 처리 시간은 218ms에서 31ms로 약 85.8% 감소했다. 속도 개선 폭은 최대 7배 수준이며, 전체 추론 시간은 505ms에서 310ms로 단축됐다. 작업 성공률은 기존 86%에서 85%로 비슷한 수준을 유지했다.

노타는 미국 산타클라라에서 열린 임베디드 비전 서밋 2026에서 이 결과를 공개했다. 현장에서는 관람객이 물품을 선택하면 최적화된 VLA 모델이 이를 인식하고 로봇팔 동작을 생성해 물품을 바구니에 넣는 체험형 시연이 진행됐다.

채명수 노타 대표는 「피지컬 AI가 산업 현장으로 확산하려면 AI가 실제 환경을 보고 이해하고 행동으로 연결하는 과정을 엣지 AI 디바이스에서 빠르고 안정적으로 처리할 수 있어야 한다」며 「이번 VLA 최적화 사례는 우리 AI 최적화 기술이 피지컬 AI 시대 핵심 기반 기술로 확장됐음을 보여준다」고 말했다.

피지컬 AI가 산업 현장으로 확산하려면 AI가 실제 환경을 보고 이해하고 행동으로 연결하는 과정을 엣지 AI 디바이스에서 빠르고 안정적으로 처리할 수 있어야 한다

이번 VLA 최적화 사례는 우리 AI 최적화 기술이 피지컬 AI 시대 핵심 기반 기술로 확장됐음을 보여준다

관련 기사

참고한 출처

태그