본문 바로가기
테크맥락 정리

이주평 삼성SDS 상무가 말한 제조AI 데이터 조건

이주평 삼성SDS 상무는 제조AX 확산에서 제조데이터 공유와 AI데이터센터 인프라를 함께 언급했다. 제조AI의 주요 데이터로는 시계열 데이터를 제시했다.

이주평 삼성SDS 상무가 말한 제조AI 데이터 조건 — 모노라 편집부 codex hero
사진 · 모노라 편집부 (codex CLI / gpt-image 활용) (ai_generated)

AI 보조 편집 이미지 · 모노라 편집부

생성형 AI 도구로 제작한 편집 그래픽 · 실제 현장/제품 사진 아님

크레딧
모노라 편집부 (codex CLI / gpt-image 활용)
라이선스
editorial_use_ai
출처
codex CLI · gpt-image lane

AI 작성·편집

이 기사는 AI 자동화 도구로 작성·편집되었습니다. 사실 확인과 편집 책임은 모노라 편집부에 있으며, 민감하거나 확인이 필요한 사안은 사람이 검토한 뒤 발행합니다.

이주평 삼성SDS 상무(SPC개발팀장)는 산업부가 5일 서울 강남 한국산업기술센터에서 연 '제 3회 M.AX 전문가 컨퍼런스'에서 제조AI 확산 조건을 설명했다. M.AX는 Manufacturing AI Transformation의 약어로 제조AX를 뜻한다. 이 상무는 「제조AI의 규모 경제는 데이터를 어떻게 모으느냐에 달려있습니다. 이 문제를 먼저 해결한 곳이 AI 코딩 에이전트입니다. AI코딩 에이전트가 어떻게 주류가 됐는지 연구해 벤치마킹할 필요가 있습니다.」라고 말했다.

산업부는 이재명 정부 출범 1주년을 맞아 제조AX 방안을 모색하는 분야별 전문가 컨퍼런스를 이어가고 있다. 이날 논의는 M.AX 추진 과정에서 제조 데이터가 왜 중요한지, 양질의 제조 데이터를 확보하고 활용하려면 어떤 인프라가 필요한지에 맞춰졌다. 이 상무는 KAIST 학사, 석사, 박사 출신이며 삼성전자 종합기술원 연구원, 삼성전자 메모리사업부 연구원, 미국 메타 소프트웨어엔지니어를 거쳐 2024년 삼성SDS에 입사했다.

이날 이 상무의 발제 주제는 '제조AX 확산을 위한 AI데이터센터 역할'이었다. 그는 AI데이터센터를 「학습과 추론을 위한 전용 인프라」라고 정의하고, 「네오 클라우드와 AI팩토리라고도 부른다」고 설명했다. 설계 시 고려할 항목으로는 부지 및 전력 인프라 선정, AI 워크로드 정의, 컴퓨팅 인프라 선정, 네트워크 및 스토리지 아키텍처, 냉각 및 운영체계가 제시됐다.

컴퓨팅 인프라 선정에는 GPU와 NPU 벤더 모델 선정, CPU· 메모리·GPU 상세 스펙 결정이 포함됐다. 네트워크 및 스토리지 아키텍처에는 인피니밴드, RoCE 등 네트워크 기술과 고성능 스토리지 구성이 들어갔다. AI 워크로드 정의에는 학습 및 추론 비중, 목표 서비스 및 LLM 규모, 레이턴시 쓰루풋 목표가 포함됐다.

AI 인프라가 학습에서 추론 중심으로 이동하고 있다는 설명도 나왔다. 이 상무는 「올해 전체 AI데이터센터 워크로드의 31%가 추론인데 이 비중이 2030년에는 40%로 확대할 것」이라고 말했다. 기존 데이터센터가 여러 독립 서버의 집합인 반면, AI데이터센터는 수천 개 GPU가 초고속 네트워크로 연결돼 하나의 슈퍼컴퓨터처럼 동작한다고 설명했다.

AI데이터센터의 특징으로는 GPU 서버 간 저지연 네트워크와 폴트 톨로런스가 제시됐다. 이 상무는 수천~수백개 GPU가 동기화되는 환경에서는 일부 노드의 지연도 전체 학습 효율에 영향을 줄 수 있다며 「AI학습에서는 가장 느린 GPU가 전체 학습 속도를 결정한다」고 말했다. 단일 학습 수행에서는 장애 허용성도 중요하다며 「메타는 라마3를 54일간 학습하면서 466회의 장애가 발생했다. 제대로 처리하지 않으면 학습을 처음부터 재수행해야 한다」고 설명했다.

이 상무는 메타의 AI 인프라 확대 사례도 언급했다. 2020년 메타는 AI클러스터당 256개 GPU를 소비(장착)했지만 2023년에는 2만4000개로 늘었다. 2024년에는 5개 데이터센터를 비워 12만9000개 GPU 클러스터를 구성했고, 2025년에는 엔비디아 GB200을 도입했으며, 2026년에는 1기가와트(1GW)급 클러스터를 구축하고 있다.

LLM 데이터와 제조데이터의 차이도 다뤄졌다. 이 상무는 「제조AI의 핵심 데이터는 시계열(Time-Series) 데이터」라고 말했다. LLM데이터는 텍스트 기반이고 데이터 원천이 인터넷과 오픈소스인 반면, 제조데이터는 센서와 산업장비에서 나오며 지속적으로 생성된다. 대표 AI로는 LLM의 라마와 GPT, 제조데이터의 타임FM(TimesFM), 크로노스(Chronos), 팩토리넷(FactoryNet)이 제시됐다.

이 상무는 「제조데이터 학습은 어렵다」고 말하며 제조 제이터 민감 정보가 더 암묵적이고, 시계열과 영상데이터로 규모가 매우 크며, 정답(Label) 확보가 어렵다고 진단했다. 제조AI는 엔터프라이즈 파인 튜닝, 제조파운데이션모델, 오픈월드모델 같은 여러 계층이 결합해 구성된다고 설명했다. 그는 「제조AI데이터센터 규모 경제는 제조데이터 공유와 활용에 달려있다」고 했고, 디지털 트윈에 대해서는 「좋은 코드에 테스트 체계가 있듯이 좋은 제조 데이터에는 디지털트윈이 필요하다」고 말했다.

관련 기사

참고한 출처

태그