SKT-파네시아, 차세대 AI 데이터센터 공동 개발 “설계 바꿔 비효율 해결”


AI 인프라 링크솔루션 개발 기업 파네시아(Panmnesia)는 스페인 바르셀로나에서 열린 MWC26에서 SK텔레콤과 ‘CXL 기반 차세대 AI 데이터센터 구조(아키텍처)’ 공동 개발을 위한 전략적 파트너십(MOU)을 체결했다고 4일 밝혔다.

Panmnesia 2 - 와우테일

대규모 AI 서비스 성능을 높이기 위해 데이터센터에서는 고성능 GPU를 대량 도입하며 천문학적인 비용을 투자하고 있다. 이러한 흐름 속에 양사는 지속 가능한 확장을 위해 단순한 GPU 증설을 넘어 동일한 컴퓨팅 자원을 보다 효율적으로 활용하는 기술의 중요성에 주목했다. 이에 CXL 기술 기반의 연결 구조 혁신을 통해 장비 추가 없이도 비용·효율을 동시에 개선하는 방안을 제시한다. CXL은 CPU·GPU·메모리 간 데이터를 유기적으로 연결해 초고속·저지연 처리를 가능하게 하는 데이터 연결 표준으로, 서버 단위로 묶여 있던 컴퓨팅 자원을 유연하게 확장·활용할 수 있게 해준다.

양사는 컴퓨팅 자원을 종류별로 분리(Disaggregation)하고 유연하게 조합하는 새로운 구조를 제안한다. CPU·GPU·메모리를 서버 단위로 고정하는 대신 랙 단위에서 CXL 기반 패브릭 스위치를 통해 연결해 하나의 통합 시스템처럼 운영하는 방식이다. AI 서비스를 구동할 때 각 워크로드에 필요한 만큼 자원을 동적으로 조합해 할당함으로써 불필요한 자원 낭비를 줄이고 비용 효율을 극대화하는 것이 핵심이다.

연결 방식의 전환을 통해 연산 효율도 함께 개선한다. 기존에는 GPU 협업 연산 과정에서 이더넷 등 범용 네트워크를 통해 데이터를 주고받으면서 데이터 복사와 소프트웨어 개입이 발생해 전체 성능이 저하되는 문제가 있었다. 양사는 이 네트워크 구간을 CXL로 전환해 자원 간 고속 직접 연결을 구현한다. 각 자원에 통합되는 ‘링크 컨트롤러’가 핵심으로, CPU·GPU·AI 가속기·메모리에 통합되어 장치가 CXL 기반으로 통신할 수 있도록 지원한다. GPU-GPU, GPU-메모리 간 데이터 전송을 소프트웨어 개입 없이 처리해 처리 효율을 높이고, 결과적으로 동일한 GPU 자원으로도 더 높은 성능을 달성할 수 있도록 한다.

이번 협력에서 SK텔레콤은 대규모 AI 데이터센터 구축·운영 역량과 AI 모델 개발 및 상용화 경험을 바탕으로 실제 상용 환경에 최적화된 구조 설계를 주도한다. 파네시아는 물리적 연결의 중심이 되는 스위치와 논리적 통합을 담당하는 컨트롤러 등 링크 반도체 기술을 활용해 서버 내부에 국한됐던 링크 구조를 랙 단위 이상으로 확장한다. 양사는 실제 AI 모델을 구동하며 GPU·메모리 활용률, 지연시간, 처리량 등을 종합적으로 검증한 뒤 올해 말까지 차세대 AI 데이터센터 구조를 공개할 계획이며, 이후 대형 AI 데이터센터 환경에서 실증을 거쳐 상용화·사업화를 추진할 방침이다.

정석근 SK텔레콤 AI CIC장은 “AI 데이터센터 경쟁력은 GPU 성능 경쟁을 넘어 메모리와 데이터 흐름까지 포함한 시스템 최적화에 달려있다”며 “이번 협력은 연산 성능이 높아져도 데이터 이동·공급이 이를 따라가지 못하는 구조적 병목인 ‘메모리 월(Memory Wall)’을 완화해 AI 데이터센터 성능과 경제성을 함께 끌어올릴 것”이라고 말했다. 정명수 파네시아 대표는 “차세대 AI 인프라는 개별 장비 성능이 아니라 다양한 링크 반도체가 만들어내는 ‘구조’가 성능을 좌우한다”며 “글로벌 시장이 주목할 고효율 AI 데이터센터의 표준 모델을 제시하겠다”고 밝혔다.

Panmnesia 1 - 와우테일


기사 공유하기

답글 남기기