화웨이 클라우드: 컴퓨팅의 든든한 기반이 되어 산업용 AI 선도기업 지원을 지원하다

  • 등록 2025.09.24 09:50:00
크게보기

연방타임즈 = 배용철 기자 |

 

 

상하이 2025년 9월 24일 -- 화웨이 커넥트 2025(HUAWEI CONNECT 2025) 둘째 날, 장 핑안(Zhang Ping'an) 화웨이 이사회 전무이사 겸 화웨이 클라우드(Huawei Cloud) CEO가 '올 인텔리전스: 산업용 AI 선도기업을 지원하다'(All Intelligence: Empowering AI Pioneers for Industries)를 주제로 기조 연설을 했다. 장 CEO는 기조 연설에서 AI 컴퓨팅 서비스과 기반 모델, 임바디드 AI, AI 에이전트 등에서 화웨이 클라우드가 어떤 혁신을 하고 실제로 어떻게 적용하고 있는지 밝혔다.

 

 

AI 컴퓨팅 서비스의 무한 혁신: 인텔리전트 시대에 돋보이는 컴퓨팅

 

올해 화웨이 클라우드는 CloudMatrix384 기반 AI 컴퓨팅 서비스를 발표했다. Huawei CloudMatrix 슈퍼노드의 사양은 384개 카드에서 8,192개 카드로 업그레이드될 예정이다. 슈퍼노드는 카드 50만~100만 개로 실행되는 하이퍼스케일 클러스터를 지원해 지능형 시대 귀중한 자원인 강력 AI 컴퓨팅을 뒷받침한다. 화웨이 클라우드는 또 자사 탄력 메모리 서비스(EMS)를 이용한 혁신적인 메모리 스토리지도 발표했다. 업계 최초로 비디오 RAM을 메모리로 확장한 제품이다. 이 제품을 이용하면 파운데이션 모델에서 멀티 라운드 대화의 지연이 크게 줄어 사용자 만족도가 크게 좋아지는 효과가 있다.

 

화웨이 클라우드는 중국 구이저우와 내몽골, 안후이에 완전 수냉식 AI 데이터 센터를 구축했다. 이 센터들은 캐비닛당 80kW로 열을 방출하고, 전력 사용 효율(PUE)이 1.1 수준이며 AI 기반 O&M도 가능하다. 기존 데이터 센터를 재편하거나 새 데이터 센터를 구축할 필요가 없다. 광섬유 한 쌍을 데이터 센터에 연결하기만 하면 화웨이 클라우드에서 효율적인 AI 컴퓨팅과 풀스택 전용 AI 클라우드 서비스를 이용할 수 있다.

 

장 CEO에 따르면 화웨이 클라우드의 AI 토큰 서비스는 기술적 복잡성과 무관하게 사용자에게 최종 AI 컴퓨팅 결과를 직접 제공한다. 따라서 사용자는 가장 효율적인 방법으로 추론 컴퓨팅을 활용할 수 있다. CloudMatrix384 슈퍼노드는 컴퓨팅과 메모리, 스토리지 리소스를 완전히 풀링하여 컴퓨팅 작업과 스토리지 작업, AI 전문가 시스템을 분리한 후 직렬 작업을 분산 병렬 작업으로 변환한다. 따라서 시스템의 추론 성능이 월등하다. 온라인, 니어라인, 오프라인 추론과 같이 지연 요건이 서로 다른 시나리오에서 CloudMatrix384의 카드당 평균 추론 성능은 H20의 3~4배에 달한다.

 

장 CEO는 이번 컨퍼런스에서 CloudMatrix384로 구동하는 AI 토큰 서비스의 공식 출시를 발표했다. 이 서비스는 우수한 성능과 서비스, 품질이 특징이다.

 

문제 정면 돌파: 기업의 자체 모델 구축 지원

 

화웨이 클라우드는 산업별 시나리오를 분석하여 자사의 Pangu 모델을 개선하는 한편 고객과 협력하여 시급한 과제에 정면으로 맞서고 있다. 각 산업에서 가능한 것의 한계를 넓히고 있는 것이다. 실제로 openPangu를 이용하여 AI 훈련과 추론의 모범 사례를 제시, 개발자가 AI 컴퓨팅을 효율적으로 이용하도록 지원하고 있다. 장 CEO는 동시에 화웨이가 비공개 소스 Pangu 모델을 개발하고 있다고도 밝혔다. 화웨이는 Pangu 모델에 대한 투자를 꾸준히 확대하고, 산업별 시나리오를 연구하여 고객의 요구 사항을 더욱 정확히 파악하는 한편 고객이 자체 산업 모델을 개발하도록 지원하여 산업 전반에서 인텔리전트 혁신을 가속화한다는 방침이다.

 

Pangu 모델은 지금까지 30여 업종에서 500여 시나리오에 적용되었다. 정부 서비스, 금융, 제조, 의료, 탄광, 철강, 철도, 자율 주행, 기상 등에서 중요한 역할을 담당하고 있다.

 

단말기를 벗어나: 클라우드에서 인텔리전스의 진화는 끝이 없다

 

올해 화웨이 클라우드는 CloudRobo Embodied AI Platform을 출시했다. 클라우드에서 복잡한 알고리즘과 인텔리전트 로직을 배포하여 로봇의 경량화를 실현해 주는 솔루션이다. 이 플랫폼은 클라우드에서 대규모 컴퓨팅과 고급 AI 모델을 활용하여 로봇 실행을 더욱 인텔리전트하게 만들어 준다. 클라우드 인텔리전스가 구현되면 로봇의 발목을 잡던 요소가 사라져 더 많은 시나리오에 로봇을 적용할 수 있다.

 

화웨이 클라우드는 로봇과 클라우드 간에 개방형 통합 보안 통신 채널을 구축하고자 로봇-클라우드(R2C) 프로토콜을 출시했다. 장 CEO는 지금까지 R2C 프로토콜에 20개 회사가 파트너로 참여했다고 밝혔다.

 

Kunpeng 클라우드 서비스: 소프트웨어-하드웨어 시너지와 개방형 에코시스템으로 업계 혁신 지원

 

화웨이 클라우드의 핵심 전략 중 하나는 성능과 보안, 안정성을 겸비한 Kunpeng 기반 ARM 클라우드 서비스를 개발하는 것이다. 지난 1년 사이 화웨이 클라우드의 Kunpeng 컴퓨팅 코어는 900만 개에서 1천 500만 개로 67% 증가했다. 또 Kunpeng 플랫폼은 주류 소프트웨어와 호환되도록 꾸준히 개선되었으며, 그 결과 2만 5천여 애플리케이션에 적용되었다. Kunpeng 플랫폼은 Kunpeng 클라우드 서비스가 트랜스코딩, 데이터베이스, 웹 애플리케이션, 클라우드 폰 외에도 일반적인 컴퓨팅 시나리오에 더 많이 적용되도록 적극 지원하고 있다.

 

GaussDB: 슈퍼노드와 풀링을 기반으로 효율적이고 안정적인 데이터 기반 구축

 

화웨이 클라우드의 GaussDB 데이터베이스는 범용 컴퓨팅 슈퍼노드를 기반으로 컴퓨팅과 메모리, 스토리지 리소스를 계층화하여 풀링하는 한편 어떤 노드에서나 동시 다중 읽기와 다중 쓰기가 가능하다. 따라서 기본 노드에서만 데이터 읽기/쓰기가 가능한 기존 아키텍처보다 제약이 덜 하다. GaussDB 데이터베이스는 또 동적 로드 스케줄링을 지원하므로 동시 트랜잭션 처리 성능이 매우 높다. 컴퓨팅 슈퍼노드를 기반으로 구축된 GaussDB 클러스터 하나가 트랜잭션을 분당 540만 건 처리할 수 있다. 이는 비 슈퍼노드 클러스터 대비 2.9배 더 높은 성능이다.

 

시나리오 분산 클라우드: 로컬 액세스를 통해 최상급 컴퓨팅을 어디서나

 

화웨이 클라우드는 CloudOcean, CloudSea, CloudLake, CloudPond 등 전 시나리오를 포괄하는 분산 클라우드 솔루션을 구축했다. 중앙 지역과 핫스팟 지역, 엣지 사이트를 커버하므로 고객은 어디서 업무를 하든 똑같이 화웨이 클라우드 서비스를 이용할 수 있다.

 

에이전트 개발과 운영을 위해 간편하고 효과적인 개방형 플랫폼 구축

 

화웨이 클라우드는 기업용 에이전트 플랫폼 Versatile을 출시했다. AI 에이전트 개발과 운영에 특화된 플랫폼으로 간편성과 효과성, 개방성이 특징이다. 고객은 이 플랫폼을 통해 애플리케이션 시나리오에 맞는 AI 에이전트를 신속하게 개발할 수 있다.

 

Versatile 기반에서는 사용자가 사업 설명 문서와 순서도를 준비하여 입력하기만 하면 된다. 간단한 확인 후 두 단계만 거치면 에이전트가 생성되므로 생성 효율성이 크게 높아진다.

 

화웨이 클라우드는 이번 행사에서 기조 연설 외에도 서밋 포럼, 라운드 테이블 등을 통해 다양한 의제를 제시했다. 화웨이 클라우드는 또 고객 및 파트너와 협력하여 클라우드 인프라, 대규모 모델, 데이터베이스, AI 에이전트, 임바디드 AI와 같은 분야에서 각종 혁신 기술과 사례를 다양하게 전시하여 기술을 통한 산업의 디지털화와 인텔리전트 혁신 방안을 제시하기도 하였다.

 

배용철 기자 oprai2@naver.com
[저작권자ⓒ 연방타임즈. 무단전재-재배포 금지]




회사명: 연방타임즈 (우) 04545 서울시 중구 창경궁로 5다길 18, 3층 | 대표전화 : 02-2273-7778 | 팩스 : 02-6499-7210
제호 : 연방타임즈 | 등록번호 : 서울, 아 55175| 등록일 : 2021-07-30 | 발행일 : 2021-07-30
발행인 : 이광언 | 편집인 : 신경원 | 청소년보호책임자 : 박원호
「열린보도원칙」 당 매체는 독자와 취재원 등 뉴스이용자의 권리 보장을 위해 반론이나 정정보도, 추후보도를 요청할 수 있는 창구를 열어두고 있음을 알려드립니다.
고충처리인 신경원 | 02-2273-7778 | skw365@naver.com
본 콘텐츠의 저작권은 연방타임즈 또는 제공처에 있으며 이를 무단 이용하는 경우 저작권법 등에 따라 법적책임을 질 수 있습니다.
Copyright ⓒ 연방타임즈 All rights reserved. 제보메일 : skw365@naver.com