IT&Tech

스카이 컴퓨팅(Sky Computing); 멀티 클라우드를 유기적으로 통합하는 추상화 아키텍처

테크부기 2026. 1. 27. 20:41

스카이 컴퓨팅(Sky Computing)

스카이 컴퓨팅(Sky Computing)은 파편화된 개별 클라우드 서비스(AWS, Azure, GCP 등)를 하나의 거대한 단일 컴퓨팅 자원 풀로 통합하여 추상화하는 차세대 아키텍처다. 이는 인터넷이 독립적인 네트워크들을 TCP/IP로 연결하여 단일 네트워크처럼 동작하게 한 것과 유사하게, 서로 다른 클라우드 제공업체(CSP) 간의 상호운용성(Interoperability)을 보장하는 호환성 계층(Compatibility Layer)**을 구축한다. 핵심은 사용자가 특정 벤더의 API나 인프라에 종속되지 않고, 성능과 비용 효율성에 따라 워크로드를 자유롭게 이동시키는 것이다.

**호환성 계층(Compatibility Layer): 서로 다른 클라우드 서비스 제공자(CSP)의 독자적인 API와 기술 명세를 공통된 표준 인터페이스로 변환하는 추상화 소프트웨어 층이다. 애플리케이션이 특정 클라우드의 라이브러리에 직접 의존하지 않도록 중간에서 명령을 중계(Transaction)한다. 이는 리눅스 커널이 다양한 하드웨어를 추상화하여 일관된 시스템 콜을 제공하는 것과 같은 원리다. 개발자는 이 계층 덕분에 코드 수정 없이 AWS에서 GCP로 워크로드를 즉시 이전(작업 상태와 환경 설정을 추상화 또는 가상화 단위로 패키징하여 재배치하는 과정을 의미)할 수 있으며, 이는 스카이 컴퓨팅 아키텍처에서 벤더 종속성을 제거하고 상호운용성을 실현하는 핵심 엔진 역할을 수행한다.

구분 클라우드 컴퓨팅 (Cloud Computing) 스카이 컴퓨팅 (Sky Computing)
핵심 개념 단일 클라우드 벤더 위에서 자원 활용 다수 클라우드를 통합한 메타 클라우드
자원 관리 벤더 종속적 API 및 인스턴스 사용 클라우드 간 브로커리지를 통한 추상화
확장성 벤더가 제공하는 리전 내 확장 전 세계 모든 클라우드 리전으로 확장
주요 기술 Virtualization, Container Inter-cloud Layer, SkyPilot

 

기술 진화 로드맵 (Evolution)

스카이 컴퓨팅은 분산 시스템의 역사적 흐름 속에서 클라우드의 범용화를 목표로 진화해 왔다.

  • 2000년대 초반: 지리적으로 분산된 이기종 자원을 공유하는 그리드 컴퓨팅(Grid Computing) 개념이 정립되었다.
  • 2006년: AWS EC2의 등장으로 컴퓨팅 자원을 유틸리티처럼 사용하는 클라우드 컴퓨팅 시대가 본격화되었다.
  • 2010년대 중반: 단일 벤더 의존도를 낮추기 위한 멀티 클라우드(Multi-Cloud) 전략이 대두되었으나, API 파편화로 인한 기술 부채가 증가했다.
  • 2021년: UC 버클리 연구진이 'From Cloud Computing to Sky Computing' 논문을 통해 클라우드 간 장벽을 허무는 스카이 컴퓨팅 아키텍처를 공식 제안했다.
  • 2022년 이후: 슈퍼클라우드(Supercloud)** 패러다임이 구체화되었다. Snowflake와 Databricks가 데이터 계층을, Anyscale과 Cast AI가 연산 계층을 추상화하는 상용 솔루션을 출시하며, 기업 환경에서 이기종 클라우드를 단일 플랫폼처럼 운용하는 단계로 진입했다.

'From Cloud Computing to Sky Computing'의 Sky computing 아키텍처

 

**슈퍼클라우드: 여러 퍼블릭 클라우드 인프라 위에서 실행되며, 이들을 단일화된 서비스로 통합 제공하는 아키텍처 계층이다. 개별 CSP의 고유 API와 복잡성을 추상화하여, 사용자가 하부 인프라의 종류와 관계없이 동일한 관리 도구와 보안 정책으로 워크로드를 운영할 수 있게 한다. 이는 단순한 멀티 클라우드 관리를 넘어, 클라우드 간 경계 없는 데이터 이동과 연산 최적화를 실현하는 상업적 구현체로 평가받는다.


 

개발 생태계 및 구현 영향력 (Impact)

이 기술은 소프트웨어 공학 관점에서 벤더 락인(Vendor Lock-in) 문제를 근본적으로 해소한다. 개발자는 더 이상 특정 CSP의 독점적 기능에 맞춰 애플리케이션을 수정할 필요 없이, 표준화된 인터페이스를 통해 로직 개발에만 집중할 수 있다. 이는 인프라 전환 비용을 획기적으로 낮추고 시스템의 유연성을 극대화한다. 또한, 클라우드 자원의 가격 차익을 활용하는 스팟 인스턴스 오케스트레이션이 용이해져, 대규모 컴퓨팅 작업 시 비용 효율성을 최적화하는 새로운 데브옵스(DevOps) 방법론을 제시한다.


 

실제 구현 사례 및 주요 솔루션 (Use Cases)

현재 스카이 컴퓨팅의 가장 구체적인 구현체는 UC 버클리의 오픈소스 프로젝트인 'SkyPilot'이다. AI 연구소나 데이터 분석 기업들은 SkyPilot을 활용하여 대규모 머신러닝 학습 작업을 수행한다. 사용자가 작업을 제출하면, 시스템은 현재 시점에서 가장 저렴하고 가용성이 높은 GPU 인스턴스를 AWS, GCP, Azure 중에서 자동으로 탐색하여 할당한다. 이를 통해 엔지니어는 인프라 프로비저닝의 복잡성 없이 단순히 작업을 정의하는 것만으로 최적의 리소스를 활용하며, 실제로 모델 학습 비용을 수십 퍼센트 절감하는 성과를 거두고 있다.


기술 전망 및 리스크 (Future Vision)

향후 5년 내 스카이 컴퓨팅은 클라우드 자원을 전기나 수도와 같은 완전한 원자재(Commodity)로 전환하는 촉매제가 될 것이다. CSP 간의 경계가 희미해지며 '메타 클라우드'**가 표준 인프라로 자리 잡을 것으로 전망된다. 그러나 기술적 과제도 분명하다. 클라우드 간 데이터 이동 시 발생하는 막대한 이그레스(Egress) 비용 문제와 네트워크 레이턴시, 그리고 각기 다른 보안 정책을 통합 관리해야 하는 거버넌스 리스크가 존재한다. 따라서 데이터 지역성(Data Locality)을 고려한 지능형 스케줄링과 제로 트러스트 기반의 통합 보안 아키텍처 수립이 필수적이다.

**메타 클라우드: 파편화된 다수의 퍼블릭 클라우드 인프라 상단에 구축되는 통합 추상화 계층을 의미한다. 개별 클라우드 벤더의 독자적인 API와 관리 도구를 직접 다루는 대신, 공통된 인터페이스를 통해 워크로드를 배치하고 제어한다. 핵심 목적은 특정 CSP에 대한 벤더 종속성 해소와 멀티 클라우드 환경의 운영 효율화다. 메타 클라우드 계층은 데이터 통합, 크로스 클라우드 오케스트레이션, 통합 보안 정책 적용 등을 수행하며 시스템의 상호운용성(Interoperatibility)을 극대화한다. 엔지니어는 하부 인프라의 복잡성에 구애받지 않고 애플리케이션 로직과 정책 설정에만 집중할 수 있는 환경을 제공받는다.