KT에이블스쿨/수업 복습 정리

<클라우드 운영> [KT에이블스쿨] 2025.05.29(목)

PaperDrop 2025. 6. 13. 15:13

2025.05.29 (목)

 

 

 

오늘은 클라우드 개요 챕터의 마지막 순서로,

클라우드 운영에 대해 복습합니다.

 

온프레미스와 다르게 운영 측면에서 클라우드만의 생각해야할 점 !

들을 중점적으로 배우게 됩니다.

 

그리고 이전에 중요하다고 하셨던,

DevOps에 대해서도 클라우드 환경에 맞게 다시 정리해봅니다.

 

오늘도 클라우드 컴퓨팅의 중요한 내용이네요 !

 

온프레미스부터 클라우드까지, 정말 중요하지 않은 부분이 하나도 없네요 ..!

그말은.. 정리하고 공부해야 할 내용이 많다는 뜻 !

 

오늘도 열심히 리뷰해보겠습니다..!

시작합니다 :D

 

 


 

[클라우드 운영]

 

1. 클라우드 운영 개요

○ 클라우드 운영 관리

  : 클라우드 인프라와 서비스의 상태를 안정적으로 유지하고, 변화에 효율적으로 대응하기 위한 관리 활동

  → 인프라의 배포/모니터링/최적화/보안/비용 관리 등을 포함

  → 클라우드는 직접 보지 못하는 환경이기 때문에 운영의 복잡도 증가하며, 자동화/가시성 확보가 핵심

 

○ 클라우드 운영 특징 

  : 동적 자원, 분산 인프라, 서비스 기반 관리, 툴 기반 운영

 

○ 클라우드 운영 중요성

 ① 인프라 투명성 감소

 ② 복잡성 및 변화 속도 증가

 ③ 보안 위협 증가

 ④ 비용 통제 필요성

 

○ 클라우드 운영 관리 주요 영역

  ① 모니터링

    : 클라우드 인프라 및 서비스의 상태/성능/오류 여부 등을 실시간으로 수집/분석

    → 시스템 이상 징후를 조기에 감지하고 대응할 수 있는 기반 제공

    → 도입 효과 : 장애 예방, 성능 분석, 보안 대응, 운영 효율화

 

  ② 자원 관리

    : 컴퓨팅, 스토리지, 네트워크 등 클라우드 리소스를 효율적으로 배치/운영하는 활동

    → 인스턴스 생성/삭제, 오토스케일링 정책 설정, 리소스 태깅 및 그룹 관리 등

    → 도입 효과 : 사용량에 따른 자원 자동 확장/축소, 리소스 과다 할당 방지, 능동적 대응, 팀별 리소스 사용 현황 파악 가능

 

  ③ 보안 관리 

    : 클라우드 환경에서 데이터 보호, 접근 통제, 위협 탐지 및 대응을 포함하는 관리 영역

    → 클라우드 제공자/사용자의 공동 책임 모델(Shared Responsibility Model)을 기반

    → IAM 정책관리, 방화벽, 보안 그룹 관리, 암호화 설정, 인증서 관리, 취약점 스캔 등

    → 도입 효과 : 계정 탈취 및 무단 접근 방지, 민감 데이터 보호, 서비스 안정성/신뢰성 확보, 사고 발생 시 신속한 원인 추적

 

  ④ 비용 관리

    : 클라우드 자원의 사용량과 과금 현황을 모니터링하고 최적화하는 활동

    → 운영비용(OpEx) 모델 특성상 사용량에 따른 비용 변동을 상시 관리해야 함 

    → 사용량 기반 청구 데이터 분석, 불필요한 리소스 탐지, 예산 설정 및 모니터링

    → 도입 효과 : 클라우드 과금 최적화, 서비스별 비용 가시성 확보, 투자 대비 성과 분석 가능

 

2. MSP 개념과 운영 전략

CSP(Cloud Service Provider) : 클라우드 서비스 제공자

  : 서버, 저장소, 네트워크 등 IT 자원을 클라우드를 통해 제공하는 기업

  → 대표 기업 : Amazon Web Service, Microsoft Azure, Google Cloud Platform, Naver Cloud, KT Cloud

  → 특징 : 대규모 글로벌 인프라, 사용량 기반 종량제 과금 구조, API 기반 제공

 

MSP(Managed Service Provider) : 클라우드 운영 전문 대행 기업

  : CSP가 제공한 클라우드 자원을 고객 대신 운영/관리하는 기업

  → 고객은 인프라 구축/운영에 부담 없이 비즈니스에 집중 가능

  → 제공 서비스 : 설계/구축, 운영/모니터링, 보안 관리, 비용 최적화, 마이그레이션 지원

  → 대표 기업 : 메가존클라우드(AWS 특화, 국내 최대 규모), 베스핀글로벌(멀티 클라우드), NHN Cloud MSP(자체 인프라 보유)

  → 클라우드 도입 운영 부담 해소, 기업 맞춤형 컨설팅 및 DevOps 기반 운영 지원

 

○ MSP의 주요 서비스 

  : 아키텍처 설계, 인프라 구축 자동화, 마이그레이션 지원, 운영환경 최적화 컨설팅, 보안 환경 구성,

     규제 대응 및 컴플라이언스 지원, 24/7 모니터링, 장애 대응, 취약점 분석, 보안 업데이트, 기술 지원 등

 

3. DevOps 개념과 SI/SM 연계

○ DevOps

  : 기능 개발(Dev)과 시스템 운영(Ops)을 하나의 흐름으로 통합하는 방식

  → 단순 기술이 아닌, 조직 문화와 업무 방식의 변화를 포함

  → 목적 : 빠르고 안정적인 서비스 배포 실현, 개발과 운영을 동일한 목표로 연결

  → 등장 배경 : 분리된 개발/운영 조직, 느린 배포 주기, 문제 책임 불분명, 협업 부재, 변화하는 서비스 환경

  → 핵심 구성 요소 : 협업 문화, 자동화 도구 활용, 지속적 통합/개선, 공통 목표 지향

  → 자동화 적용 분야 : 코드 관리, 테스트 자동화, 배포 자동화, 인프라 자동화, 모니터링, 협업 체계, 

 

○ CI (지속적 통합, Continuous Integration)

  : 여러 개발자가 동시에 작업한 코드를 하나의 코드베이스로 자주 통합

  → 코드 충돌 최소화, 자동 테스트로 품질 확보

 

○ CD (지속적 전달/배포, Continuous Delivery/Deployment)

  : 통합된 코드를 자동으로 운영환경에 전달하거나 배포

  → 테스트, 빌드, 배포 과정을 자동화, 사람이 개입하지 않아도 안정적 릴리스 가능

 

○ CI/CD 

  : DevOps는 문화/조직 전반의 개념, CI/CD는 그 통합을 실제로 구현하는 자동화 프로세스 

  → 차이점 : 

구분  CI (지속적 통합) CD (지속적 전달/배포)
목적 개발자의 코드를 자주, 자동으로 통합하여 오류 조기 발견 테스트를 통과한 코드를 자동으로 운영 환경에 배포
범위 코드 작성 → 빌드 → 자동 테스트까지 릴리스 승인 → 운영 환경 배포까지
특징 코드 품질 유지, 팀 간 충돌 최소화 수작업 최소화, 반복 가능한 배포 체계
효과 코드 변경이 쌓이기 전에 통합 → 배포 안정성 확보 빠르고 안정적인 릴리스 → 무중단 서비스 가능

 

○ SI(System Integration)

  : 고객의 요구에 맞춰 IT 시스템을 처음부터 새로 구축하거나 기존 시스템을 통합하는 업무

  → 조직별 특화 시스템을 단기간 내 완성하여 운영 가능한 상태로 인도하는 것 (단기 프로젝트)

  → 구축 완료를 목표로 하는 일회성 계약

  → 업무 단계 : 요구사항 분석, 시스템 설계, 개발 및 구현, 테스트 및 이관

  → 장점 : 고객 맞춤형 시스템 구축 가능, 일괄 설계 및 납품

  → 단점 : 지속적 운영/개선 어려움, 피드백 반영 제한, 요구 변경 발생 시 비용/일정 증가

 

○ SM(System Management) 

  : 구축된 IT 시스템을 지속적으로 운영/관리/유지보수하는 업무 

  → 안정성/가용성/성능 유지를 위한 중단 없는 서비스 제공

  → 장애 대응, 모니터링, 점검 등 지속적인 관리 업무 (장기 계약)

  → 주요 업무 : 시스템 모니터링, 장애 대응 및 복구, 보안 관리, 정기 점검, 운영 요청 처리

 

○ SI vs DevOps

  : SI는 프로젝트 단위로 시스템을 한 번 구축, DevOps는 시스템을 지속적으로 개선(개발/운영 통합)

  → SI는 '시스템을 만드는 계약', DevOps는 '시스템을 발전시키는 문화'

 

○ SM vs DevOps

  : SM은 장애 발생에 대한 대응 중심, DevOps는 장애 발생 이전 예방도 포함

  

○ SI/SM과 DevOps의 연계 방안

  : 자동화 기반 아키텍처 설계/모니터링 시스템 도입

 

○ MLOps (Machine Learning Operations)

  : 머신러닝 모델의 개발/학습/배포/운영 전 과정을 자동화하고 체계화하는 방식

  → 머신러닝 모델 품질과 안정성 유지, 데이터 기반 반복 학습 체계 구축

  → 주요 단계 구성 : 데이터 수집 및 정제 - 모델 학습 및 검증 - 모델 배포 및 운영 - 재학습 및 개선 반복

  → 구성요소 : ① 데이터 파이프라인 자동화 ② 모델 학습 자동화 ③ 모델 배포 및 운영 자동화

 

○ DevOps vs MLOps 비교

항목 DevOps MLOps
목표 애플리케이션의 빠르고 안정적인 배포 머신러닝 모델의 지속적 학습과 운영 관리
자동화 대상 코드 빌드, 테스트, 배포 데이터 수집, 학습, 모델 배포, 재학습
프로세스 흐름 Build – Test – Deploy – Monitor Data – Train – Evaluate – Deploy – Monitor – Retrain
관리 항목 코드, 설정 파일, 배포 버전 코드 + 데이터 + 모델 + 실험 결과
운영 중 주요 이슈 기능 오류, 서버 장애 등 모델 성능 저하, 데이터 드리프트 등
유지관리 방식 소프트웨어 버전 관리 및 롤백 모델 재학습, 성능 모니터링 기반 반복 개선

 

○ MCP(Model Context Protocol)

  : AI 에이전트가 외부 도구 및 데이터 소스와 통신하기 위한 표준 인터페이스

  → 생성형 AI의 문맥 확장 및 기능 보완 목적

  → 필요성 : 일관된 방식으로 외부 시스템 연결 가능, 개발자 부담 감소, 확장성 증가, 다양한 AI 시스템/툴 간 연결 가능

  → 효과 : 개발 효율성 증가, 시스템 복잡도 증가, 사용자 맞춤형 도구 구성의 자동화 

 

  → 구성 요소 :

    ① MCP 호스트 : 외부 자원에 접근하는 생성형 AI 애플리케이션

    ② MCP 클라이언트 : 호스트 내부에 포함되어 서버와 직접 통신 

    ③ MCP 서버 : 데이터 소스, 도구, 기능을 클라이언트에 제공

    ④ 로컬 데이터 소스 : 내부 DB, 파일 시스템, 내부 API 등

    ⑤ 원격 데이터 소스 : 외부 SaaS, 3rd Party API, 클라우드 리소스 

 

  → 처리 순서 요약
    ① 사용자 입력 수신 (프롬프트 입력)
    ② MCP 클라이언트가 요청 구조로 변환
    ③ MCP 서버에 전달하여 외부 자원 접근
    ④ 결과 응답을 호스트로 다시 전달
    ⑤ AI 모델이 응답에 문맥 반영 후 사용자에게 출력

 

  → MCP 시스템 구성도

MCP 시스템 구성도

 

4. IaC와 Ansible 소개

○ IaC(Infrastructure as Code)

  : 서버, 네트워크, 운영체제 설정 등 인프라 자원을 코드로 정의하고 관리하는 기술

  → 사람이 직접 관리하지 않고 스크립트/선언형 코드로 자도오하 

  → 방식 종류 : 

    ① 선언형 : 무엇을 원하는지 기술, 시스템이 알아서 목표 상태까지 변화 (ex : Terraform, AWS CloudFormation)

    ② 명령형 : 어떻게 할 것인가를 기술, 실행 순서와 동작을 개발자가 제어 (ex : Ansible, Shell Script)

 

○ Ansible 

  : 오픈소스 기반 IT 자동화 도구 (시스템 설정, S/W 배포, 보안 패치, 구성 관리 등 자동화)

 

 


 

 

클라우드를 운영/관리하는 다양한 방법에 대해 

구체적으로 배워보는 시간이었습니다.

 

DevOps란 단어처럼, IT 인프라를 개발했다고 끝이 아니라

안정적으로 서비스를 제공하고 해당 환경과 산업을 발전시켜 나가기 위해서는

개발 + 운영 이라는 개념이 기본 탑재되어 있어야 할 것 같습니다 ! 

 

그럼 오늘도 고생하셨습니다 !