<클라우드 운영> [KT에이블스쿨] 2025.05.29(목)
2025.05.29 (목)
오늘은 클라우드 개요 챕터의 마지막 순서로,
클라우드 운영에 대해 복습합니다.
온프레미스와 다르게 운영 측면에서 클라우드만의 생각해야할 점 !
들을 중점적으로 배우게 됩니다.
그리고 이전에 중요하다고 하셨던,
DevOps에 대해서도 클라우드 환경에 맞게 다시 정리해봅니다.
오늘도 클라우드 컴퓨팅의 중요한 내용이네요 !
온프레미스부터 클라우드까지, 정말 중요하지 않은 부분이 하나도 없네요 ..!
그말은.. 정리하고 공부해야 할 내용이 많다는 뜻 !
오늘도 열심히 리뷰해보겠습니다..!
시작합니다 :D
[클라우드 운영]
1. 클라우드 운영 개요
○ 클라우드 운영 관리
: 클라우드 인프라와 서비스의 상태를 안정적으로 유지하고, 변화에 효율적으로 대응하기 위한 관리 활동
→ 인프라의 배포/모니터링/최적화/보안/비용 관리 등을 포함
→ 클라우드는 직접 보지 못하는 환경이기 때문에 운영의 복잡도 증가하며, 자동화/가시성 확보가 핵심
○ 클라우드 운영 특징
: 동적 자원, 분산 인프라, 서비스 기반 관리, 툴 기반 운영
○ 클라우드 운영 중요성
① 인프라 투명성 감소
② 복잡성 및 변화 속도 증가
③ 보안 위협 증가
④ 비용 통제 필요성
○ 클라우드 운영 관리 주요 영역
① 모니터링
: 클라우드 인프라 및 서비스의 상태/성능/오류 여부 등을 실시간으로 수집/분석
→ 시스템 이상 징후를 조기에 감지하고 대응할 수 있는 기반 제공
→ 도입 효과 : 장애 예방, 성능 분석, 보안 대응, 운영 효율화
② 자원 관리
: 컴퓨팅, 스토리지, 네트워크 등 클라우드 리소스를 효율적으로 배치/운영하는 활동
→ 인스턴스 생성/삭제, 오토스케일링 정책 설정, 리소스 태깅 및 그룹 관리 등
→ 도입 효과 : 사용량에 따른 자원 자동 확장/축소, 리소스 과다 할당 방지, 능동적 대응, 팀별 리소스 사용 현황 파악 가능
③ 보안 관리
: 클라우드 환경에서 데이터 보호, 접근 통제, 위협 탐지 및 대응을 포함하는 관리 영역
→ 클라우드 제공자/사용자의 공동 책임 모델(Shared Responsibility Model)을 기반
→ IAM 정책관리, 방화벽, 보안 그룹 관리, 암호화 설정, 인증서 관리, 취약점 스캔 등
→ 도입 효과 : 계정 탈취 및 무단 접근 방지, 민감 데이터 보호, 서비스 안정성/신뢰성 확보, 사고 발생 시 신속한 원인 추적
④ 비용 관리
: 클라우드 자원의 사용량과 과금 현황을 모니터링하고 최적화하는 활동
→ 운영비용(OpEx) 모델 특성상 사용량에 따른 비용 변동을 상시 관리해야 함
→ 사용량 기반 청구 데이터 분석, 불필요한 리소스 탐지, 예산 설정 및 모니터링
→ 도입 효과 : 클라우드 과금 최적화, 서비스별 비용 가시성 확보, 투자 대비 성과 분석 가능
2. MSP 개념과 운영 전략
○ CSP(Cloud Service Provider) : 클라우드 서비스 제공자
: 서버, 저장소, 네트워크 등 IT 자원을 클라우드를 통해 제공하는 기업
→ 대표 기업 : Amazon Web Service, Microsoft Azure, Google Cloud Platform, Naver Cloud, KT Cloud
→ 특징 : 대규모 글로벌 인프라, 사용량 기반 종량제 과금 구조, API 기반 제공
○ MSP(Managed Service Provider) : 클라우드 운영 전문 대행 기업
: CSP가 제공한 클라우드 자원을 고객 대신 운영/관리하는 기업
→ 고객은 인프라 구축/운영에 부담 없이 비즈니스에 집중 가능
→ 제공 서비스 : 설계/구축, 운영/모니터링, 보안 관리, 비용 최적화, 마이그레이션 지원
→ 대표 기업 : 메가존클라우드(AWS 특화, 국내 최대 규모), 베스핀글로벌(멀티 클라우드), NHN Cloud MSP(자체 인프라 보유)
→ 클라우드 도입 운영 부담 해소, 기업 맞춤형 컨설팅 및 DevOps 기반 운영 지원
○ MSP의 주요 서비스
: 아키텍처 설계, 인프라 구축 자동화, 마이그레이션 지원, 운영환경 최적화 컨설팅, 보안 환경 구성,
규제 대응 및 컴플라이언스 지원, 24/7 모니터링, 장애 대응, 취약점 분석, 보안 업데이트, 기술 지원 등
3. DevOps 개념과 SI/SM 연계
○ DevOps
: 기능 개발(Dev)과 시스템 운영(Ops)을 하나의 흐름으로 통합하는 방식
→ 단순 기술이 아닌, 조직 문화와 업무 방식의 변화를 포함
→ 목적 : 빠르고 안정적인 서비스 배포 실현, 개발과 운영을 동일한 목표로 연결
→ 등장 배경 : 분리된 개발/운영 조직, 느린 배포 주기, 문제 책임 불분명, 협업 부재, 변화하는 서비스 환경
→ 핵심 구성 요소 : 협업 문화, 자동화 도구 활용, 지속적 통합/개선, 공통 목표 지향
→ 자동화 적용 분야 : 코드 관리, 테스트 자동화, 배포 자동화, 인프라 자동화, 모니터링, 협업 체계,
○ CI (지속적 통합, Continuous Integration)
: 여러 개발자가 동시에 작업한 코드를 하나의 코드베이스로 자주 통합
→ 코드 충돌 최소화, 자동 테스트로 품질 확보
○ CD (지속적 전달/배포, Continuous Delivery/Deployment)
: 통합된 코드를 자동으로 운영환경에 전달하거나 배포
→ 테스트, 빌드, 배포 과정을 자동화, 사람이 개입하지 않아도 안정적 릴리스 가능
○ CI/CD
: DevOps는 문화/조직 전반의 개념, CI/CD는 그 통합을 실제로 구현하는 자동화 프로세스
→ 차이점 :
구분 | CI (지속적 통합) | CD (지속적 전달/배포) |
목적 | 개발자의 코드를 자주, 자동으로 통합하여 오류 조기 발견 | 테스트를 통과한 코드를 자동으로 운영 환경에 배포 |
범위 | 코드 작성 → 빌드 → 자동 테스트까지 | 릴리스 승인 → 운영 환경 배포까지 |
특징 | 코드 품질 유지, 팀 간 충돌 최소화 | 수작업 최소화, 반복 가능한 배포 체계 |
효과 | 코드 변경이 쌓이기 전에 통합 → 배포 안정성 확보 | 빠르고 안정적인 릴리스 → 무중단 서비스 가능 |
○ SI(System Integration)
: 고객의 요구에 맞춰 IT 시스템을 처음부터 새로 구축하거나 기존 시스템을 통합하는 업무
→ 조직별 특화 시스템을 단기간 내 완성하여 운영 가능한 상태로 인도하는 것 (단기 프로젝트)
→ 구축 완료를 목표로 하는 일회성 계약
→ 업무 단계 : 요구사항 분석, 시스템 설계, 개발 및 구현, 테스트 및 이관
→ 장점 : 고객 맞춤형 시스템 구축 가능, 일괄 설계 및 납품
→ 단점 : 지속적 운영/개선 어려움, 피드백 반영 제한, 요구 변경 발생 시 비용/일정 증가
○ SM(System Management)
: 구축된 IT 시스템을 지속적으로 운영/관리/유지보수하는 업무
→ 안정성/가용성/성능 유지를 위한 중단 없는 서비스 제공
→ 장애 대응, 모니터링, 점검 등 지속적인 관리 업무 (장기 계약)
→ 주요 업무 : 시스템 모니터링, 장애 대응 및 복구, 보안 관리, 정기 점검, 운영 요청 처리
○ SI vs DevOps
: SI는 프로젝트 단위로 시스템을 한 번 구축, DevOps는 시스템을 지속적으로 개선(개발/운영 통합)
→ SI는 '시스템을 만드는 계약', DevOps는 '시스템을 발전시키는 문화'
○ SM vs DevOps
: SM은 장애 발생에 대한 대응 중심, DevOps는 장애 발생 이전 예방도 포함
○ SI/SM과 DevOps의 연계 방안
: 자동화 기반 아키텍처 설계/모니터링 시스템 도입
○ MLOps (Machine Learning Operations)
: 머신러닝 모델의 개발/학습/배포/운영 전 과정을 자동화하고 체계화하는 방식
→ 머신러닝 모델 품질과 안정성 유지, 데이터 기반 반복 학습 체계 구축
→ 주요 단계 구성 : 데이터 수집 및 정제 - 모델 학습 및 검증 - 모델 배포 및 운영 - 재학습 및 개선 반복
→ 구성요소 : ① 데이터 파이프라인 자동화 ② 모델 학습 자동화 ③ 모델 배포 및 운영 자동화
○ DevOps vs MLOps 비교
항목 | DevOps | MLOps |
목표 | 애플리케이션의 빠르고 안정적인 배포 | 머신러닝 모델의 지속적 학습과 운영 관리 |
자동화 대상 | 코드 빌드, 테스트, 배포 | 데이터 수집, 학습, 모델 배포, 재학습 |
프로세스 흐름 | Build – Test – Deploy – Monitor | Data – Train – Evaluate – Deploy – Monitor – Retrain |
관리 항목 | 코드, 설정 파일, 배포 버전 | 코드 + 데이터 + 모델 + 실험 결과 |
운영 중 주요 이슈 | 기능 오류, 서버 장애 등 | 모델 성능 저하, 데이터 드리프트 등 |
유지관리 방식 | 소프트웨어 버전 관리 및 롤백 | 모델 재학습, 성능 모니터링 기반 반복 개선 |
○ MCP(Model Context Protocol)
: AI 에이전트가 외부 도구 및 데이터 소스와 통신하기 위한 표준 인터페이스
→ 생성형 AI의 문맥 확장 및 기능 보완 목적
→ 필요성 : 일관된 방식으로 외부 시스템 연결 가능, 개발자 부담 감소, 확장성 증가, 다양한 AI 시스템/툴 간 연결 가능
→ 효과 : 개발 효율성 증가, 시스템 복잡도 증가, 사용자 맞춤형 도구 구성의 자동화
→ 구성 요소 :
① MCP 호스트 : 외부 자원에 접근하는 생성형 AI 애플리케이션
② MCP 클라이언트 : 호스트 내부에 포함되어 서버와 직접 통신
③ MCP 서버 : 데이터 소스, 도구, 기능을 클라이언트에 제공
④ 로컬 데이터 소스 : 내부 DB, 파일 시스템, 내부 API 등
⑤ 원격 데이터 소스 : 외부 SaaS, 3rd Party API, 클라우드 리소스
→ 처리 순서 요약
① 사용자 입력 수신 (프롬프트 입력)
② MCP 클라이언트가 요청 구조로 변환
③ MCP 서버에 전달하여 외부 자원 접근
④ 결과 응답을 호스트로 다시 전달
⑤ AI 모델이 응답에 문맥 반영 후 사용자에게 출력
→ MCP 시스템 구성도
4. IaC와 Ansible 소개
○ IaC(Infrastructure as Code)
: 서버, 네트워크, 운영체제 설정 등 인프라 자원을 코드로 정의하고 관리하는 기술
→ 사람이 직접 관리하지 않고 스크립트/선언형 코드로 자도오하
→ 방식 종류 :
① 선언형 : 무엇을 원하는지 기술, 시스템이 알아서 목표 상태까지 변화 (ex : Terraform, AWS CloudFormation)
② 명령형 : 어떻게 할 것인가를 기술, 실행 순서와 동작을 개발자가 제어 (ex : Ansible, Shell Script)
○ Ansible
: 오픈소스 기반 IT 자동화 도구 (시스템 설정, S/W 배포, 보안 패치, 구성 관리 등 자동화)
클라우드를 운영/관리하는 다양한 방법에 대해
구체적으로 배워보는 시간이었습니다.
DevOps란 단어처럼, IT 인프라를 개발했다고 끝이 아니라
안정적으로 서비스를 제공하고 해당 환경과 산업을 발전시켜 나가기 위해서는
개발 + 운영 이라는 개념이 기본 탑재되어 있어야 할 것 같습니다 !
그럼 오늘도 고생하셨습니다 !
