2 분 소요

Basic Azure AI Foundry 서비스에서 챗봇 아키텍처 디자인에서 고려사항들 중에 신뢰성에 대해 좀 더 상세히 알아보자!

1. 신뢰성

  • 고려사항은 Azure Well-Architected Framework의 핵심 원칙을 구현한 것

  • Azure Well-Architected Framework은 워크로드의 품질을 향상시키기 위해 따를 수 있는 가이드라인을 제공함

  • 기본 아키텍처는 운영 환경용이 아닌 학습용으로 설계되었음

    • 기능보다는 단순성과 비용 효율성을 중시하여 Azure AI Foundry와 Azure OpenAI를 활용한 종단 간 채팅 애플리케이션을 학습하는 데 적합
  • 신뢰성 (Reliability)

    • 신뢰성은 애플리케이션이 고객에게 약속한 서비스 수준을 안정적으로 제공할 수 있도록 보장함 -> 신뢰성을 위한 설계 검토 체크리스트

    • App Service Basic 요금제 사용

      • 챗봇 아키텍처는 Azure 가용 영역(Availability Zones)을 지원하지 않는 App Service Basic 요금제를 사용
      • 인스턴스, 랙 또는 해당 인스턴스를 호스팅하는 데이터 센터에 문제가 생기면 서비스가 중단될 수 있음
      • 운영 환경으로 전환할 경우, App Service 인스턴스를 위한 신뢰성 가이드 를 따라야 함
    • 클라이언트 UI의 자동 확장 미사용

      • 컴퓨팅 리소스가 비효율적으로 할당되면 신뢰성 문제로 이어질 수 있음
      • 최대 동시 사용자 수를 처리할 수 있도록 리소스를 과잉 할당(overprovisioning)하는 것이 필요함
    • Foundry Agent Service의 종속 리소스에 대한 제어권 없음

      • Foundry Agent Service는 Microsoft가 완전하게 호스팅하는 솔루션으로, Azure Cosmos DB, Azure Storage 계정, AI Search 인덱스를 포함한 리소스들을 사용함
      • 이러한 종속 리소스들은 사용자 구독에 나타나지 않으며, 직접적인 제어가 불가능함
      • 비즈니스 연속성과 재해 복구 전략을 구현하려면 이들 종속 리소스를 사용자 소유로 전환하는 것이 좋음
      • 참고: 컴포넌트의 AI Service 와 위의 아키텍처 다이어그램에서 그린 AI Search 인스턴스는 Foundry Agent Service의 종속 리소스로 사용되는 인스턴스와 다릅 -> 컴포넌트 섹션의 인스턴스는 사용자 고유의 그라운딩 데이터(grounding data)를 저장하며, 종속 인스턴스는 채팅 세션 중 업로드된 파일을 실시간으로 청킹(chunking)
    • Global Standard 배포 유형 사용

      • 학습 목적의 기본 아키텍처에서는 Global Standard 배포 유형을 사용할 수 있음
      • 운영 환경으로 전환할 때는 처리량(throughput)데이터 거주(data residency) 요건을 명확히 파악한 후 적절한 배포 유형을 선택해야 함
        • 처리량 요건이 명확해지면 Data Zone Provisioned(로컬 리전 기반) 또는 Global Provisioned 유형을 고려
        • 데이터 거주 요건이 있다면 Data Zone Provisioned 유형을 선택
    • AI Search Basic 요금제 사용

      • 이 요금제는 Azure 가용 영역을 지원하지 않음

      • Zone Redundancy(가용 영역 중복성)를 확보하려면:

        • AI Search Standard 요금제 이상을 사용하라

        • 가용 영역을 지원하는 리전에 배포하고 3개 이상의 복제본(replicas)을 구성하라

2. Data Zone Provisioned 과 Global Provisioned 배포 차이점

  • 애플리케이션이 운영 환경에 진입하면, 동시 사용자 수, 요청 빈도, 문서 업로드량, 검색 쿼리 수 등의 측면에서 예상 처리량(throughput)이 점점 더 중요해짐

  • Azure AI Foundry 또는 AI Search와 같은 서비스는 이러한 처리량을 기준으로 적절한 성능을 제공할 수 있도록 프로비저닝(사전 리소스 예약)된 배포 방식을 제공

  • 실제 사용량이나 트래픽 수준을 분석하여, Data Zone Provisioned 나 Global Provisioned 로 배포시켜야 함

  • 데이터가 특정 리전에 머물러야 하는 경우 또는 해당 리전 내에서 예측 가능한 처리량과 성능을 확보하려면 Data Zone Provisioned를 선택

  • 데이터가 전 세계 어디에 저장되어도 괜찮고, 글로벌 사용자에게 빠른 응답성과 높은 가용성을 제공하고 싶다면 Global Provisioned를 선택

3. Data Zone Provisioned 과 Global Provisioned 배포 옵션 비교

항목 Data Zone Provisioned Global Provisioned
설명 지정된 데이터 존(region)에 리소스를 고정적으로 프로비저닝 Azure의 여러 글로벌 리전에서 사용자를 위한 최적화된 분산 배포
사용 사례 데이터 거주 요건이 있는 기업 (예: “데이터는 반드시 한국 내에 저장되어야 한다”) 글로벌 사용자 대상 서비스 (예: 여러 국가에서 접근)
데이터 거주 지원 (리전을 지정할 수 있음) 일부 제한됨 (Azure가 리전을 최적화해 배포)
지연 시간 리전 내 사용자에게 빠른 응답 글로벌 최적화되어 있지만, 데이터가 특정 지역에 저장되지 않을 수 있음
처리량 제어 고정된 지역에서의 처리량을 정밀하게 조절 가능 글로벌 전체 처리량 최적화에 초점

댓글남기기