2 분 소요

드디어 저의 번역 책이 출판 된다. 2021년 코로나 시절에 시작해 무려 2년 동안 번역했다. 이 책은 AWS 데이터 과학과 인공지능, 세이지메이커를 이용한 BERT 다루는 내용과 MLOps 가 총망라에 되어 있다.

그림 - AWS기반 데이터 과학

1. AWS 기반 데이터 과학 특징

  • 흩어져 있는 모든 AWS 서비스를 책 한 권에. 80여 가지 AWS AI & ML 서비스로 구현하는 데이터 과학 프로젝트 실전 가이드
  • AWS에서 제공하는 AI와 ML 기능을 활용하여 데이터 과학 프로젝트를 구축하고 배포하는 방법을 다룬 실전 지침서
  • 프로젝트와 데이터의 규모가 커지면서 AWS로 데이터 과학 인프라를 구축하는 게 필수적인 요소 중 하나로 자리 잡았음
  • 실제로 넷플릭스를 비롯한 선두 기업들은 EC2, S3, EMR, 레드시프트, 람다 등을 활용해 성과를 높이고 있음
  • 그러나 AWS의 기능은 매우 방대해서 데이터 과학을 수행하는 데 필요한 자료를 찾고, 실무에 적용하는 건 어렵다.
  • AWS를 활용하여 데이터 과학 프로젝트를 구축하고 배포분들께 유용함
  • AWS 서비스로 데이터 과학을 수행하고, 비즈니스 성과를 높이기 위한 전 과정을 안내함
  • 머신러닝 모델을 빠르게 구축, 훈련 및 배포할 수 있는 완전 관리형 서비스인 ‘세이지메이커’를 활용하여 실질적인 문제를 해결하는 방법도 다루고 있음
  • 그 외에도 AWS 비용 최적화에 대한 팁과 보안 정보, 프로젝트 진행 중 겪을 수 있는 다양한 문제와 해결책도 얻을 수 있음
  • AWS를 활용하여 인공지능을 구축하는 방법에 대해 처음부터 끝까지 배우고자 하는 모든 개발자에게 이 책을 추천함

2. 이 책에서 다루는 AWS 서비스 소개

  • 인공지능: Amazon SageMaker, Amazon Lex, Amazon Translate, AWS DeepLens 등
  • 컴퓨트: Amazon EC2, AWS Lambda, Amazon ECS, Amazon EKS 등
  • 스토리지: Amazon EBS, Amazon EFS, Amazon S3 등
  • 데이터베이스: Amazon RDS, Amazon DynamoDB, Amazon Aurora, Amazon QLDB 등
  • 보안: AWS IAM, AWS KMS, Amazon Macie, AWS Artifact, AWS Config 등

3. 이 책의 구성

  • 1장 : 아마존 AI.ML에 대해서 개략적 설명
  • 2장 : 추천시스템, 자연어 이해 등등 아마존 Al과 ML스택을 적용
  • 3장 : 세이지메이커 오토파일럿의 AutoML 사용
  • 4~9장 : 데이터의 수집 및 분석, 피처 선택 및 엔지니어링, 모델훈련 및 튜닝, 아마존 세이지 메이커, 아마존 아테나, 아마존 레드시프트, 아마존 EMR, 텐서플로우, 파이토치, 서비리스 아피치 스파크를 활용한 모델배포, BERT기반 자연어 처리 NLP의 전체 모델 개발 라이프 사이클
  • 10장 : 세이지메이커 파이프라인, 큐브플로우 파이프라인, 아파치 에어플로우, MLflow, TFX와 함께 MLOps를 사용해 모든 것을 반복하는 파이프라인으로 통합
  • 11장 : 아마존 키네시스와 아파치 카프카를 사용한 실시간 데이터 스트림
  • 12장 : AWS IAM, 인증, 권한부여, 네트워크 격리, 미사용 데이터 암호화, 전송중 양자 내성 네트워크 암호화, 거버넌스, 감사 가능성

4. 이 책의 번역 후기

2021년 새해를 넘어 오라일리 온라인으로 이번 겨울에 모두 다 읽었다. 책의 내용이 자습서처럼 절차대로 따라하는 방식이 아니라 핵심 부분을 중점으로 설명하고 이해 돕기 위한 사진과 소스 코드로 수록되는 중급 수준 책이라고 볼 수 있었다.

따라서 AWS Customer Reviews Dataset 기반으로 데이터 과학 솔루션 뿐만 아니라 머신러닝 모델링(특히, BERT) 및 피처 선택, 배포 및 모니터링 등 총망라로 구성되어 있습니다.

원서가 만들어진 시점에는 세이지메이커 2.X beta 버전이라 다소 지금의 AWS 화면 또는 메뉴가 변경이 되어 있다. 덕분에 세이지메이커 구석 구석 확인하고 공부할 수 있어서 좋았다.

영한 번역 뿐만 아니라 소스 코드 실행도 잘 동작하는지 살펴보고 있습니다. 문제 있는 부분은 표시를 해 두었다가 저자에게 물었다. 저자 분들 모두 AWS 직원분들이었다.

책이 나올 시점이 크리스마스라 그 전에 올해 라스베가스에서 Re:Invent 2021 행사에 세이지메이커 3.x 가 나올 예정인데 소스 코드가 호환 가능한지 어떤 내용이 업데이트 되어 있는지 확인까지 해서 자세한 가이드라인도 드리도록 하겠다. 그러나 안타깝게 2022년에도 이 책은 번역에 번역을 거쳐서 탈고하게 되어서 못나오게 되었고,그 이듬해인 2023년 오늘 출판하게 되었다.

5. 참고

댓글남기기