본문 바로가기

[삼정KPMG] Future Academy 3기

[Week #3] 생성형 인공지능 모델 실습 (feat. HuggingFace)

삼정KPMG Future Academy 3기의 3주차 교육이 종료되었다.

이번 주는 프로젝트 관리에 대한 이론 학습 및 인공지능에 대한 이론+실습 학습이 진행됐다.

대학을 졸업하고, 회사에서 업무를 하며 여러 개의 프로젝트를 경험했고, 프로젝트 관리자로서 리딩도 해본 적 있지만 프로젝트 관리 방법에 대해 배운 적은 없었다. 경험상 체득하거나 시니어 레벨의 어깨 너머로 엿보아  일종의 암묵지와 같이 해 왔을 뿐. 이번 주 강의 때처럼 각 잡고 앉아서 프로젝트 관리란 무엇인지, 무엇이 중요한지, 어떤 방법론을 쓰는지 등등 이론적 내용을 학습한 건 처음이었다. 알고 있던 내용도 있었고 처음 접하는 내용도 있었다. 실무에서 직접 경험해보며 스스로 익혔던 방법에 이름이 붙여지기도 했다. 혹자는 '실무에서 직접 해보고 익히는 게 중요하지, 이론은 의미가 없다'고 생각할 수도 있겠다. 하지만 실무에서 먼저 주먹구구로 어떻게든 프로젝트 관리를 해봤다가 뒤늦게 이론을 공부하게 된 내 관점에서는, '이론을 먼저 배웠다면 좋았겠다'라는 생각을 하게 됐다. 배우는 시점에서 프로젝트 관리 이론의 모든 의미와 실무 상황을 완전히 이해하지는 못하더라도, 이후 실무에 투입되었을 때 기존에 배워두었던 이론적 지식이 있다면 좀 더 종합적으로 상황을 고려하고 돌발 상황에도 의연하게 대처할 수 있었을 것 같다. 책 속 내용과 현실 상황에 격차가 있는 것은 사실이지만, 머릿속에 매뉴얼과 가이드라인이 있는 사람과 아예 백지인 사람 사이엔 상황 대처 능력, 문제 해결 능력, 판단 능력 등에 분명한 차이가 있을 거라고 생각한다. 

HuggingFace ( Hugging Face – The AI community building the future. ) 에 공개된 인공지능 모델을 활용해 생성형 AI를 활용해 보는 실습도 진행했다.   

(1) Llama 3 실습 : Meta의 Llama 3 모델을 활용해 프롬프트 입력에 따른 인공 지능의 응답을 받아 보았다. 

(2) Stable Diffusion 실습 : 이미지 생성형 AI 모델 'Stable Diffusion'을 사용해 Text-to-Image 방식으로 이미지를 생성해 보았다. 아래는 "a photo of an astronaut riding a horse on mars" 라는 프롬프트를 입력해서 Stable Diffusion 으로 생성한 이미지이다. 화성에서 말을 타는 우주인이라니, 생성형 AI의 상상력과 창의성이 돋보인다.

(이미지 출처: Stable Diffusion 모델을 사용해 직접 생성한 이미지)

(3) STT(speech to text) & TTS(text to speech) 실습 
: Google Text-to-Speech(gTTS) 라이브러리를 활용해 텍스트를 음성으로 변환하고, mp3 파일로 저장해 오디오를 들어봤다.
openai API와 연동해서 코랩 환경에서 chat GPT와 상호작용하여 나의 질문에 대한 대답을 받고 그 대답을 mp3 파일로 저장했다. openai의 whisper large v3 모델의 STT 기술을 사용해 mp3 파일에 담긴 오디오를 텍스트로 변환해 보기도 했다. 
텍스트와 오디오 두 가지 형태를 넘나들며 메시지를 표현하는 실습을 통해 다양한 서비스 아이디어가 생각났다. 특히, STT 와 TTS 기술을 활용해 다양한 배리어프리(Barrier-Free) 서비스를 만들어 시각, 청각 장애인 분들께 많은 생활 편의와 도움을 줄 수 있을 것 같았다.