성장의 법칙, 메가스터디아카데미

[메카뎀 매거진] #34. 생성형 AI_스테이블 디퓨전

3분 분량

이전에 메카뎀 매거진에서 'AI의 활용'을 주제로
생성형 AI 관련 매거진을 작성했었죠.
오늘은 생성형 AI의 대표 주자인
스테이블 디퓨전에 관하여 알아보려고 합니다!

AI의 활용 편을 아직 못 보셨다면 아래 링크를 클릭해주세요 :)
▶ 비즈니스 판을 뒤흔들, AI 활용 비즈니스 다시 보기

스테이블 디퓨전은 어떻게 세상에 등장했을까요?

스테이블 디퓨전(Stable Diffusion)은 독일 뮌헨 대학교
Machine Vision & Learning Group (CompVis) 연구실이
개발한 잠재 확산 모델을 바탕으로 제작되었으며,
Stability AI와 Runway ML 등의 기업으로부터
지원받아 개발된 딥러닝 인공지능 모델이에요.

2022년 8월 22일 오픈소스로 공개되었으며,
사용자가 텍스트 프롬프트를 입력하면
이미지로 결과물을 추출하는
‘text-to-image’ 기반의 생성 AI입니다.

스테이블 디퓨전은 이미지에 점차
노이즈를 주고 노이즈를 다시 제거함으로써
이미지를 완성하는 diffusion 모델을 활용해
고품질의 이미지를 생성합니다.

이에 따라 기존의 text-to-image 모델들이 갖고 있던
저화질 문제와 컴퓨터 리소스 문제를 해결했습니다.

(출처 : 한국저작권위원회 생성형 인공지능 (Generative AI) 산업 현황 보고서)

스테이블 디퓨전이 오픈소스로 공개된 덕분에
사용자들은 일정한 제약사항을 제외하고는
창조적인 용도로 자유롭게 사용하고 있어요.

이 덕분에 스테이블 디퓨전은
그림 인공지능 시대를 열었다는
평을 받고 있습니다.

(출처 : stability AI)

스테이블 디퓨전은 누구나 무료로 사용할 수 있으며,
오픈소스(Open-source)이기에 개발자들이
지속해서 다양한 기능을 선보이고 있어요.

게다가 비교적 큰 해상도의
이미지를 생성함에도
리소스 사용량이 많지 않아
가정용 컴퓨터에서도 실행할 수 있어
생성형 AI의 대표 주자가 되었습니다.

스테이블 디퓨전은 어떻게 사용할까요?

스테이블 디퓨전을 사용하기 위해서는
이미지를 설명하는 텍스트(프롬프트)를 작성해야 합니다.
예를 들어 [헨젤과 그레텔에 나오는 과자집] 이미지를
생성하고 싶다면 다음 프롬프트를 입력하면 됩니다.

gingerbread house, diorama, in focus,
white background, toast, crunch cereal

그럼 스테이블 디퓨전은 해당 프롬프트에 맞춰
텍스트를 이미지로 변환합니다.

(출처 : stable-diffusion-art.com/beginners-guid)

하나의 프롬프트라고 하더라도
원하는 이미지가 나올 때까지
다양한 이미지를 생성할 수 있습니다^_^

또한, 2D, 실사, 풍경화, 판타지,
동물 이미지까지 다양한 화풍을
프롬프트 작성만으로
한 번에 제작할 수 있어요.

이미지를 생성하는 스펙트럼이 넓다 보니
광고, 게임, 건축 디자인 등
다양한 산업군에서 활발하게
활용되고 있습니다.

(출처 : stable-diffusion-art.com/beginners-guid)

원하는 이미지를 얻으려면
프롬프트를 어떻게 작성해야 할까요?

그리고자 하는 이미지의 주제를
가능한 구체적으로 작성하고,
유명인 이름과 그림, 3D 등
생성하고자 하는 키워드를 포함하여
작성하면 원하는 이미지를
더욱 쉽게 생성할 수 있습니다. :)

예를 들어, 식당 밖에 앉아있는 실사의
젊은 여성 이미지를 생성하고 싶다면
다음의 프롬프트를 작성하면 돼요!

Positive prompt :
young female, highlights in hair,
sitting outside restaurant, brown eyes,
wearing a dress, side light

Negative prompt :
disfigured, ugly, bad, immature

긍정적인 프롬프트로
연령층(young), 성별(female)
머리카락(highlights in hair)
장소(sitting outside restaurant)
얼굴(brown eyes), 옷(wearing a dress)
조명(side light) 등
원하는 이미지를
구체적으로 작성했으며,

부정적인 프롬프트를 함께 작성해
매력적이지 않은 모델 이미지와
뒤틀린 신체 부위가 생성되는 것을
방지할 수 있는 프롬프트를 작성했습니다.

위 프롬프트를 입력하면
다음과 같은 이미지가
생성됩니다!

(출처 : stable-diffusion-art.com/realistic-human-street-portrait)

이렇게 프롬프트에 구체적으로 작성하면
원하는 내용이 충분히 반영된 이미지를
생성할 수 있어요!

실제 인물을 촬영한 것 같은데
인공지능으로 생성한 이미지라는 게
믿기지 않죠!

지난 7월 26일 Stability.ai는 SDXL 1.0
업데이트를 발표하며,
생성형 AI의 끝없는 진화를
한 번 더 확인했습니다.

이번에 출시한 버전은
생생하고 정확한 색상과 더 나은 대비,
신체 왜곡 최소화, 그림자 및 조명 개선 등으로
고해상도 이미지를 생성할 수 있도록
주요 영역을 개선했으며,

몇 초 만에
1024x1024 해상도 이미지를
생성할 수 있게 되었습니다.

(출처 : Stability AI/Marvel Entertainment)

간단한 프롬프트 작성에도
고퀄리티 이미지를 더욱 빠르게
생성할 수 있기에
마블 스튜디오 등 글로벌 기업에서는
이 효율성에 주목해
이미 스테이블 디퓨전을 활용한
일러스트 생산 작업을 시작했습니다.

Stability AI에 따르면 SDXL 1.0은
영화, TV, 음악 및 교육용 비디오뿐만 아니라
디자인 및 산업용을 위한 초현실적인 창작물을
포함하여 생성형 AI 이미지의 창의적인
사용 사례의 도약이 될 것이라고 합니다.

앞으로의 활용성 면에서
더욱 기대되는 스테이블 디퓨전!

스테이블 디퓨전 제작에 관심이 생겼다면!
메가스터디IT아카데미에서 AI 디렉터가
직접 알려주는 스테이블 디퓨전 오프라인 수업을 추천드려요!