표 4. 이미지 생성형 AI 모델 3가지

비교 기준 Midjourney DALL․E Stable Diffusion
접근성

디스코드 기반 프롬프트 입력

전문 하드웨어나 소프트웨어의 필요 없이 디스코드 서버에서 이용 가능

웹 기반 인터페이스 사용

영어 외 다양한 언어 이해 및 접근성, 활용도가 높음

컴퓨터에 설치 가능, 접근성이 가장 높음

오픈소스로 누구나 자신만의 이미지 생성기 생성 가능

확장성

확장 기능이 거의 없음

기존 이미지에 이미지를 추가할 수 있는 인페이팅 기능과 생성한 이미지를 확장할 수 있는 아웃페이팅 기능

LoRA, Checkpoint, ControlNet 등 확장성이 매우 높음

성능

이미지 비율, 해상도 조절 가능

예술적 표현이 강함

입력한 텍스트와의 일치도 약 70%, 사실적인 사진 표현이 약 80% 정도로 향상됨

ChatGPT 대화창 안에서 사용 가능

포즈 지정 및 세부 묘사 기능을 통해 생성되는 이미지 퀄리티가 높음

시각 예술 전문 분야에서 주로 활용

적용사례 임장한과 윤수진(2023), 박재민과 한재욱(2024) 이명주(2023), 이운영(2023) Dollens(2023), Liu(2024)