티스토리 뷰
안녕하세요. 일요일의 21입니다. 여러분! 오늘은 AI그림을 주제로 글을 써보려고 합니다. 위 그림은 스테이블 디퓨전(Stable Diffusion)으로 만든 AI그림입니다. 스테이블 디퓨전은 텍스트를 입력하면 해당 내용을 이미지로 만들어주는 생성형 AI인데요. 노을 진 바닷가에서 반려견과 산책하는 남자라고만 쳐도, 어지간한 일러스트레이터보다 감성 충만하게 뽑아냅니다. 위의 그림은 그런 텍스트 없이 생성했습니다. 참고로 챗GPT처럼 스테이블 디퓨전도 활용이 가능하지만, 큰 차이가 있다면 스테이블 디퓨전은 영어로 프롬프트를 입력해야 한다는 점입니다. 예를 들어 이런 식이죠.
a blonde haired woman with blue eyes and a yellow jacket on her shoulders, looking at the camera with a serious look on her face, a character portrait, sots art
1girl, bangs, blonde hair, blue eyes, blue ribbon, blue scrunchie, braid, hair between eyes, hair ornament, looking at viewer, short hair, solo
스테이블 디퓨전에 그림을 넣어서 텍스트를 추출하면 그 그림과 연관이 있을 거 같은 문장이나 태그를 추출해 줍니다. 챗GPT를 써보신 분들은 아실 테지만, 원본 이미지를 넣고 이걸 특정 그림체로 바꿔 달라고 하면 그렇게 바꿔줍니다.
물론 스테이블 디퓨전에서도 그림체를 바꾸는 건 가능합니다. 하지만 챗GPT처럼 이 그림을 지브리 스타일로 바꿔줘 같은 프롬프트만으로는 잘 안되거나, 작동하지 않을 때도 있어요. 영어만 됩니다.
실제로 가능한지 여부는 잘 모르겠습니다. 스테이블 디퓨전에 추가된 게 많기도 하고, 다 다르고, 사용하는 모델이나 설정에 따라 달라지기도 합니다.
게다가 스테이블 디퓨전에는 플러그인 같은 게 있어서 그림체 원하는 거 넣기만 하면 되는 거라서요.
스테이블 디퓨전에는 로라(LoRA)라는 게 있는데, 그냥 쉽게 말해서 그림체라고 보시면 됩니다. 특정 화풍이나 작가 스타일을 학습한 모델만 설치해서 사용할 수 있고, 원하는 스타일의 이미지를 더 정교하게 생성할 수 있어요. 특정 로라만 따로 설치해서 사용하는 경우도 많습니다.
로라 외에도 유용한 기능이 또 있습니다. 바로 포즈 제어용 플러그인인데요. 특정 포즈나 구도를 직접 설정하고 싶은 경우, 이 플러그인을 설치하면 이 캐릭터가 손을 이렇게 들었으면 좋겠는데? 같은 요구도 손쉽게 구현할 수 있습니다. 키프레임처럼 뼈대를 조정하거나 참조 이미지를 불러와서 그대로 포즈를 따라 하게 만드는 기능도 포함돼 있죠.
챗GPT와 달리 스테이블 디퓨전은 생성 방식에 딱히 제한이 없지만, 컴퓨터 사양에 따라 결과물 생성 속도에는 차이가 큽니다. 고사양 그래픽카드가 있다면 훨씬 빠르고 정교하게 만들 수 있고, 반대로 사양이 낮으면 그림 한 장 만드는 데 몇 분씩 걸리기도 합니다. 아니면 아예 생성조차 안 됩니다. 그림 크기에 따라 다르다고 보시면 됩니다.
이 그림 두 개도 스테이블 디퓨전으로 만들었고, 원본은 맨 위의 그림입니다. 그냥 그림만 넣고 이미지 돌렸는데, 저게 나왔습니다. 특정 프롬프트는 없습니다. 그래서 그림이 비슷한데, 모델과 로라만 다릅니다. 즉, 같은 원본 이미지라도 어떤 모델을 쓰느냐, 어떤 로라를 적용하느냐에 따라 결과물이 완전히 달라질 수 있다는 겁니다. 심지어 프롬프트 없이 이미지 하나만 넣고 돌렸을 뿐인데도, 이렇게 분위기나 색감, 묘사 방식이 달라지는 걸 보면, 스테이블 디퓨전이 정말 놀랍다는 생각이 듭니다. 위의 그림 포함해서 만드는 데 걸린 시간은 1분도 안 됩니다.
위의 그림들은 스테이블 디퓨전으로 생성한 그림을 챗GPT로 변환해 본 겁니다. 챗GPT는 생성 방식이 간편하긴 하지만, 제한이 있습니다. 게다가 챗GPT로 만든 이미지들은 확대하면 특정 픽셀들이 보입니다. 스테이블 디퓨전은 그런 게 없습니다. 다만 스테이블 디퓨전은 한두 번 만져봐서는 잘 안되는 경우도 많습니다. 왜 내가 돌리면 이렇게 안 나오지? 싶은 분들 많을 텐데요.
그건 설정값, 로라 조합, 프롬프트, 해상도, 시드, 샘플러, CFG 값 등 조합 요소가 너무 많기 때문이에요. 딱 하나만 잘못 건드려도 결과가 완전히 달라지거든요. 저도 시행착오 많이 겪었습니다. 그러니까 초반에 결과물이 원하는 대로 안 나온다고 해서 바로 포기하지 마세요. 프롬프트를 짧게 줄였다가 늘려보기도 하고, 다른 로라로 교체해 보기도 하고, 이미지 투입 방식도 바꿔보세요. 그러다 보면 어느 순간 내가 원하는 스타일과 정확히 맞아떨어지는 그림이 나옵니다. 다음 글에서는 제가 실제로 사용한 프롬프트와 추천하는 로라나 모델 몇 가지도 소개해 볼게요. 위의 이미지는 그동안 제가 저장해 둔 로라들 중 일부로 미리보기 이미지는 따로 지정해서 넣은 거라 실제로 파일을 받으시면 기본적으로 그림은 없습니다. 아래 이미지들은 챗GPT로 변환한 이미지들입니다.
스테이블 디퓨전은 주로 텍스트 프롬프트를 기반으로 작업을 진행해야 해서 바로 실행하기에는 너무 복잡하고 번거롭습니다. 제대로 활용하려면 어느 정도의 사전 지식과 학습이 필요하죠. 그래서 보다 효율적으로 작업을 진행하기 위해, 이번에는 챗GPT를 활용해 변환 작업을 진행했습니다. 챗GPT는 복잡한 프롬프트가 필요 없습니다. 원본 그림을 3장 올리고 저 등장인물을 추가해달라고 요청했습니다.
이 등장인물이 카메라로 촬영하는 모습, 전면, 카메라는...
이것도 챗GPT로 만들었습니다. 스테이블 디퓨전으로 하려고 했다면, 일단 저는 못합니다. 프롬프트 간단하지 않습니까? 솔직히 프롬프트도 개떡같이 말해도 찰떡같이 알아듣습니다. 물론 저런 이미지를 만들기 위해서 카메라 이미지도 올렸고, 대화를 많이 나누기는 했습니다. 그래도 너무 편합니다. 애니메이션 느낌을 내고 싶어서 90년대 애니메이션 감성을 요청했고, 알아서 예시를 선택하게도 해주더군요.
챗GPT. 20달러 요금제 결제했습니다. 부가세 2달러로 22달러 지불했습니다. 많은 사람들이 챗GPT를 괴롭혀 분석을 시키고 이미지를 생성합니다. 저도 거기에 동참했습니다. 저야 사용 용도는 블로그에 씁니다. 솔직히 블로그 아니면 쓸 일이 없습니다. 지금 하는 일 중에 블로그 관리도 있어서 그간 무료로 쓰고 있었는데, 최근에 이미지 생성 및 변화로 유료 가입자가 100만 명 증가했다는 걸 보고 저도 유료 요금제로 변경했습니다.
어떻게 보면 투자입니다. 챗GPT뿐만 아니라, AI가 실생활이나 직종에 널리 사용되고 있습니다. 다이소에서는 사람이 아닌 AI 모델을 이용하여 광고에 쓰면서 비용을 줄이고 있습니다. 뭐 다이소뿐만 아니라 다른 곳에서도 AI 기술을 활용한 광고를 도입하면서 비용도 줄이고 시간도 아끼고 있습니다. 저는 이미지 생성 및 변화에도 관심이 있었지만, 제가 관심 있던 것은 문장력이나 분석력이었습니다. 무료로 제한적으로 썼을 때도 분석력이 상당히 놀라웠는데 유료 요금제면 더 좋을 거 같아서 결제했습니다.
특히 제가 찍은 사진을 블로그에 올릴 때 AI가 분석한 내용을 추가하면 좋겠더라고요. 믈론 이미지 생성 때문에 관심이 증폭된 것도 맞아요. 너도나도 SNS에 이미지 생성에 변화하니까 알 수밖에 없겠더라고요. 인스타그램은 삭제했는데 스레드는 여전히 하고 있어요. 인스타그램이나 스레드는 사진 때문에 시작했는데 AI로 이미지 만드는 게 신기하네요. 노벨AI나 스테이블 디퓨전도 있긴 했지만, 아무래도 접근성은 챗GPT가 높죠.
스테이블 디퓨전은 설치해야 하고, 프롬프트가 복잡하죠. 챗GPT 프롬프트도 깊게 파고들면 복잡하지만, 대화형 AI라서 자기가 프롬프트 예시들도 알려주고 해서 그런 점에서 매우 편하죠. 생성 속도도 상당히 빨라 괜찮은 편이고요. 물론 생성 속도나 다양한 이미지는 스테이블 디퓨전이 더 나은 거 같고, 색감도 스테이블 디퓨전이 저는 낫더라고요. 물론 둘 다 어떻게 활용하느냐에 따라서 박빙이지 않을까 싶습니다. 일단 저는 편한 것은 챗GPT입니다. 복잡한 프롬프트 없이 원본 이미지 3장을 주고 섞어 달라고 해도 되고요.
스테이블 디퓨전이었으면 잘라 붙이든 마스킹해서 하든 해야 하는데 쉽지 않아요. 여하튼 스레드에서 미드저니가 새로 하나 뭐 나왔다고 해서 봤는데 정말 놀랍더라고요. 실제 사진인 줄 알았거든요. 일단 저는 구별 못 하겠습니다. 솔직히 그전에도 구별이 어렵거나 못할 정도이긴 했는데 이 정도는 아니었던 거 같거든요. 보면서 얼마나 발전할지 궁금하고 기대도 되었지만, 좀 무섭긴 했습니다.
프롬프트 한 줄, 챗GPT 한 마디. 그리고 이제는 원하는 이미지를 만들어주는 시대. 그러니까, 어렵다고 겁먹지 마세요. 그냥 대화하세요. 찰떡같이 알아듣는 AI랑요. AI는 우리의 일상을 천천히, 그러나 확실하게 파고들고 있습니다. 처음엔 그냥 재미로 해보던 이미지 생성이었고, 단순히 그림 하나 뽑아볼까? 했던 것이 이제는 업무 도구가 되고, 콘텐츠 제작의 중심이 되어버렸습니다. 스테이블 디퓨전이든 챗GPT든, 결국 중요한 건 도구를 어떻게 활용하느냐입니다. 정교한 프롬프트와 복잡한 설정을 통해 완성도 높은 이미지를 추구할 수도 있고, 간편한 요청으로 빠르게 작업물을 얻을 수도 있죠. 둘 다 장단점이 분명하지만, 한 가지는 확실합니다. 이제 더는 AI가 만든 이미지인지 아닌지 구별하기가 너무 어렵다는 겁니다.
'일상다반사' 카테고리의 다른 글
[이모저모] 카메라 니콘 ZF를 고른 이유, 그리고 그것으로 본 세상 (10) | 2025.04.23 |
---|---|
[이모저모] 카메라 니콘 ZF, 예뻐서 샀고 예뻐서 쓴다 (24) | 2025.04.22 |
[이모저모] 카메라, 사진 못 찍어도 괜찮은 이유는 색감 예쁜 니콘 ZF, 대만족 (10) | 2025.04.16 |
[이모저모] 맞구독한 블로그, 너도 안 보고 나도 안 봐 (12) | 2025.04.15 |
[이모저모] 카메라, 니콘 ZF로 기록한 감성적인 전시회 사진들 (2) | 2025.04.15 |
- 단톡방
- 방문자 수
- 이모저모
- 마우스
- 회사
- 블로그
- 수입
- GTA FIVEM
- 카톡
- 댓글
- AI그림
- Ai
- 블로그 수입
- 웹 폰트
- 돈
- 네이버
- 글씨체
- 통계
- 카카오톡
- 티스토리
- 게임
- 방문자
- 글쓰기
- 블로그로 돈 벌기
- 챗gpt
- 블로그 방문자
- 애드고시
- 구독
- 검색
- 블로그 방문자 늘리기
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- Total
- Today
- Yesterday