Cardnews Brief

채팅으로 하는 편집, 에이전트 시대의 콘텐츠 제작

2026-05-28 목요일 09:45:06AI 편집영상 생성에이전트오픈모델

영상 편집 툴의 방향이 달라지고 있습니다. 예전에는 타임라인에 영상을 올리고, 자르고, 붙이고, 자막을 넣는 작업이 중심이었습니다. 이제는 AI가 붙으면서 “무엇을 어떻게 바꿀지”를 말하거나 표시하면, 툴이 이미지와 영상, 디자인 요소를 한 번에 다루는 쪽으로 가고 있습니다. 제품 사진, 프로필 이미지, 홍보용 썸네일, 간단한 상세페이지처럼 사진관이나 전문 디자이너에게 맡기던 일의 일부도 AI가 가져오기 시작했습니다. 여권사진이나 법적·상업적 검수가 필요한 촬영까지 바로 대체된다고 보기는 어렵지만, “굳이 사진관까지 가지 않아도 되는 사진”의 범위는 넓어지고 있습니다.

CapCut의 변화가 이 흐름을 잘 보여줍니다. CapCut은 원래 대중적인 영상 편집 앱으로 알려져 있었지만, 최근에는 AI Design과 Design Studio 계열 기능을 앞세우며 이미지, 포스터, 광고, 제품 이미지, 소셜 콘텐츠 제작까지 영역을 넓히고 있습니다. 공식 설명 기준으로는 배경 제거, 컷아웃, 스마트 레이아웃, 브랜드 비주얼 생성 같은 기능을 지원합니다. 영상 편집 앱이 “영상만 편집하는 앱”에서 “콘텐츠 제작 캔버스”로 바뀌는 셈입니다.

이 변화에서 주인장이 흥미롭게 보는 부분은 진입장벽입니다. 좋은 레퍼런스가 있으면 비전공자도 훨씬 빠르게 결과물을 만들 수 있고, 레퍼런스가 없더라도 AI가 여러 초안을 먼저 제안해줄 수 있습니다. 예전에는 포토샵, 프리미어, 애프터이펙트 기본기를 익혀야 겨우 시작할 수 있던 작업이 이제는 “이런 느낌으로 만들어줘”, “이 부분만 바꿔줘”, “썸네일처럼 다시 구성해줘”에 가까워지고 있습니다. 유튜브 편집자라는 직업이 바로 사라진다는 뜻은 아닙니다. 손으로 모든 것을 만지는 사람과, AI 툴을 잘 지휘해서 결과물을 뽑는 사람 사이의 경계가 흐려지는 쪽에 가깝습니다. 편집 실력의 일부가 툴 조작 능력에서 레퍼런스를 고르고, 방향을 설명하고, 결과물을 판단하는 능력으로 옮겨가는 모습입니다.

Google도 비슷한 방향을 보고 있습니다. Gemini Omni는 Google DeepMind가 공개한 멀티모달 편집 모델로, 영상에서 출발해 자연어로 장면을 단계별로 바꾸는 것을 내세웁니다. Google의 공식 소개는 이전 편집을 이어받아 일관된 장면을 유지한다고 설명합니다. 영상 속 인물, 배경, 물체, 카메라 구도 같은 요소를 대화하듯 수정하는 방식입니다. 이미지 편집에서 하던 “이 부분만 바꿔줘”가 영상으로 넘어오는 장면입니다.

영상과 사진 편집에서 가장 어려운 부분은 여전히 일관성입니다. 한 장의 이미지를 그럴듯하게 만드는 것과, 같은 인물·같은 물체·같은 공간이 여러 프레임과 여러 장면에서 계속 같은 정체성을 유지하는 것은 다른 문제입니다. 공개된 Gemini Omni 예시들에서도 인상적인 장면은 있었지만, 주인장이 보기에는 일부 영상에서 일관성이 흔들리는 느낌도 있었습니다. AI 편집이 이미 놀라운 수준까지 온 것은 맞지만, 전문 편집자가 원하는 대로 처음부터 끝까지 통제된다고 말하려면 아직 더 봐야 할 부분이 있습니다.

이미지 쪽에서는 OpenAI의 GPT-Image-2가 강하게 언급되고 있습니다. 과거 개발자 커뮤니티에서 덕테이프라는 별명으로 불리던 계열의 이미지 모델이 있었고, 지금은 GPT-Image-2가 이미지 생성·편집 리더보드에서 매우 높은 평가를 받는 것으로 보입니다. 일부 보도에서는 Arena 계열 리더보드에서 큰 격차로 1위라는 언급도 나옵니다.

이 기술을 보면 조금 서늘한 생각도 듭니다. 주인장은 예전에 본 애니메이션 《건담 더블오》에서 가짜뉴스로 사람들을 선동하는 장면을 떠올렸습니다. 그 작품의 배경은 2300년대였는데, 그 정도 수준의 조작 영상과 선동 콘텐츠는 이제 300년 뒤의 이야기가 아닙니다. 의도와 소재만 있으면 지금도 상당히 그럴듯하게 만들 수 있습니다. AI 영상 편집이 대중화된다는 말은 창작 도구가 풀린다는 뜻이기도 하지만, 가짜뉴스 제작 비용이 낮아진다는 뜻이기도 합니다.

한 발 더 나아가면, 영상이나 이미지 분야에서도 오픈 모델 생태계는 중요합니다. 예를 들어 Qwen은 오픈 모델 생태계를 계속 밀어붙이고 있고, 알리바바 클라우드도 Qwen을 중심으로 에이전트 시대를 강조하고 있습니다. 주인장은 이런 오픈 모델 경쟁을 긍정적으로 봅니다. 여러 진영이 모델을 공개하고 활용 생태계를 넓히는 흐름 자체가 AI 발전에 도움이 되기 때문입니다.

물론 요즘 대형 오픈웨이트 모델들은 말이 좋아 오픈 모델이지, 실제로는 수백 GB에서 1TB급 VRAM이 필요한 경우가 나옵니다. 개인이 풀 모델을 로컬에서 돌리는 일은 아직 멀어 보입니다.

지금 Hermes에 어떤 두뇌를 끼울지 고르듯이, 언젠가는 로봇이나 개인 에이전트에도 모델을 갈아끼우는 시대가 올 수 있습니다. 오늘은 Qwen 계열 두뇌, 내일은 Gemini 계열 두뇌, 작업에 따라 GPT 계열 두뇌를 붙이는 식입니다. 하드웨어는 그대로인데 두뇌만 바뀌는 세계라면, AI 도구를 고르는 일이 지금의 앱 설치보다 훨씬 중요한 선택이 될지도 모릅니다.

AI는 이제 글을 잘 쓰는 챗봇 역할에만 머물지 않습니다. 이미지를 만들고, 영상을 고치고, 디자인을 제안하고, 코드를 쓰며, 여러 작업을 에이전트처럼 이어갑니다. 편집의 미래도 “툴을 잘 다루는 사람”에서 “AI에게 좋은 기준과 방향을 줄 수 있는 사람” 쪽으로 옮겨가고 있습니다. 채팅으로 하는 편집은 그 변화가 가장 눈에 잘 보이는 장면일지도 모르겠습니다.