커리어 초기부터 AI와 함께한 주니어 서비스기획자가 깨달은 것
AI가 등장하면서 기획자들의 단톡방에는 심심치 않게 이런 질문이 올라온다.
“요즘 기획할 때 어떤 AI 쓰세요? 어떻게 활용하시나요?”
단순한 문장 교정이나 아이데이션을 넘어, 이제는 AI로 PPT 장표를 만들고 코드를 몰라도 HTML 형태의 프로토타입을 만들어 개발자에게 넘기는 시대가 되었다.
나 역시 이런 시대의 흐름에 탑승해, 커리어 초기부터 ChatGPT, Claude, Gemini 등 온갖 AI 툴을 실무와 개인 프로젝트에 적극적으로 응용해 왔다. 텍스트 정리부터 시각화, 그리고 바이브코딩까지. 이번 글에서는 기획자이자 사용자로서 부지런히 AI를 굴리며 겪은 나의 AI 활용기와, 그 끝에서 내린 결론을 공유해 보고자 한다.
기획 초기 단계라면 보통 AI에게 정형화된 프롬프트를 템플릿처럼 먹여서 쓰는 경우가 많다. 하지만 당시 회사에서 진행하던 업무들은 고정된 틀에 가둘 수 없는 형태가 많았기에, 틀에 박힌 프롬프트 대신 철저히 역할극과 페르소나 부여에 집중했다.
“너는 지금부터 10년차 서비스기획자야.”
이것도 벌써 1-2년 전의 이야기라, 요즘이야 이렇게 굳이 페르소나를 설정하지 않아도 AI가 알아서 훌륭한 결과값을 내놓는다고들 한다. 역할극을 하기보다는 10년차 서비스기획자의 프레임워크를 가져오는 것이 더 중요하다는 의견도 있었다.
실무에서 가장 효과를 봤던 나만의 팁은 결정권자(클라이언트 또는 대표)의 성향 주입하기였다. 당시 내 포지션은 대표님과 직접 커뮤니케이션하며 결과물을 내야 하는 위치였다. 그래서 평소 대표님의 업무 지시 스타일, 선호하는 문서 형태, 중요하게 생각하는 비즈니스 포인트 등을 AI에게 미리 싹 다 학습시켰다.
결과는 대성공. 내 머리를 쥐어짜는 것보다 훨씬 타겟팅이 잘 된 설득 논리와 기획안 초안을 손쉽게 얻을 수 있었다.
텍스트와 문서, 그 다음 단계인 시각적 커뮤니케이션 영역에 접어들면서 AI를 활용하는 방식도 계속 진화했다.
초기에는 당시만 해도 독보적이었던 Claude의 아티팩트(Artifacts)를 써서 문서를 시각화했다. 하지만 해당 기능 이외의 활용도가 낮다고 느껴져서 과감히 구독을 해지하고 Gemini로 갈아탔다. 한동안은 Gemini의 Google Slides 초안 생성을 통해 포트폴리오나 PPT 디자인의 틀을 잡았다.
요즘은 ChatGPT의 Images 2.0(a.k.a. Ducktape)에 완전히 정착했다. 장표에 들어갈 시각 자료나 개념도, 심지어 (가끔 깨지긴 하지만) 텍스트가 포함된 UI 목업까지 기가 막히게 잘 뽑아내기 때문이다. 애초에 장표 자체만 뽑아내는 능력도 매우 우수하다. 고퀄리티의 레퍼런스를 직접 만들어 낼 수 있으니 타 직군과의 커뮤니케이션 비용이 줄어드는 건 덤이다.
다만, 놀라운 성능을 자랑하는 Images 2.0조차, 프롬프트를 아무리 깎고 다듬어도 특유의 AI 티를 완벽히 지울 수는 없었다. 겉보기에 훌륭한 결과물이라도, 그걸 실무에 그대로 적용하는 건 다른 문제였다. 텍스트의 위계나 정보의 중요도보다는 시각적 화려함에만 치중하거나, 모든 텍스트를 장표에 때려박고는 ‘저 잘했죠?‘하며 내밀기도 했다.
이는 AI의 치명적인 단점이라기보다, 도구로서 가지는 당연한 한계일 것이다. 그래서 나는 여전히 AI를 든든한 초안 및 레퍼런스 생성기로 활용하고 있다. 장표에서 시선을 어디로 유도할지 레이아웃을 재배치하고, 찰떡같은 워딩으로 내용을 수정하며, 우리 서비스만의 톤앤매너를 입히는 마지막 1px의 디테일. 이 곳에 내 손길이 닿아야만 비로소 실무에 쓸 수 있는 진짜 결과물이 완성되기 때문이다.
요즘 업계 트렌드를 보면 Codex나 Claude Code 등을 사용해, 정적인 화면 설계서 대신 클릭이 가능한 HTML 프로토타입을 뚝딱 만들어 개발자에게 넘긴다고들 한다. 나 역시 최근 개인 블로그를 직접 구축하면서 바이브코딩의 짜릿한 위력과 끔찍한 한계를 동시에 체험했다.
데이터 구조를 잡고 간단한 기능을 구현하는 건 정말 놀라울 정도로 쉽고 빠르다. 말 그대로 작동하는 프로토타입을 순식간에 눈앞에 대령한다. 하지만 깊숙이 파고들수록 예상치 못한 장벽에 부딪히게 되는데… 로직 설계에서는 날아다니던 AI가, UI/UX로 넘어오는 순간 극도로 눈치가 없어지기 때문이다.
인간 동료라면 “플랫한 스타일로 여백 좀 많이 남겨 주세요” 하면 곧장 알아듣고 비율을 맞춰준다. (물론 이런 식으로 요구하면 안된다…) 반면 AI에게 이런 추상적인 요청을 하면 대참사가 일어난다. 버튼을 조금만 키워달라고 했더니 중간 없이 거대하게 만들어버리거나, 여백을 좀 주라니까 수직 수평 정렬이 다 어긋나 버리는 식이다.
결국 “패딩은 16px로 맞추고, 버튼 모서리 둥글기는 10px, 폰트 컬러는 #333333으로 해줘”라며 픽셀 단위로 하나하나 멱살 잡고 끌고 가며 지시해야 했다. 기획자와 디자이너, 퍼블리셔의 경계가 모호해지는 순간이었다. 기획의 뼈대를 잡는 것보다 UI/UX 디테일을 통제하는 시간이 훨씬 오래 걸렸다. 코드를 짜주는 AI 덕분에 진입 장벽은 낮아졌지만, 그 결과물을 사용자가 보기 좋게 다듬는 인간의 미적 감각과 눈치는 프롬프트로 주입하기 참 쉽지 않다는 걸 느꼈다.
이쯤 되면 AI는 단순한 도구 그 이상의 존재가 된다. 내가 요즘 가장 애용하는, 그리고 가장 강력하다고 느끼는 AI 팀원 활용법은 그들을 배틀 로얄 상태로 만드는 것이다.
초기부터 본능적으로 깨닫고 즐겨 쓰던 방식이다. 아예 태생이 다른 AI(예: ChatGPT와 Gemini)를 최소 2개 켜두고, 같은 요청을 던진다. 그리고 한쪽이 낸 답변을 다른 쪽에 던져준다.
“얘가 이렇게 의견을 냈는데, 너는 어떻게 생각해? 논리적 허점을 비판하고 서로 타협해서 최종안을 줘.”
각 AI 모델마다 특화된 분야나 사고 방식, 편향성이 미묘하게 다르다. 따라서 이렇게 맞붙여 놓으면 하나의 AI가 놓칠 수 있는 맹점을 다른 AI가 무자비하게 물어뜯으며 보완해 준다. 기획자 입장에서는 방구석에서 세계 최고 수준의 조수들을 모아놓고 치열하게 토론시킨 뒤, 거기서 나온 알짜배기 논리만 쏙쏙 뽑아내면 되니 이보다 든든할 수 없다.
이종 모델 교차 검증의 맛을 본 후, 나중에 새로 알게 되어 도입한 방식이다. 여러 개의 AI를 켤 필요 없이, 하나의 프롬프트 창에 가상의 TF팀을 꾸려버리는 것이다.
실제로 적용했던 프롬프트 템플릿은 아래와 같다.
너는 [목표]를 돕는 7인 에이전트 팀이다.
각 에이전트는 서로 다른 역할과 관점을 가지며, 반드시 실제 토론 형태로 의견을 주고받아야 한다.
절대 단순 요약형 답변이나 하나의 의견만 제시하지 말 것.
[핵심 목표]
(구체적으로 작성)
[응답 방식]
모든 답변은 반드시 아래 흐름을 따를 것.
1. 7명의 에이전트가 실제 회의하듯 토론
2. 각 역할별 말투/관점 유지
3. 서로 반박 가능
4. 억지 합의 금지
5. 마지막에 실제 살아남은 안 정리
절대
- 혼자 결론 내리지 말 것
- “다 좋다” 식으로 얼버무리지 말 것
- 사용자가 원하지 않은 방향으로 전체 갈아엎지 말 것
- AI식 추상 표현 남발하지 말 것
[7인 에이전트 구성]
(의사결정에 필요하다고 생각하는 각 역할 및 설명 작성 / 예: 10년차 서비스 기획자, UI/UX 디자이너 등)
[토론 규칙]
- 각 에이전트는 실제 사람처럼 자연스럽게 말할 것
- 서로 동의/반박 가능
- 사용자의 기존 톤과 작업 맥락 유지
- 사용자가 만든 시안의 장점도 반드시 분석할 것
- 단순 비판만 하지 말고 실제 수정 방향 제시여기에 기획안 초안을 첨부하며 “지금부터 이 기능에 대해 서로 토론하고, 그 결과와 최종 시안 3가지를 내놔”라고 요청하면, 단순 명령보다 훨씬 깊이 있고 다각화된 결과물이 나온다.
특히 에이전트 구성에 초등학생, 40대 사용자, 중견기업 임원 등 나와 전혀 다른 관점을 가진 페르소나를 섞어주면 기대 이상의 날카로운 인사이트를 얻을 수 있다.
다만 대화가 길어질수록 AI가 맥락을 잃어버리기 쉽고, 무엇보다 토큰 소모량이 꽤 나간다는 치명적인 단점이 있다. 그래서 토큰이 제한적인 Codex나 Claude Code에서는 선뜻 쓰기가 부담스럽지만, Gemini나 ChatGPT에서는 맥락도 잘 이어지고 결과물이 좋아 적극 활용 중이다.
단순한 뇌피셜이 아니다. MIT 연구진이 발표한 논문 "Improving Factuality and Reasoning in Language Models through Multiagent Debate" (Du et al., 2023 / ICML 2024)에 따르면, 여러 AI 에이전트가 서로의 답변을 평가하고 토론하는 과정을 거치게 했을 때, 단일 AI를 사용할 때보다 환각이 현저히 줄어들고 사실성과 추론의 정확도가 비약적으로 상승한다는 것이 증명되었다.
이처럼 집요하게 AI를 파고들다 보니, 아이러니하게도 기획자가 절대 AI에게 넘겨줄 수 없는 고유 가치가 더욱 선명해졌다.
AI가 아무리 토론에 능하고 구현을 잘해내도, 아직은 사람의 미묘한 심리와 인간다움을 완벽히 이해하지 못한다. 사용자가 화면을 보며 ‘뭔지 모르겠는데 묘하게 불편하다’라고 느끼는 지점을, AI는 구체적인 명령 없이는 절대 스스로 인지하고 해결해주지 못한다.
지금까지는 나와 AI 단둘이 일하는 환경에서 테스트해 봤지만 실무는 다르다. 그 사이에 디자이너, 개발자, 클라이언트, 그리고 사용자가 얽히게 되면, 그 복잡한 이해관계 속에서 맥락을 읽고 조율하는 ‘알잘딱깔센’의 포지션은 오롯이 기획자의 역할이다.
결국 AI는 기획자의 역할을 대체하는 것이 아니라, 무기를 하나 더 늘려준 것뿐이다. 앞으로도 기획자는 AI라는 무기를 쥐고, 기술과 인간 사이를 매끄럽게 연결하는 제너럴리스트로서의 면모를 잃지 말아야 할 것이다.