AI와 함께 심리테스트 만들기: 형식도 없이 시작해서 알게 된 것들

Q-Fit에서 가장 처음 만든 심리테스트는 연애 스타일 테스트입니다. 시작은 단순했습니다. Gemini 3.0 Pro에게 "심리테스트 만들어줘"라고 했습니다. 형식도 없었고, 기준도 없었습니다. 그냥 던져본 거였는데, 결과물이 생각보다 볼만했습니다.

그런데 직접 해보니 문제가 있었다

직접 여러 번 테스트를 해봤습니다. 그런데 결과가 계속 같은 유형으로 나오는 겁니다. 결과 유형이 4개였는데, 하나가 50% 확률로 나왔습니다. 문항과 선택지는 그럴싸했지만, 내부 로직이 특정 결과로 편향되어 있었던 거죠.

일단 놔두고 나중에 고치자. 지금은 여러 콘텐츠를 만들어서 전체적인 방향을 확인하는 게 우선이었으니까.

사실 이게 사이드 프로젝트 특유의 사고방식이라고 생각합니다. 문제를 발견했는데도 일단 놔두고 계속 만드는 것. 회사 프로젝트였다면 당연히 먼저 잡았을 버그였겠지만, 사이드 프로젝트에선 "완성도"보다 "방향성 확인"이 먼저입니다. 편향 문제를 알면서도 계속 새 테스트를 만든 건, 솔직히 말하면 그 시점에선 전체가 돌아가는지 보는 게 더 중요했기 때문입니다. 세부를 완벽하게 다듬다가 전체를 완성 못 하는 것보다는, 일단 굴러가는 걸 보면서 방향을 잡는 게 낫다고 판단했습니다.

만들수록 쌓이는 불편함들

이후로 좀비 아포칼립스 생존 테스트, 퍼스널 컬러 테스트, 사이코패스 성향 테스트 등을 계속 추가했습니다. 그런데 테스트가 쌓일수록 눈에 거슬리는 게 생겼습니다. 테스트마다 문체가 달랐습니다. 어떤 테스트는 "당신은 ~한 편입니다"처럼 정중한 존댓말로, 어떤 테스트는 "너는 ~한 스타일이야"처럼 편한 반말투로 결과가 나왔습니다. 같은 서비스 안에서 어떤 테스트는 선생님 같고, 어떤 테스트는 친구 같은 느낌이었습니다. AI에게 매번 새롭게 요청하다 보니, 일관된 말투를 유지할 기준이 없었던 겁니다.

AI가 생성한 이미지도 마찬가지였습니다. 테스트 설정집을 주고 생성했는데도, 테스트마다 전혀 다른 스타일로 나왔습니다. 어떤 이미지는 애니메이션풍이고, 어떤 이미지는 수채화풍이고, 어떤 이미지는 사진 합성처럼 보였습니다. 한 서비스 안에 다른 세계관이 여러 개 공존하는 느낌이었습니다. 콘텐츠 하나하나는 그럴듯했지만, 묶어놓고 보면 어색했습니다.

그래도 그때는 크게 신경 쓰지 않았습니다. 회사 동료들에게 "이런 거 만들 수 있어요"를 보여주는 게 목적이었으니까요. 완성도보다 "일단 보여주기"가 먼저였습니다.

"네가 프론트를 할 줄 아니까 가능한 거 아니야?"

동료들에게 공유했더니, 팀원 한 분이 이렇게 물었습니다. "이건 네가 프론트를 할 줄 아니까 만들 수 있는 거 아니야? 나는 프론트를 모르는데, 내가 AI를 써도 이 정도가 나올 수 있을까?" 순간 멈칫했습니다. 아, 그렇게 보이는 거구나. AI가 다 만들어줬다고 생각했는데, 팀원 눈에는 내 프론트 실력이 있어서 가능한 결과물로 보였던 겁니다. 그게 오히려 자극이 됐습니다. 팀원이 그렇게 볼 정도면, 더 다듬으면 진짜 상품이 될 수 있겠다는 생각이 들었습니다. 본격적으로 만들어보자고 마음을 먹었습니다.

문서화: AI를 더 잘 쓰기 위해

본격적으로 개선을 시작하면서 AI가 작업하는 방식을 지켜봤습니다. 딱히 문서를 지정해주지 않으니 여러 폴더를 뒤적이면서 찾는 것 같았습니다. 불필요하게 토큰을 소비하고 있었던 거죠. 심지어 어떤 경우에는 이미 존재하는 테스트 파일을 찾지 못해서 비슷한 구조를 처음부터 다시 짜는 일도 있었습니다. AI가 헤매는 걸 직접 눈으로 보니까 문제가 분명해졌습니다. 내가 안내를 제대로 안 했기 때문이었습니다.

그래서 기존 테스트 목록과 프로젝트 디렉토리 구조를 정리한 문서를 만들었습니다. AI가 꼭 필요한 파일만 참조할 수 있도록. 어떤 테스트가 있는지, 파일들이 어디에 어떻게 배치되어 있는지를 한눈에 볼 수 있게 정리해뒀더니, AI가 불필요하게 탐색하는 일이 줄어들었습니다. 헤매지 않으니 같은 작업을 더 빠르게, 더 정확하게 처리했습니다.

퀄리티가 드라마틱하게 올라가진 않았습니다. 하지만 쿼터 제한에 걸리는 시간이 뒤로 밀렸습니다. 같은 작업량으로 더 오래 작업할 수 있게 된 거죠. 문서화가 AI의 능력을 높여준 건 아니었습니다. AI가 헤매지 않도록 길을 닦아준 거였습니다.

AI와 함께 일하면서 느낀 것

이 시기를 돌아보면, AI 덕분에 혼자서 여러 명이 할 일을 해낼 수 있었습니다. 저는 백엔드 개발자입니다. 프론트엔드도, 디자인도, 콘텐츠 기획도 전문 영역이 아닙니다. 예전이었다면 각 분야 사람들을 모아야 했을 일을 혼자 할 수 있었습니다. 몇 달이 걸렸을 공부를 건너뛰고, 하루 만에 돌아가는 웹사이트가 나온다는 것 자체가 놀라웠습니다.

지금도 가장 어려운 건 퀄리티 유지입니다. 테스트마다 일관성을 잡는 게 생각보다 훨씬 어렵고, 솔직히 아직도 완전히 해결하지 못했습니다. AI가 가이드라인을 무시하고 멋대로 짜는 코드, 말투가 흔들리는 콘텐츠, 스타일이 제각각인 이미지 — 이건 여전히 현재진행형 숙제입니다. 다른 개발자들은 이 문제를 어떻게 다루는지 공부가 필요하다고 느낍니다.

그런데 이게 해결되지 않은 숙제라는 사실 자체가, 오히려 사이드 프로젝트를 계속하게 만드는 이유가 되기도 합니다. 완벽하게 정리된 상태에서 유지만 하는 건 지루합니다. 아직 풀리지 않은 문제가 있고, 더 잘할 수 있다는 걸 알기 때문에 계속 돌아오게 됩니다. Q-Fit은 아직도 진행 중이고, 그 점이 저를 계속 붙잡아두고 있습니다.