왜 비즈니스들은 지금 자신만의 챗봇을 만들어야 하는가?
2025년 06월 03일 작성TL;DR
- 피드백 루프가 없는 GenAI 는 반쪽짜리이다.
- 피드백 루프를 가진 비즈니스는 좋은 데이터 쌓기가 더 가속화된다.
- 피드백 루프를 먼저 설계하고, 빨리 출시하자.
시작하며
최근 매니저가 GenAI 챗봇에 대한 인사이트를 공유해준 적이 있는데 크게 공감하는 바로, 현재의 개인 프로젝트1에 적용하는 시도를 하면서 해당 관점에 더욱 깊게 공감하게 되었다.
이 인사이트를 링크드인에 올려두었지만2 링크드인 특성상 길게 쓰기 어려워서 블로그에다 약간 더 디테일하게 적어본다.
GenAI Flywheel
해당 이미지는 위에서 언급한 인사이트를 내가 플라이휠 형태로 그려본 것이다.
위의 내용은 전체 GenAI를 관통하는 관점이라고 생각하기 때문에 꼭 챗봇일 필요는 없지만, 챗봇 형태가 가장 공감하기 쉽기 때문에(챗GPT 덕분) 해당 형태의 UX를 전제로 설명한다.
플라이휠3 작성 글에서 말했듯이 플라이휠은 항상 우측의 목표
에서 시작하기 마련이고, 고객경험의 향상은 실패하지 않고 쓸 수 있는 목표이다.
네이버 쇼핑에 챗봇을 추가한다는 예를 들어서 생각해보자.
기존 고객은 키워드와 카테고리라는 제한적인 틀 안에서 상품을 검색할 수 있었다.
하지만 우리는 네이버 쇼핑에 기본적인 검색 기능이 툴로 제공되는 에이전트 챗봇을 런칭함으로써 고객의 경험을 향상시킨다. (Customer Experience)
이미 챗GPT를 통해 GenAI에 익숙해져 있는 고객들은, 여름에 팔뚝살을 잘 가려줄 수 있는 수영복
같은 식으로, 좀 더 다양한 형태의 쿼리를 작성하게 된다. (Detailed Preference)
물론 뒤쪽에서는 원래의 키워드, 카테고리 기반의 검색 API가 돌고 있을 것이다.
하지만 그 검색 키워드가 고객의 핵심 쿼리인 여름
, 팔뚝살
, 상체 커버
, 수영복
같은 형태로 변경되면서, 사용자가 직접 키워드로 검색하는 것보다 더 적절한 검색 결과가 보여질 것으로 기대할 수 있다.
이렇게 고객이 챗봇을 통해 상품을 클릭하고, 구매까지 했다면 우리는 고객과 우리가 팔고 있는 상품에 대해서 새로운 정보를 얻게 된다.
- 고객 측면에서는
팔뚝살을 노출하는 것을 꺼려하는 것으로 보아 상체를 많이 커버해주는 옷(수영복이 아니더라도)들을 추천해주는 것이 좋다
는 정보를 얻을 수 있다. - 상품 측면에서는 상품의 상세페이지에 적혀있든 적혀있지 않든
해당 상품이 상체(특히 팔)를 커버하는 능력이 좋다
는 정보도 파악할 수 있다.
이런 정보들은 기존까지는 알 수 없었던 숨겨진(Latent Information) 정보이다.
이러한 정보를 주기적으로 고객의 프로필과 상품의 정보에 반영하고, 이를 검색 API 호출 시 파라미터 생성에 활용할 수 있게 해주면 검색 결과의 품질을 더욱 높일 수 있을 것이다. (Personalized Search)
고객은 자신의 선호가 검색결과에 반영된다는 것을 인지하는 순간 더욱 자세한 정보를 입력하게 된다.(Customer Experience leads to Detailed Preference)
그리고 한번 만들어둔 선순환 루프는 계속 돌아가면서 고객의 선호도를 더욱 잘 이해하고, 더욱 정확한 검색 결과를 제공할 수 있게 된다. (Personalized Search leads to Customer Experience)
이것이 바로 위 플라이휠에서 말하고자 하는 바이다.
피드백 루프가 가장 중요
가장 중요하게 생각해야 할 것은 챗봇이 고객의 사용을 많이 할수록 사용자의 경험을 바탕으로 스스로 개선되는 피드백 루프이다.
이 루프가 없는 챗봇은 그냥 하나의 기능일 뿐이다. 그리고 이러한 챗봇은 원래 목표인 사용자 경험을 거의 개선하지 못한다.
우리나라에서 가장 유명한 쇼핑사이트 중 하나인 네이버 쇼핑을 예로 들자. (쿠팡으로 해도 전혀 다를게 없다)
네이버 쇼핑창에 위에서 말한 디테일한 검색어를 입력하는 사람은 거의 없다. 심지어 네이버도 그런 것을 원하지 않는다.
고객도 자연어로 된 검색어가 처리되지 않는다는 것을 경험적으로 알고 있고, 네이버도 실제로 그런 검색어를 처리하지 못한다.
챗봇만 달아둔다고 이것이 극적으로 해결되지 않는다. 처음 자연어 검색 기능이 추가되면 사용자들이 다양한 쿼리를 시도해보겠지만, 결국 되는 것과 안 되는 것을 경험적으로 알게 된다.
따라서 장기적으로 우리가 챗봇을 통해 얻을 수 있는 고객의 디테일한 정보는 챗봇이 처리할 수 있는 수준에 수렴하게 된다.
따라서 챗봇의 성능이 고객의 입력이 많아질수록 같이 향상되지 않으면 그 기능은 RoI 가 손해에 수렴하는 평범한 기능 A 가 된다.
사례: ChatGPT의 이미지 생성 기능
지브리 스타일 대란이 일어나기 전에도 챗GPT는 이미지를 생성할 수 있었다.
그러나 챗GPT로 이미지를 만들어서 뭔가를 해보려는 생각을 하는 사람은 극소수였다.
그런데 몇 달 전의 기능 업데이트 후 지브리 스튜디오에서 직접 그린 수준의 이미지를 생성할 수 있다는 사실을 알게 되자 사람들은, 원래라면 서비스에 업로드하지 않았을, 대량의 개인적인 사진(이자 학습데이터)들을 업로드하기 시작했다.
이미지 생성 능력이 향상되기 전에는 개인 사진을 거의 업로드하지 않았지만 품질이 어느 정도 수준에 도달하자, 사용자들은 자발적으로 대량의 개인 이미지를 기여하기 시작한 것이다.
그리고 다양한 시도들을 통해 해당 기능이 어디까지 가능한지를 빠르게 찾아냈고 결국 해당 기능의 수렴 정도에 맞춰서 이미지를 생성하게 되었다.
아직 consistency 문제가 있다거나, 디테일한 오브젝트들을 텍스트로 잘 이해하지 못한다거나 한계가 알려져 있지만, 위와 같이 기존에는 불가능하다고 알려져있기 때문에 시도조차 하지 않았던 방식으로 다양한 인풋들을 주고 있다.
요는 챗봇이 세부적인 요구사항을 이해하는 것처럼 보이기만 해도 사용자들은 기꺼이 세부적인 선호도를 공유한다는 점이다. 그리고 장기적으로 사용자가 자발적으로 공유하는 세부사항의 수준은 시스템의 실제 처리가능 수준과 일치할 것이다.
일단 챗봇을 달아보자
피드백 루프를 완전하게 만드는 것보다 더 중요한 것은 일단 챗봇을 런칭하는 것이다. (루프가 완전하지 않더라도 런칭해야 한다는 것이지 없는 상태에서 런칭하라는 것은 아니다.)
전통적인 분석 방법들은 사용자 행동에 대한 간접적인 추정만을 제공한다. 로그 분석, 클릭 추적, 구매 기록 등은 모두 사용자가 무엇을 했는지는 알려주지만 왜 그런 행동을 했는지는 알기 어렵다.
반면 챗봇은 사용자의 언어로 질문을 하고 직접적인 답변을 받을 수 있게 해준다. 사용자가 왜 검색하는지, 무엇을 가치 있게 여기는지, 어떻게 결정을 내리는지에 대한 인사이트를 얻을 수 있다. 이는 기존 방법으로는 추출하기 어려운 인사이트다.
가장 간단한 루프를 통해서 고객에 대해서 하나를 더 알고 그 하나가 기능에 반영되게 하는 순간, 다른 서비스들보다 그 하나만큼 더 앞서나가게 된다. 그리고 그 시장을 선점하는 것이 중요하다는 것은 위에서 말한 챗GPT 사례로 증명될 것이다.
구글의 Imagen이 이미지 생성능력이 훨씬 뛰어나지만 구글은 챗GPT가 얻은 만큼의 개인 이미지 데이터를 얻기 어려울 것이다. 이러한 차이는 시장을 선점하는 것, 그리고 GenAI 서비스로서 가지고 있던 경쟁우위가 영향을 미쳤을 것이다.
하나의 루프를 통해 GenAI 서비스로서 각인되는 것과 그렇지 않은 것의 차이가 여기서 온다고 볼 수 있다.
사용자 경험을 향상시키고 싶은 곳이 챗봇이 있어야 할 곳
챗봇을 아무데나 막 배치해두고 챗봇 서비스라고 하는 경우를 종종 본다. 없는 것보다는 낫다고 생각할 수 있지만, 사용자들도 그러한 챗봇에 의미 있는 데이터를 제공하지 않고, 애초에 데이터를 쌓는지도 의문이며, 쌓은 데이터를 가지고 뭔가 하려고 하는지도 의문이다.
그럼 어디에 챗봇을 배치해야 할까?
이 문제에 대한 답을 내고 싶다면 내가 고객에게서 무엇을 더 알고 싶은지를 먼저 결정해야 한다. 그리고 이 질문은 피드백 루프와도 연결이 된다. 즉, 내가 고객에게 어떤 경험을 더 좋게 만들고 싶은지를 결정해야 피드백 루프와 챗봇의 위치가 결정된다.
빨리 출시하고, 데이터 파이프라인을 먼저 설계하라
GenAI 덕분에 90%의 사용성에 매우 빠르게 도달하는 것이 가능하다. 하지만 GenAI이므로 적절한 컨텍스트와 데이터 파이프라인이 없으면 나머지 10%를 채울 수 없다. 결국 저 빈 10%는 운영 경험과 실제 사용자 데이터를 통해서만 채울 수 있는데, 이는 (특히 엔터프라이즈에서) 쉽게 간과되는 부분이다.
많은 비즈니스들이 95%나 100%에서 출시할 수 있을 때까지 주저하지만, 내가 보는 챗봇의 경우 런칭 속도가 중요하다.
챗봇은 출시 속도가 빠르면 빠를수록 더 빠르게 피드백 루프를 만들 수 있고, 그 피드백 루프는 더 빠르게 챗봇을 개선할 수 있게 해주기 때문이다.
입력을 수집하고, 정제하고, 시스템에 다시 피드백하는 데이터 파이프라인을 구축한 챗봇은, 사용자 데이터를 통해 시간이 지날수록 강화된다. 그리고 사용자들은 지능적이고 반응성이 좋은 시스템에 자연스럽게 더 많은 정보를 제공한다.
여기서 중요한 것은 챗봇이 단순한 인터페이스가 아니라는 점이다. 풍부한 사용자 인사이트를 수집하는 도구이자 지속적인 제품 진화를 위한 엔진이다.
결국 원하는 사용자 데이터를 명확히 정의하고, 그 데이터를 제품 인텔리전스로 전환하는 구조를 구축하고, 가장 중요한 것은 가능한 한 빨리 챗봇을 런칭하는 것이 제품을 개선하는 행위와 일치한다.
마치며
어떤 도메인이든 현재 형태의 GenAI가 더욱 확산될수록 컨텍스트가 더욱 중요해진다.
컨텍스트는 비즈니스에서 쌓는 데이터이며, 이 데이터가 다른 비즈니스들과 얼마나 차별화되는지가 점점 더 중요해질 것이다.
따라서 데이터 차별성만이 비즈니스의 존재 이유를 만드는 세상이 올 것이며, 데이터 싸움은 의미 있는 데이터를 하루라도 더 먼저 쌓기 시작하는 쪽이 이기지 않을까 예상한다.
어쩌면 챗봇이라는 것이 모든 제품의 단일화된 인터페이스가 될 수 있다. 물론 향후에는 음성이나 모션이 될 수도 있지만, 인풋의 모달리티만 달라질 뿐 뒷부분은 현재 챗봇과 동일할 것이다.
따라서 오늘 배포하는 챗봇이 내일 당신의 비즈니스를 정의하는 경쟁 우위가 될 수 있다.