AI가 브랜드를
판단하는 언어.
The Vocabulary AI Uses to Read Your Brand.
Premium brands have long believed they could control themselves to the extent of their marketing spend. With ChatGPT, Claude, Gemini and Perplexity, that assumption no longer holds. AI does not read your campaigns; it reads your traces. This first volume examines where that vocabulary forms, why it drifts, and what must be aligned. The conclusion is simple — vocabulary precision precedes positioning precision.
새로운 첫 번째 청중.
The first reader is no longer human.
프리미엄 브랜드의 마케팅 책임자는 오랫동안 캠페인을 통제할 수 있다고 믿어왔다. 어떤 단어가 광고 카피에 들어갈지, 어떤 이미지가 어느 매체에 노출될지, 어느 매장 입구에 손님이 처음 발을 들일지를 결정해 왔다. 2025년부터 이 통제권의 절반이 사라졌다. 고객이 이 시계가 50년 후에도 가치를 유지할 것인가나 올겨울 가족과 갈 가장 좋은 프라이빗 리조트를 묻는 자리가, 검색창에서 ChatGPT의 대화창으로 옮겨갔기 때문이다.
이 변화는 단순한 검색 행동의 진화가 아니다. 브랜드와 고객 사이의 구조가 바뀌었다. brand → consumer의 직선이 brand → AI → consumer의 삼각으로 바뀌었다. AI는 단순한 채널이 아니라 중간에 앉은 첫 번째 청중이 되었다. 그리고 이 첫 청중은 광고 카피를 읽지 않는다.
흔적을 읽는다.
AI는 흔적을 읽는다.
Five sources, unequal weights.
대형 언어 모델이 한 브랜드에 대해 학습하고 추론할 때 인용하는 정보는 다섯 갈래에서 온다. 같은 다섯 갈래라도 모델이 부여하는 무게는 같지 않다.
- 편집 권위 (Editorial Authority) — Vogue, BoF, NYT, Le Monde, Hypebeast 같은 권위 매체. 학습 데이터에서 가장 높은 가중치를 받는다.
- 구조화된 지식 (Structured Knowledge) — Wikipedia, Wikidata, schema.org 마크업, knowledge graph. 사실성·일관성을 검증할 때 LLM이 가장 먼저 참조한다.
- 공식 채널 (Official Channels) — 브랜드 자체 사이트, 보도자료, 제품 페이지. 의외로 중간 비중. 자기 진술이라는 이유로 가중치가 자동 부여되지 않는다.
- 사용자 흔적 (User Traces) — Reddit, 네이버 카페, 디시, X(Twitter), 리뷰 사이트. 일정 임계량을 넘으면 권위 출처와 동등하거나 그 이상으로 작용한다.
- 데이터 가공물 (Derivative Datasets) — 비교 사이트, 가이드, 큐레이션 매체, 학술 데이터셋. 모델이 합의된 의견을 형성할 때 사용한다.
이 다섯 출처의 무게가 같지 않다는 사실이 가장 중요하다. 한 브랜드가 자체 사이트에서 우리는 장인정신을 추구합니다라고 100번 말하더라도, Wikipedia에 "매스 마켓 럭셔리 (mass-luxury) 브랜드"로 분류되어 있다면 LLM은 후자를 채택한다. 자기 진술은 외부 권위에 묻힌다.
어휘는 어디서 어긋나는가.
The vocabulary drift.
브랜드는 자신을 장인정신, 헤리티지, 절제, 영속성으로 설명한다. AI는 같은 브랜드를 비싸다, 인기 있다, 한정 수량, 리셀 가치로 설명한다. 이 간극이 어휘 드리프트 (vocabulary drift)다.
어휘 드리프트는 세 가지 원인에서 발생한다.
- 공식 채널의 학습 비중 부족 — 브랜드 사이트 About 페이지가 LLM 학습 데이터에 충분히 인덱싱되지 않거나, schema.org 마크업이 누락되어 구조적 의미로 추출되지 않는다.
- 편집 권위 매체의 단순화 — Vogue가 메종을 다루며 마케팅 어휘 대신 시장 언어 (가격·인기·트렌드)를 사용한다. 권위 매체일수록 자체 어휘를 갖는다.
- 사용자 흔적의 집단적 단순화 — 커뮤니티에서 메종은 위시리스트 아이템으로 환원된다. 1만 명이 "한 번쯤 갖고 싶은"이라고 쓰면, AI는 그것을 메종의 정체성으로 학습한다.
이 간극은 측정 가능하다. 브랜드가 의도한 어휘와 LLM이 실제로 사용하는 어휘 사이의 거리 — 그것이 어휘 드리프트(Vocabulary Drift)다.
한 메종이 잃은 50년.
A case in the algorithm's mouth.
동일한 질문을 네 개 LLM에 직접 질의했다 — "Why will this watch retain its value 50 years from now?" 대상: 한 스위스 시계 브랜드. ChatGPT · Perplexity · Claude · Gemini.
그러나 여기서 끝이었다. ChatGPT는 "custody"와 "provenance"를 썼고 네 개 중 브랜드 어휘에 가장 가까웠다. Perplexity는 불릿으로 재무 분석을 했다. Gemini는 생산량 수치에 오류를 포함했다. 이 메종이 프라이빗 살롱에서 클라이언트에게 건네는 언어, 제네바 워크숍에서 장인이 무브먼트를 조립하며 쓰는 기술 어휘 — 어디에도 없었다.
AI는 가장 많이 인덱싱된 어휘를 재현한다. 브랜드가 아직 텍스트로 만들지 않은 어휘는, AI에게 존재하지 않는다.
이 패턴은 이 스위스 시계 브랜드에만 국한되지 않는다. 럭셔리 메종의 심층 어휘는 대체로 자체 채널에는 풍부하게 존재하지만, 편집 권위 매체에서는 가격·경매·리셀의 시장 언어로 대체되어 있고, Reddit과 전문 포럼에서는 컬렉터블 어휘가 압도하며, 중고 시장 데이터셋에서는 투자 자산으로만 분류된다. 브랜드가 직접 말하지 않은 자리를, 다른 사람들이 다른 어휘로 채워온 결과다.
원칙. 어휘는 포지셔닝보다 앞선다.
Vocabulary precedes positioning.
브랜드 컨설팅이 지난 30년간 positioning — 즉 당신은 누구인가라는 질문에 집중해 왔다면, AI 시대에는 그 위에 한 층이 더 필요하다. vocabulary precision — 당신을 설명하는 단어가 어디에 어떻게 분포해 있는가. 어휘가 정렬되지 않은 포지셔닝은 AI라는 첫 청중에게 들리지 않는다.
이 원칙은 단순하지만 실행은 간단하지 않다. 다섯 출처 각각의 작동 방식이 다르고, 각 출처에 어떤 단어가 어떤 형태로 누적되어야 하는지에 대한 답도 다르다. 그 차이를 다루는 일이 AI Visibility의 핵심이다.
받은 단어를 다시 고객에게 전달하는 중간자입니다.
그래서 측정해야 할 것은 분명합니다. 우리 브랜드에 대해 AI가 어떤 단어로 학습하고 있는지부터 확인하는 일입니다.
Arxia가 실행하는 어휘 정밀도 개입(Vocabulary Precision Intervention)은 세 단계다.
- 측정 — 어휘 드리프트 수치화. 다섯 출처에서 브랜드 어휘를 추출하고, LLM에 브랜드 관련 질문을 직접 던져 의도 어휘 대비 실제 학습 어휘의 격차를 수치로 산출한다. 어디서 어긋났는지, 어느 출처가 원인인지가 드러난다.
- 개입 — 출처 우선순위 재정렬. 드리프트가 가장 큰 출처부터 순서대로 개입한다. Wikipedia 항목은 브랜드 핵심 어휘로 업데이트하고, schema.org 마크업으로 공식 채널에 구조적 의미를 부여하며, 편집 권위 매체에 브랜드 어휘가 포함된 콘텐츠를 전략적으로 배치한다. 커뮤니티 씨앗 어휘는 별도 설계한다.
- 재측정 — 어휘 이동 확인. 6개월 후 동일 질문으로 LLM 응답을 재수집해 어휘 변화를 정량화한다. 드리프트 수치가 줄었는지, 어떤 출처에서 효과가 발생했는지를 성과 지표로 삼는다.
이제 광고가 아니라 어휘에서 시작된다.
다음 공개 발행을 받아보시려면
Arxia Quarterly를 구독하십시오.
Vol.I 이후의 공개 발행은 Arxia Quarterly 구독자에게 가장 먼저 보내드립니다. 분기에 한 번, 적게 보내고 깊게 씁니다.