스키마 마크업이 생성형AI를 통한 인용 증가에 미치는 영향은 극히 제한적
핵심
저자는 의도적으로 잘못된 JSON-LD 스키마를 포함한 페이지를 만들어 ChatGPT와 Perplexity 같은 LLM에 주소를 묻는 실험을 수행했다. 두 모델 모두 유효하지 않은 스키마에서 정보를 반환했는데, 이는 LLM이 스키마를 구조화된 데이터로 파싱하기보다는 단순히 페이지의 텍스트로 취급함을 의미한다.
스키마란 무엇인가
**스키마(Schema.org 구조화 데이터)**는 Google, Microsoft, Yahoo, Yandex가 함께 만든 어휘로, 웹마스터들이 기계가 읽을 수 있는 형태의 정보를 페이지에 포함시킬 수 있도록 해준다.
- 목적: 자연어의 모호성을 제거하고 명확한 의미를 전달 (예: "Apple"이 과일인지 회사인지 명확히 구분)
- Google 검색 중앙에 따르면 스키마는 "페이지 정보를 표준화된 형식으로 제공하고 페이지 콘텐츠를 분류"하는 것
- 최종적으로 Google의 **Knowledge Graph(지식 그래프)**와 같은 엔티티-관계 데이터베이스로 흘러들어감
LLM이 스키마를 사용하는가 — 두 가지 주장
주장 1: 스키마가 모델 훈련 중에 "내재화"된다
문제점
- 사전 훈련 과정에서 제거됨: 기초 LLM 제작 과정에서 데이터 청소 단계가 있는데, 여기서 HTML과 보일러플레이트(메뉴, 스크립트 등)를 걸러낸다. 널리 사용되는 FineWeb 데이터셋(15조 개의 토큰)은 trafilatura 라이브러리를 사용하여 주요 페이지 텍스트만 추출하는데, JSON-LD는
<script>태그 안에 있어서 걸러진다. - 토큰화 중 구조 손실: 훈련 데이터는 토큰(글자의 조각)으로 쪼개지는데, "@type": "Organization"이라는 문자열도 @, type, :, Organization 같은 개별 토큰으로 나뉜다. 스키마의 구조와 의미가 사라진다.
- 반복 필요성: LLM이 사실을 "기억"하려면 훈련 데이터에 여러 번 나타나야 한다. 한 제품 페이지의 주소 하나는 15조 토큰 중 극히 미미한 수준이므로, 모델이 실제로 이를 학습할 가능성은 거의 없다.
스키마가 공개적으로 설명된 형태(블로그, 포럼, GitHub, Stack Overflow 등)로는 훈련 데이터에 많이 포함되지만, 실제 페이지의 <script> 태그 내 스키마는 아니다.
주장 2: LLM이 쿼리 시점(실시간)에 스키마를 읽는다
세 가지 버전 검토
-
"LLM이 실시간으로 Knowledge Graph를 구축한다"
- 거짓: Knowledge Graph는 구성된 엔티티, ID, 관계 규칙을 가진 대규모 데이터베이스다. 사용자가 질문하는 순간에 구축되지 않는다. 시간과 인프라가 부족하다.
-
"LLM이 상류(upstream)에서 엔티티 해석 파이프라인을 구축하고, 나중에 스키마를 참고할 것이다"
- 이는 "스키마가 언젠가 LLM의 뇌를 먹일 수 있다"는 약한 주장이다. 현재 공개된 증거는 없다.
-
Fabrice Canel의 Microsoft 인용문 오독
- 2025년 3월 Search Engine Land의 기사 제목: "Microsoft Bing/Copilot use schema for its LLMs"
- 실제 인용문은 IndexNow(콘텐츠 변경 시 알림 API)에 관한 것으로, "신선한 콘텐츠를 LLM 훈련 데이터의 참조 확인으로 삼는다"는 의미였다.
- 페이지 업데이트 알림에 관한 주장을 JSON-LD 파싱에 관한 주장으로 왜곡했다.
오리 셔츠 회사 실험(The Duck Test)
저자가 만든 실험 페이지: i83.uk/duckyea.html
- 페이지의 보이는 텍스트에는 주소가 전혀 없음
- HTML 헤드의 JSON-LD에는 의도적으로 잘못된 스키마를 삽입:
- @context: 존재하지 않는 URL ("http://api.the-great-pond.net/schema")
- @type: "MallardEnterprise" (Schema.org에 없는 타입)
- 속성들: flockName, waddleStyle, nestingGrounds, reedNumber, puddle, featherCode 등 (모두 Schema.org 어휘에 없음)
- 문법적으로는 유효한 JSON이지만 스키마 관점에서는 완전한 무의미
결과
- ChatGPT와 Perplexity 모두 "Reed Number 77, The Muddy Bank, South Pondshire, DK99 YEA, United Queendom"이라고 답변
- Perplexity는 "페이지의 임베드된 구조화 데이터에서 찾았다"고 주장
- 두 모델 모두 유효하지 않은 스키마에 반응하지 않음
의미 LLM이 스키마를 올바르게 파싱했다면, 유효하지 않은 타입과 속성을 거부하거나 경고했을 것이다. 대신 JSON-LD를 단순히 특이하게 구두점이 찍힌 텍스트로 취급했고, 주소를 추출했다.
현재(실험 이후) 이 페이지를 다시 쿼리하면 LLM은 정확히 "이것은 Mark Williams-Cook이 만든 테스트 페이지다"라고 답변한다. 충분한 사람들이 이 실험에 대해 글을 작성하여 RAG(검색 증강 생성)에서 이 정보가 인출되고 있기 때문이다. 주소는 여전히 HTML에서 읽혀지고 있다.
Google의 모순
저자는 Google의 검색결과 한 페이지에서 같은 자동차 딜러(Perrys Dover Mazda)에 대한 모순을 발견:
- AI Overview: "폐업하지 않음"이라고 주장하며 주소와 영업시간 표시
- Google Business Profile 지식 패널 (같은 SERP의 우측): "영구 폐업"이라고 큰 빨간 배너로 표시
Google Business Profile은 구조화된, 사용자가 편집한, 검증 가능한 정보 소스다. 같은 회사의 두 시스템이 호환되지 않고 있다.
함의: 스키마를 가장 많이 갖추고 있고, Knowledge Graph를 소유하며, 최장 선발주자 우위와 수직 통합을 가진 Google조차 자신의 비즈니스 정보 데이터베이스를 AI 답변과 연결하지 못하고 있다면, OpenAI나 Anthropic이 더 정교한 엔티티 파이프라인을 구축했을 가능성은 낮다.
현재 증거 기준의 문제
"LLM이 스키마에서 정보를 반환했다 = 스키마를 사용한다"는 논리가 만연하다.
- 문제: 같은 정보가 거의 항상 HTML, 메타데이터, 페이지 제목, 소셜 카드 등에도 나타난다.
- 올바른 증거: 스키마가 유효하지 않은데도 LLM이 올바르게 답변하지 않는 경우 (즉, 오리 실험처럼)
- Ahrefs 연구(1,885개의 JSON-LD 추가 페이지 vs 4,000개 컨트롤): 스키마가 AI 인용에 본질적으로 영향을 주지 않음
- 그러나 이 연구는 이미 100건 이상의 AI Overview 인용을 받은 페이지들을 대상으로 했는데, 이는 스키마 효과를 테스트하기 최악의 모집단 (이미 잘 이해되는 엔티티)
- 의미 있는 케이스: 신규 브랜드와 경쟁 브랜드로, 웹 전체의 엔티티 풋프린트가 얇고 시스템이 "이 회사가 맞는 회사"임을 아직 확신하지 못하는 곳
스키마를 언제, 어떻게 사용할 것인가
계속 사용해야 하는 이유
- 구현 비용이 낮고, 부작용은 거의 없으며, 이익은 누적적
- LLM 스택의 어느 단계에서 스키마가 의미 있게 활용되기 시작하면, 이미 수행한 작업이 준비되어 있다
피해야 할 주장
- "스키마는 LLM 인용의 마법 같은 지렛대다" — 현재 공개 증거는 약하다
- "LLM이 스키마를 의도대로 사용한다"고 주장하는 컨설턴트는 수치를 제시하도록 요청할 것
가치 있는 투자 대상
- 신규 브랜드: 엔티티 해석이 어려운 곳
- 이름 충돌: 같은 이름의 다른 회사, 더 유명한 사람과의 겹침
- Knowledge Panel 없는 조직: 아직 엔티티로 등록되지 않은 곳
- 개인 엔티티: 같은 이름의 더 유명한 사람이 있는 경우
스키마의 진정한 가치는 "오늘 AI 인용을 얻는 것"이 아니라 **"내일 후보 엔티티가 될 자격을 얻는 것"**이다. AI 검색에서 후보 자격이 유일한 경쟁력인 시대에서, 이는 결코 작지 않은 가치다.
Gary Illyes(Google)의 2025년 발언: Google이 이상적으로는 스키마에 의존하지 않기를 원하며, 시스템이 영어를 올바르게 읽을 수 있게 되면 스키마는 필요 없을 것이다. 지금은 스키마가 모호성 동안 확실성을 사줄 뿐이다.
결론
- 스키마를 계속 사용하되, 업계의 과장된 주장을 반박하라.
- "LLM이 스키마를 반환했다"는 증거로 스키마 투자를 정당화하지 말 것. 오리 실험처럼 의도적으로 잘못된 스키마로 먼저 테스트하라.
- SEO 정설을 회의적으로 대하라: "인기 있는 답변이 반복되면 참으로 들린다"는 자동차 세차 수준의 추론이 GEO 업계에도 퍼져 있다.
- 증거 기준을 엄격히 적용하라: "~라고 한다"만으로는 충분하지 않다. 실험으로 검증하고, 증거가 변하면 입장을 바꿀 준비를 하라.