구글의 확장된 후보 집합: 검색에서 답변 엔진으로의 전환과 검증 기반 시대
핵심
구글의 확장된 후보 집합은 검색 시스템이 콘텐츠를 평가하는 방식의 근본적인 변화를 나타낸다. AI 시스템이 더 많은 정보를 처리하면서, 가시성은 전통적 키워드 타게팅만이 아니라 검증, 관계, 신뢰 신호에 점점 더 의존하게 되었다.
검색에서 답변 엔진으로의 진화
크롤러에서 AI 에이전트로의 변화
초기 구글봇은 기계적 페칭(fetching) 도구였다. 엄격한 규칙 기반 로직을 따랐다: 링크를 찾고, 페이지를 다운로드하고, 단어를 색인화한다. 콘텐츠를 '생각'하지 않았고 단순히 기록했다.
지난 10년간 이러한 도구는 본질적으로 대학원 과정을 거쳐 언어학 박사학위를 받고 법의학 수사관으로 진화했다:
- 2015년 - 사고 계층(thinking layer): RankBrain(랭크브레인)은 시스템이 이전에 본 적 없는 쿼리의 의도를 추론할 수 있게 했다.
- 2019년 - 맥락 전환: BERT(버트)는 크롤러가 단어 간 관계를 이해하도록 만들어, 검색을 키워드를 넘어 정보 이득(information gain) 을 중심으로 옮겼다.
- 2023년 이후 - 생성형 에이전트로의 도약: Gemini(제미니)와 AI Overviews(AI 개요) 시대에 시스템은 수백 개의 페이지를 동시에 읽어 하나의 고유한 답변을 합성한다.
'선택의 위기'의 등장
ChatGPT가 2022년 말 등장하면서 답변 엔진으로의 전환이 가속화되었다. 사용자는 레시피를 요청하는 대신 식사 계획을 요구하기 시작했다.
이는 선택의 위기를 초래했다. AI 에이전트가 하나의 응집된 답변을 제공하려면, 어떤 사실을 포함할지, 어떤 것을 무시할지 선택해야 한다. 이는 경쟁의 장을 평평하게 만들었다. 자연어 인터페이스 덕분에 검색 리터러시의 수준에 관계없이 누구나 고품질 정보에 접근할 수 있게 되었다.
이는 정보 이득과 원자적 사실(atomic facts) 이 유일한 화폐라는 결론을 검증해준다. AI 시스템이 2,000단어 페이지를 두 문장으로 요약할 수 있다면, 나머지 1,980단어는 맥락 부채(context debt) ——기계가 결국 무시할 불필요한 무게가 된다.
30년의 여정: 정보 이득과 원자적 사실로
이 결론은 '마법의 순간'을 통해 도달하지 않았다. 오래되고 잘못된 정보가 진실인 척하는 좀비 사실(zombie facts) 을 식별하는 30년, 그리고 광범위한 시행착오를 통해 얻어졌다.
신뢰가 생존의 조건인 분야에서 시작
경로는 고위험 산업에서 시작되었다: 온라인 약국과 규제 대상 온라인 게이밍. 이 부문에서 신뢰는 유행어가 아니라 사업을 유지하는 유일한 방식이다.
2018년, 저자는 의미 트리플(semantic triples) 과 지식 그래프(knowledge graph)에 몰두했다. 크롤러는 단순히 자신을 찾기만 해서는 안 되고, 자신을 이해할 논리적 지도가 필요하다는 것을 깨달았다.
상품화 위기와 원자적 사실의 필요성
8개의 전자상거래 사이트에서 동일한 제품을 동일한 가격으로 판매하던 중, 상품화 위기(commodity crisis) 에 직면했다. 모두가 같은 말을 하면 답변 엔진이 당신을 선택할 논리적 이유가 없다. 오직 원자적 사실——당신만 제공할 수 있는 고유하고 검증된 정보만이 차별화된다.
검증과 신뢰를 위한 프레임워크 개발
10년간 구축한 도구들
저자는 발견한 격차를 해결하기 위해 도구들을 개발했다:
- E-E-A-T 엔진: 구글의 Search Quality Rater Guidelines(검색 품질 평가자 가이드라인)을 기반으로 한 500점 법의학 감사 시스템
- 원자적 샌드위치: 콘텐츠를 기술 설계도처럼 취급하는 3층 구조 아키텍처(원자적 사실, 정보 이득, 구조적 계층)
- 법의학 IG 평가자: 콘텐츠가 실제로 대화에 새로운 것을 더하는지 측정하는 도구
결국 도구 모음이 너무 무거워졌다. 맥락 부채와 신뢰 격차 문제는 더 통합된 접근을 필요로 했다. 이는 고도의 엔지니어링과 현실적 이해를 연결하는 프레임워크 개발로 이어졌다.
답변 엔진 시대의 신뢰 구축
선택의 위기의 일반화
28개의 디지털 엔티티(entity, 검색 대상)를 대상으로 한 최근 법의학 감사는 선택의 위기가 일반 웹까지 확산되었음을 확인했다. 검색 엔진 랜드가 보도했듯이, 구글은 이제 순위 결정을 위해 훨씬 더 큰 페이지 풀을 평가하고 있다.
수백 개의 페이지 중에서, 기계는 더 이상 "누가 최고의 키워드를 갖고 있는가?"를 묻지 않는다. 대신 "누를 검증할 수 있는가?"를 묻는다. 순위 자체로는 더 이상 충분하지 않다. AI 시스템이 검증하고 신뢰할 수 있는 출처가 되어야 한다.
법의학 엔지니어링의 3가지 기둥
기둥 1 - 암호학적 권위(Cryptographic Authority)
딥페이크 시대에, JSON Web Signature (JWS) 표준(RFC 7515)을 사용하여 엔티티의 매니페스트(manifest, 명세서)에 서명한다. 이를 후보 집합을 빠르게 통과하는 '패스트패스'라고 생각하면 된다. 즉각적인 검증을 가능하게 하기 때문이다.
기둥 2 - 의미 그래프(Semantic Graph)
AI는 문단으로 생각하지 않고 관계로 생각한다. W3C RDF-star 표준을 사용하여 감사를 구조화된 지식 그래프로 내보낸다. 이는 AI 시스템이 데이터를 읽을 때 번역 오류를 최소화한다.
기둥 3 - 규제 정렬(Regulatory Alignment)
아키텍처를 EU AI Act(Regulation 2024/1689)와 연계했다. 이는 디지털 GDP를 입법 변화로부터 보호한다. 전 지역에서 보이고 싶다면 전 지역의 요구사항을 충족해야 한다.
결론: SEO의 재정의
후보 집합의 확대는 검색 엔진이 답변 엔진으로 변모하고 있음을 보여준다. 가시성은 점점 더 AI 시스템이 당신의 엔티티와 관련된 정보를 검증하고, 연결하고, 신뢰할 수 있는지에 달려 있다.
이 전환은 SEO의 직무를 변화시킨다. 더 이상 순위화와 검색 결과 노출만이 아니라, 기계가 관계를 이해하고, 정보를 검증하고, 대규모로 신뢰를 확립하도록 돕는 시스템을 구축하는 일이 된다.
이 전환을 지원하는 데 필요한 프레임워크와 표준은 이미 공개 영역에 존재한다. 이제의 과제는 AI 기반 검색에서 가시성을 위한 신뢰할 수 있는 토대로 이들을 어떻게 조립할지 배우는 것이다.