본문 바로가기
← 목록으로

LLM의 "최신 AI 뉴스" 검색 패턴으로 우연히 12.5만 구글 노출수 트리거한 경험

metehan.ai조회수 0176일 전

핵심

한 마케터가 ChatGPT의 최근성 편향을 연구하는 글을 발행했을 때, 구글 검색 콘솔에서 특정 쿼리들에 대한 비정상적으로 높은 노출수 증가를 관찰했다. 자세히 분석한 결과, 이러한 쿼리들이 인간의 전형적인 검색과는 다른 패턴을 보이고 있음을 발견했다.

LLM 기반 쿼리의 비정상적 특징

검색 콘솔에 나타난 일부 쿼리들은 전형적인 인간 검색이 아니었다.

패턴은 일관되고 반복 가능하며, 매우 좁은 테마 주위로 군집되어 있었다.

학습 및 평가 데이터셋과의 연관성 가설

대규모 학습 및 평가 데이터셋(예: MS MARCO, BERT)이 이러한 행동에 영향을 미칠 수 있다고 추측된다. MS MARCO는 업계에서 검색(retrieval) 및 질의응답(question answering) 시스템 학습과 벤치마킹에 널리 사용되며, 특히 오픈소스 모델에서 자주 활용된다.

이 데이터셋의 특징:

검색 콘솔 데이터를 이 렌즈로 살펴보면 일부 패턴이 유기적인 인간 검색이 아니라 평가 스타일의 프롬프트처럼 보인다. "이 자료가 여전히 이 질문에 잘 답하는가" 또는 "이 주제에 대한 신선하고 권위 있는 문서가 있는가"와 같은 변형처럼 나타난다.

이는 LLM이 정보 검색 시스템과 상호작용할 때 사용하는 정신 모델이 학습 및 평가 방식에 여전히 강하게 영향받고 있음을 시사한다.

스팸 없이도 타겟팅된 가시성이 가능한가

일부 웹사이트들이 이런 LLM 스타일의 쿼리를 적극적으로 식별하고 타겟팅하고 있음을 관찰했다. (특히 뉴스 쿼리의 경우로, 일부 "신규" 웹사이트들이 로이터 같은 매체보다 더 자주 노출되는 이유를 이해할 수 있다)

이것이 자동으로 스팸을 의미하지는 않는다. 책임감 있게 수행할 경우, 이 접근 방식은 키워드 조작이 아니라 AI 시스템이 정보를 소비하고 새로고침하며 검증하는 방식을 이해하는 것과 유사하다. AI 시스템이 이미 확인, 업데이트, 지원 출처를 찾고 있는 곳에 존재하는 것에 관한 것이다.

그러나 인사이트 기반의 최적화와 저품질 AI 스팸(slop) 사이의 경계는 얇고 쉽게 넘어간다.

명확한 경계: AI 스팸 반대, 대규모 악용 금지

저자는 명시적으로 한 가지를 선언했다: LLM 행동을 게임하기 위해 순수하게 설계된 AI 스팸, 합성 스팸 페이지, 대량 생산 콘텐츠를 지지하지 않으며, 이러한 에코시스템을 활성화할 의도가 없다.

대신 단 하나의 투명한 데이터셋을 공개했다: 구글 검색 콘솔 데이터 전체 중 "AI 뉴스 최근성(AI News Recency)" 주제 관련 데이터만 공유하기로 한 이유는 세 가지다.

이것은 성장 해킹 가이드북이 아니라 실제 검색 데이터로 뒷받침된 관찰이다.

더 큰 질문

이는 SEO, AEO(생성형 검색 최적화), AI 검색 최적화에 대한 더 광범위한 질문을 제기한다.

LLM이 MS MARCO 같은 학습 데이터셋으로 형성되고 최근성 민감 검색(recency-sensitive retrieval) 시스템으로 강화된 자신만의 정보 탐색 행동 패턴을 생성하고 있다면, AI 기반 정보 수요를 이해하는 것이 인간의 의도를 이해하는 것만큼 중요해진다.

그 목적은 이를 악용하는 것이 아니라 책임감 있게 이에 부응하는 것이다. 저자는 이것이 진정한 기회가 있는 곳이라고 본다.

참고