ChatGPT의 검색 결과 순위 공식: 상호 순위 융합(RRF)의 수학

metehan.ai조회수 1367일 전

핵심

ChatGPT는 검색 결과를 결합할 때 상호 순위 융합(reciprocal rank fusion, RRF) 이라는 수학 공식을 사용한다. 이는 여러 검색 쿼리의 결과를 하나의 최종 순위로 통합하는 방식으로, RRF 점수 = 1/(60 + 순위) 형태로 계산된다.

상호 순위 융합(RRF)이란

RRF는 2009년부터 존재해온 정보검색 기법이다. 여러 쿼리의 검색 결과를 하나의 최종 순위로 결합하는 방법이다.
공식: RRF score = 1/(60 + rank position)
- 순위 #1 = 1/(60+1) = 0.0164
- 순위 #5 = 1/(60+5) = 0.0154
- 순위 #10 = 1/(60+10) = 0.0143
같은 페이지가 여러 쿼리에서 다른 순위에 나타나면, 모든 점수를 더한다.

AI가 여러 번 검색하는 이유

사용자가 한 가지 질문을 할 때, ChatGPT나 Perplexity, Google의 AI 모드는 단 한 번만 검색하지 않는다. 다양한 용어로 여러 검색을 실행하고 결과를 결합한다.

예시: "커피 메이커"로 검색할 때 실제로는 다음을 모두 검색한다

"coffee makers"
"best coffee machines"
"how to choose coffee maker"
"coffee brewing devices"
"home coffee makers reviews"

RRF는 이 모든 검색 결과를 하나의 최종 답변으로 합치는 수학적 방법이다. 이것이 AI 검색 결과가 전통적인 단일 구글 검색과 다르게 보이는 이유를 설명한다.

ChatGPT 코드에서 발견한 RRF 구현

개발자 도구에서 발견한 코드:

rrf_alpha: 1,
rrf_input_threshold: 0,
ranking_model: null

이는 ChatGPT가 표준 RRF를 사용해 검색 결과를 결합함을 확인시켜준다. 흥미로운 점은 이 구현이 여러 쿼리 변형에 대한 순위의 중요성을 드러낸다는 것이다.

RRF가 증명하는 토픽 권위성의 효과

단일 키워드 중심 vs. 토픽 클러스터 전략

페이지 A (단일 키워드 중심)

"coffee makers" → 순위 #1 → 점수: 0.0164
"best coffee makers" → 순위 #15 → 점수: 0.0133
"coffee machines" → 순위 없음 → 점수: 0
"coffee maker reviews" → 순위 #25 → 점수: 0.0118
총 RRF 점수: 0.0415

페이지 B (토픽 클러스터 접근)

"coffee makers" → 순위 #4 → 점수: 0.0156
"best coffee makers" → 순위 #5 → 점수: 0.0154
"coffee machines" → 순위 #6 → 점수: 0.0152
"coffee maker reviews" → 순위 #4 → 점수: 0.0156
"home coffee makers" → 순위 #7 → 점수: 0.0149
총 RRF 점수: 0.0767

페이지 B가 거의 1.8배 높은 점수를 기록한다. 더 넓은 주제 범위를 다루기 때문이다.

일관성 vs. 개별 순위

시나리오 1: 전통적 키워드 타겟팅

1개 키워드 순위 #1: 1/(60+1) = 0.0164
총 RRF = 0.0164

시나리오 2: 토픽 클러스터 전략

10개 관련 키워드 평균 순위 #5: 10 × (1/(60+5)) = 10 × 0.0154 = 0.154
총 RRF = 0.154

토픽 클러스터 점수가 거의 10배 높다 (0.154 vs 0.0164).

현대 검색 엔진의 관련성 평가 방식

RRF 구현을 통해 AI 검색이 콘텐츠를 평가하는 방식을 알 수 있다:

다양한 쿼리 변형: AI는 한 번만 검색하지 않으며, 관련 쿼리를 탐색한다.
누적 점수: 여러 검색에 걸쳐 나타나는 페이지가 더 큰 가치를 얻는다.
주제 이해: 시스템은 포괄적인 주제 범위를 인식하고 보상한다.

토픽 클러스터가 효과적인 이유

커피 메이커 토픽 클러스터 예시

허브 페이지: "커피 메이커 완벽 가이드"
클러스터 페이지들

커피 메이커의 종류
커피 메이커 선택 방법
커피 메이커 관리법
예산별 최고 커피 메이커
커피 메이커 문제 해결

사용자가 "커피 메이커 청소 방법"을 검색할 때:

관리 페이지: 순위 #2 → 0.0161
허브 페이지: 순위 #5 → 0.0154
문제 해결 페이지: 순위 #8 → 0.0147
클러스터 총 RRF: 0.0462

비교:

독립형 페이지: 순위 #1 → 0.0164

클러스터가 거의 300% 더 높다.

실제 주제 권위성 계산

강한 주제 권위성을 가진 사이트

30개 관련 페이지
50개 커피 관련 쿼리에서 순위 #3~10
평균 순위: #6
RRF per 쿼리: 1/(60+6) = 0.0152
총 RRF: 50 × 0.0152 = 0.76

비교:

단일 페이지 사이트
"최고 커피 메이커 2025"에서만 순위 #1
다른 쿼리에는 순위 없음
총 RRF: 0.0164

주제 권위성 사이트가 거의 60배 높다.

현대 SEO에 미치는 영향

1. 토픽 권위성이 수학적으로 우월하다

RRF는 개별 키워드 순위보다 포괄적인 주제 범위가 우월함을 입증한다. 이론이 아닌 수학이다.

2. AI 검색은 포괄적인 콘텐츠를 보상한다

ChatGPT든 다른 AI 시스템이든 추세는 명확하다: 좁은 최적화보다 포괄적이고 권위 있는 콘텐츠가 우승한다.

3. 토픽 클러스터는 순위 수학과 일치한다

토픽 클러스터 전략은 사용자 경험만 좋은 게 아니라, 현대 검색 시스템이 결과를 결합하고 평가하는 방식에 최적화되어 있다.

4. 쿼리 변형이 그 어느 때보다 중요하다

사용자가 주제를 검색할 수 있는 모든 방식은 RRF 점수를 높일 수 있는 기회다.

"coffee makers"
"coffee machines"
"coffee brewing devices"
"home coffee makers"
"automatic coffee makers"

코드에서 드러나는 다중 소스 통합

발견된 코드 주석:

// ChatGPT processes multiple result types:
- webpage
- webpage_extended
- grouped_webpages
- image_inline

AI 검색 시스템은 단일 결과 타입만 보지 않고 다양한 신호를 결합한다. 이는 여러 포맷에 걸쳐 나타나는 포괄적 콘텐츠를 더욱 보상한다.

SEO 전략에 RRF 사고 적용하기

1. 전체 주제 공간 매핑

사용자가 검색할 수 있는 모든 쿼리 변형 찾기
검색 제안 및 관련 쿼리 분석
포괄적인 범위가 무엇인지 파악

2. 포괄적인 토픽 클러스터 구축

강력한 허브 페이지 작성
서브토픽용 지원 페이지 구축
광범위하게 상호 연결
사용자가 검색할 수 있는 모든 각도 다루기

3. 순위가 아닌 토픽 범위 측정

50개 이상의 관련 쿼리에서 순위 추적
"토픽 RRF 점수" 작성 가능
개별 순위가 아닌 주제 전체 노출 모니터링

4. 일관성 최적화

3개 쿼리에서 순위 #1보다, 30개 쿼리에서 평균 순위 #4~8이 낫다.

계산:

30개 쿼리 평균 순위 #6: RRF = 0.456
3개 쿼리 순위 #1: RRF = 0.049

일관성이 거의 10배 더 우승한다.

(주: 최상위 키워드에서 순위 #1을 기록할 수 있지만, 많은 쿼리에서 상위 10위에 순위할 가능성이 높다. 이 계산은 시뮬레이션용이다.)

결론

ChatGPT 코드에서 RRF를 발견하면 현대 검색에서 토픽 권위성과 토픽 클러스터가 왜 그토록 효과적인지에 대한 수학적 프레임워크를 제공한다. ChatGPT가 정확히 어떤 검색 엔진을 사용하는지, 앞으로 어떤 엔진을 사용할지는 알 수 없지만, RRF 구현은 AI 시스템이 순위와 관련성을 어떻게 생각하는지 보여준다.

수학은 거짓을 말하지 않는다. AI 검색이 여러 쿼리와 신호를 결합하는 세상에서, 전체 주제 공간에 일관되게 나타나는 사이트가 우승한다. 토픽 클러스터는 단순한 콘텐츠 전략이 아니라 현대 검색에서의 수학적 이점이다.

RRF를 이해하는 것은 토픽 권위성이 왜 중요한지를 보여준다. 이는 시스템을 속이는 게 아니라 AI 검색이 자연스럽게 관련 쿼리에 걸쳐 관련성 신호를 평가하고 결합하는 방식과 일치하는 것이다.

이는 ChatGPT만의 문제가 아니다. 모든 검색이 더욱 AI 기반이 되고 좁은 최적화보다 포괄적인 범위가 우월해지는 미래에 대비하는 것이다.