ChatGPT 웹 모드에서 인용되기 위한 RRF 상위 N개 전략 (k≈60)

metehan.ai조회수 1316일 전

핵심

ChatGPT의 웹 검색 기능은 여러 부질의(sub-query)를 **역수 순위 융합(RRF, Reciprocal Rank Fusion)**으로 통합하여 최종 인용 목록을 선정한다. 페이지가 융합 점수 τ = 0.020 이상을 달성하면 최종 상위 60 인용 풀에 거의 항상 포함된다.

배경

저자는 AI 검색 최적화 회사인 AEOVision에 합류했으며, 이 글은 검색증강생성(RAG) 환경에서 LLM 인용을 위한 수학적 접근법을 다룬다. 이론상 상위 60이 RRF 계산에 최적이지만, 실제 ChatGPT는 쿼리에 따라 38~65개의 서로 다른 결과를 반환한다. 실무적으로는 상위 30을 목표로 하는 것이 더 현실적이다.

융합 수학

기본 공식

여러 부질의(M개)의 결과를 RRF로 융합할 때 페이지 d의 융합 점수:

$$S(d) = \sum_{i \in I(d)} \frac{w_i}{k + r_i(d)} \quad (k=60, w_i \approx 1)$$

r_i(d): 부질의 i에서 페이지 d의 순위(1부터 시작, 부재 시 ∞)
k=60: 순위 격차를 완화하는 감쇠 인자
S(d): 페이지 정렬에 사용되는 융합 점수(상위 60 유지)

포함 임계값 설정

경쟁사 순위를 미리 알 수 없으므로 안전한 포함 임계값을 설정:

한 번 #1: 1/(60+1) = 0.01639
두 번 #40과 #50: 1/100 + 1/110 ≈ 0.01909
신뢰할 수 있는 목표: τ = 0.020

S(d) ≥ 0.020을 달성하면 일반적인 부질의 구조에서 융합 상위 60에 들어갈 가능성이 높다.

인용되기 위한 규칙(플러그 앤 플레이)

$$\boxed{\sum_{i \in I(d)} \frac{1}{60 + r_i(d)} \geq 0.020}$$

동등 가중치 기준 구체적 달성 방법:

2× 상위 40: 2/(60+40) = 2/100 = 0.020 ✅
3× 상위 90: 3/(60+90) = 3/150 = 0.020 ✅
1× #1 + 1× 상위 80: 1/61 + 1/140 ≈ 0.0235 ✅
4× 상위 140: 4/(60+140) = 4/200 = 0.020 ✅

균등 "상위 R" 단축식: 부질의 m개를 목표 순위 R에 포함시키려면 m ≥ ⌈0.020(60+R)⌉

| 목표 순위 | 필요 부질의 수 | |---------|------------| | R=40 | m≥2 | | R=90 | m≥3 | | R=140 | m≥4 |

최종 규칙: 상위 40 이내에 2회 이상 또는 상위 90 이내에 3회 이상 노출되면 경계 넘기 완료.

실무 운영 방법

A) 토픽 클러스터 구성(LLM이 검색할 가능성 높은 부질의)

8~16개의 부질의를 핵심 의도 중심으로 생성:

헤드 + 연도: "best X 2025"
헤드 + "top"
헤드 + "review(s)"
헤드 + "price(s)"
헤드 + "compare"/"vs"
헤드 + "near me"(지역)
단수/복수/엔티티 변형
PAA 형태 질문: "What is…", "How to choose…", "Is X worth it…"

B) 각 부질의별 상위 N개 수집

각 부질의당 상위 60~100개 결과를 수집하고 순위 r_i(당신의 페이지, 부재 시 ∞) 기록. 더 깊은 순위는 점수에 큰 영향을 주지 않음.

C) 융합 점수 계산

$$S(d) = \sum_{i: r_i(d) < \infty} \frac{1}{60 + r_i(d)}$$

S(d)를 계산하고 0.020 미만이면 다음 선택지 중 택일:

두 변형을 상위 40으로 끌어올리기
세 변형을 상위 90으로 끌어올리기
#1~#3 하나와 순위 80 이내 하나 조합

가장 싼 개선부터 우선 시행(이미 근처인 곳).

온페이지 "다중 목록 순위" 최적화

권한(domain authority)이 아니라 부질의 전반의 다중 노출을 최적화하는 것이 목표.

제목/H1과 리드 n-그램

선택한 변형의 지배적 SERP n-그램 반영(예: "best ___ in 2025", "top ___ for beginners"). 여러 목록 동시 승리 지원.

부제 패킹

각 변형에 정렬된 컴팩트 섹션 추가:

H2: Best ___ for Beginners (2025)
H2: ___ Price & Value
H2: ___ vs Alternatives
H2: How to Choose ___

검색 엔진에 정확한 앵커 제공, 불필요한 정보 추가 없음.

PAA 스타일 답변 블록

질문 형태와 정확히 일치하는 한 문단 정의식 블록("Is ___ worth it?", "How much does ___ cost?"). Q&A 변형 캡처.

연도 및 신선도 토큰

자연스러운 위치에 현재 연도 사용(제목, H1, 리드, 표 캡션). 테이블, FAQ 등을 주기적으로 순환.

엣지 스니펫

비교 테이블과 가격 테이블 추가. 보통 "vs"와 "price" 변형에 표면화되어 두 추가 목록 빠르게 확보.

최소 구현(시트 또는 코드)

부질의별 순위 r_i(i=1..M) 주어졌을 때:

S = sum(1 / (60 + r) for r in ranks if r is not None)
IN_TOP_60 = S >= 0.020
# False면 가장 개선하기 쉬운 변형부터 상위로 끌어올려 S 재계산

그리디 개선 헬퍼(사람 개입): 변형을 기준점(40, 90, 140)에 얼마나 근접한지로 정렬. 가장 가까운 것부터 개선, S 재계산.

빠른 참고표(k=60, τ=0.020)

| 노출 횟수 | 각 최대 순위 | 보장 S | |---------|-----------|-------| | 2× | ≤40 | 0.0200 | | 2× | ≤45 | 0.01905 | | 2× | ≤50 | 0.01818 | | 3× | ≤90 | 0.0200 | | 4× | ≤140 | 0.0200 | | 1× #1 + 1× ≤80 | — | ≈0.0235 |

ChatGPT & AYIMA 실험

AYIMA ChatGPT 확장 프로그램으로 RAG 출처를 추적하여 다양한 쿼리에 대해 ChatGPT가 실제로 검색하는 웹 결과 수를 측정했다.

주요 쿼리별 검색 결과 수

"latest ai news" → 65개 출처
"latest tech news" → 52개 출처
"latest sport news" → 38개 출처
"trending sneaker brands 2025" → 60개 출처

ChatGPT는 쿼리 유형에 따라 38~65개의 총 출처를 검색, 매우 동적.

하위 순위를 위한 현실 체크

검색 결과 60위 근처에 있을 경우 냉혹한 사실:

최선의 시나리오:

60개 이상의 결과를 검색하는 단일 쿼리면 순위 60은 수용 가능
실제로는 마지막이거나 거의 마지막 결과
RRF 점수: <0.00833(미미함)

검색되지 않으면 0 — 인용 기회 없음.

RRF 점수의 중요성

RRF는 검색하는 것만 점수를 매긴다. 검색 윈도우에 없으면 점수 없음, 인용 없음.

순위 60에 검색됨: 1/(60+60) = 0.00833(나쁘지만 뭔가 있음)
검색되지 않음: 0 (게임 오버)

실험한 패턴

쿼리 유형별 검색 깊이 차이:

광범위 주제(스포츠): 최소 검색(38)
표준 주제(기술): 중간 검색(52)
특정 쿼리(스니커): 높은 검색(60)
기술 주제(AI): 최대 검색(65)

(ChatGPT가 일부 주제에 부스트 승수를 갖는지 의문. Perplexity처럼.)

최대 검색에도 순위 60은 보이지 않거나 거의 마지막.

실제로 작동하는 것

순위 60 어디서나 이기려는 시도는 잊기. 대신:

강한 자리 찾기

상위 20에 순위하는 2~3개 쿼리 변형 확인:

롱테일 키워드
특정 틈새
덜 경쟁적인 각도

수학 계산(재미있음)

경쟁력 있는 RRF 점수 0.02 도달:

순위 15에서 2회 노출: 2 × 0.0133 = 0.0266 ✓
순위 20에서 3회 노출: 3 × 0.0125 = 0.0375 ✓

토픽 클러스터 구축

다양한 각도를 목표로 하는 여러 페이지 생성. 일부는 충분히 높은 순위로 검색되고 다른 것은 그렇지 않음. 누적 효과가 중요.

결론

순위 60은 ChatGPT 웹 검색에 사실상 보이지 않음.

부질의당 38~64개 출처만 검색되고 이들이 여러 쿼리에 분산되므로, AI 생성 응답에 포함될 기회를 가지려면 대략 상위 10~20에 순위해야 한다.

승리 전략은 순위 60에서 55로 개선하는 것이 아니라, 상위 20에 도달할 수 있는 특정 쿼리를 찾아 지배하는 것.

SEO 전문가와 콘텐츠 제작자를 위한 핵심

평균 순위의 작은 개선에 집착 금지
상위 20에 도달할 수 있는 특정 쿼리 변형을 찾아 지배 시작
AI 검색 시대에는 모든 것에서 60위보다 세 특정 쿼리에서 10위가 낫다.

방법론

AYSIMA ChatGPT 확장 프로그램으로 테스트 실시. 결과는 각 검색 작업에 대해 ChatGPT가 실행하는 모든 쿼리에서 검색한 총 출처를 표시. 실제 쿼리 구조(단일 대 다중)는 명확히 결정할 수 없지만 표준 정보 검색 관행상 다중 쿼리 가능성이 높음.

다음 단계

저자는 LLM 재순위 지정 프로세스에 관해 작업 중이며 새로운 글 발행 예정.