ChatGPT 웹 모드에서 인용되기 위한 RRF 상위 N개 전략 (k≈60)
핵심
ChatGPT의 웹 검색 기능은 여러 부질의(sub-query)를 **역수 순위 융합(RRF, Reciprocal Rank Fusion)**으로 통합하여 최종 인용 목록을 선정한다. 페이지가 융합 점수 τ = 0.020 이상을 달성하면 최종 상위 60 인용 풀에 거의 항상 포함된다.
배경
저자는 AI 검색 최적화 회사인 AEOVision에 합류했으며, 이 글은 검색증강생성(RAG) 환경에서 LLM 인용을 위한 수학적 접근법을 다룬다. 이론상 상위 60이 RRF 계산에 최적이지만, 실제 ChatGPT는 쿼리에 따라 38~65개의 서로 다른 결과를 반환한다. 실무적으로는 상위 30을 목표로 하는 것이 더 현실적이다.
융합 수학
기본 공식
여러 부질의(M개)의 결과를 RRF로 융합할 때 페이지 d의 융합 점수:
$$S(d) = \sum_{i \in I(d)} \frac{w_i}{k + r_i(d)} \quad (k=60, w_i \approx 1)$$
- r_i(d): 부질의 i에서 페이지 d의 순위(1부터 시작, 부재 시 ∞)
- k=60: 순위 격차를 완화하는 감쇠 인자
- S(d): 페이지 정렬에 사용되는 융합 점수(상위 60 유지)
포함 임계값 설정
경쟁사 순위를 미리 알 수 없으므로 안전한 포함 임계값을 설정:
- 한 번 #1: 1/(60+1) = 0.01639
- 두 번 #40과 #50: 1/100 + 1/110 ≈ 0.01909
- 신뢰할 수 있는 목표: τ = 0.020
S(d) ≥ 0.020을 달성하면 일반적인 부질의 구조에서 융합 상위 60에 들어갈 가능성이 높다.
인용되기 위한 규칙(플러그 앤 플레이)
$$\boxed{\sum_{i \in I(d)} \frac{1}{60 + r_i(d)} \geq 0.020}$$
동등 가중치 기준 구체적 달성 방법:
- 2× 상위 40: 2/(60+40) = 2/100 = 0.020 ✅
- 3× 상위 90: 3/(60+90) = 3/150 = 0.020 ✅
- 1× #1 + 1× 상위 80: 1/61 + 1/140 ≈ 0.0235 ✅
- 4× 상위 140: 4/(60+140) = 4/200 = 0.020 ✅
균등 "상위 R" 단축식: 부질의 m개를 목표 순위 R에 포함시키려면 m ≥ ⌈0.020(60+R)⌉
| 목표 순위 | 필요 부질의 수 | |---------|------------| | R=40 | m≥2 | | R=90 | m≥3 | | R=140 | m≥4 |
최종 규칙: 상위 40 이내에 2회 이상 또는 상위 90 이내에 3회 이상 노출되면 경계 넘기 완료.
실무 운영 방법
A) 토픽 클러스터 구성(LLM이 검색할 가능성 높은 부질의)
8~16개의 부질의를 핵심 의도 중심으로 생성:
- 헤드 + 연도: "best X 2025"
- 헤드 + "top"
- 헤드 + "review(s)"
- 헤드 + "price(s)"
- 헤드 + "compare"/"vs"
- 헤드 + "near me"(지역)
- 단수/복수/엔티티 변형
- PAA 형태 질문: "What is…", "How to choose…", "Is X worth it…"
B) 각 부질의별 상위 N개 수집
각 부질의당 상위 60~100개 결과를 수집하고 순위 r_i(당신의 페이지, 부재 시 ∞) 기록. 더 깊은 순위는 점수에 큰 영향을 주지 않음.
C) 융합 점수 계산
$$S(d) = \sum_{i: r_i(d) < \infty} \frac{1}{60 + r_i(d)}$$
S(d)를 계산하고 0.020 미만이면 다음 선택지 중 택일:
- 두 변형을 상위 40으로 끌어올리기
- 세 변형을 상위 90으로 끌어올리기
- #1~#3 하나와 순위 80 이내 하나 조합
가장 싼 개선부터 우선 시행(이미 근처인 곳).
온페이지 "다중 목록 순위" 최적화
권한(domain authority)이 아니라 부질의 전반의 다중 노출을 최적화하는 것이 목표.
제목/H1과 리드 n-그램
선택한 변형의 지배적 SERP n-그램 반영(예: "best ___ in 2025", "top ___ for beginners"). 여러 목록 동시 승리 지원.
부제 패킹
각 변형에 정렬된 컴팩트 섹션 추가:
- H2: Best ___ for Beginners (2025)
- H2: ___ Price & Value
- H2: ___ vs Alternatives
- H2: How to Choose ___
검색 엔진에 정확한 앵커 제공, 불필요한 정보 추가 없음.
PAA 스타일 답변 블록
질문 형태와 정확히 일치하는 한 문단 정의식 블록("Is ___ worth it?", "How much does ___ cost?"). Q&A 변형 캡처.
연도 및 신선도 토큰
자연스러운 위치에 현재 연도 사용(제목, H1, 리드, 표 캡션). 테이블, FAQ 등을 주기적으로 순환.
엣지 스니펫
비교 테이블과 가격 테이블 추가. 보통 "vs"와 "price" 변형에 표면화되어 두 추가 목록 빠르게 확보.
최소 구현(시트 또는 코드)
부질의별 순위 r_i(i=1..M) 주어졌을 때:
S = sum(1 / (60 + r) for r in ranks if r is not None)
IN_TOP_60 = S >= 0.020
# False면 가장 개선하기 쉬운 변형부터 상위로 끌어올려 S 재계산
그리디 개선 헬퍼(사람 개입): 변형을 기준점(40, 90, 140)에 얼마나 근접한지로 정렬. 가장 가까운 것부터 개선, S 재계산.
빠른 참고표(k=60, τ=0.020)
| 노출 횟수 | 각 최대 순위 | 보장 S | |---------|-----------|-------| | 2× | ≤40 | 0.0200 | | 2× | ≤45 | 0.01905 | | 2× | ≤50 | 0.01818 | | 3× | ≤90 | 0.0200 | | 4× | ≤140 | 0.0200 | | 1× #1 + 1× ≤80 | — | ≈0.0235 |
ChatGPT & AYIMA 실험
AYIMA ChatGPT 확장 프로그램으로 RAG 출처를 추적하여 다양한 쿼리에 대해 ChatGPT가 실제로 검색하는 웹 결과 수를 측정했다.
주요 쿼리별 검색 결과 수
- "latest ai news" → 65개 출처
- "latest tech news" → 52개 출처
- "latest sport news" → 38개 출처
- "trending sneaker brands 2025" → 60개 출처
ChatGPT는 쿼리 유형에 따라 38~65개의 총 출처를 검색, 매우 동적.
하위 순위를 위한 현실 체크
검색 결과 60위 근처에 있을 경우 냉혹한 사실:
최선의 시나리오:
- 60개 이상의 결과를 검색하는 단일 쿼리면 순위 60은 수용 가능
- 실제로는 마지막이거나 거의 마지막 결과
- RRF 점수: <0.00833(미미함)
검색되지 않으면 0 — 인용 기회 없음.
RRF 점수의 중요성
RRF는 검색하는 것만 점수를 매긴다. 검색 윈도우에 없으면 점수 없음, 인용 없음.
- 순위 60에 검색됨: 1/(60+60) = 0.00833(나쁘지만 뭔가 있음)
- 검색되지 않음: 0 (게임 오버)
실험한 패턴
쿼리 유형별 검색 깊이 차이:
- 광범위 주제(스포츠): 최소 검색(38)
- 표준 주제(기술): 중간 검색(52)
- 특정 쿼리(스니커): 높은 검색(60)
- 기술 주제(AI): 최대 검색(65)
(ChatGPT가 일부 주제에 부스트 승수를 갖는지 의문. Perplexity처럼.)
최대 검색에도 순위 60은 보이지 않거나 거의 마지막.
실제로 작동하는 것
순위 60 어디서나 이기려는 시도는 잊기. 대신:
강한 자리 찾기
상위 20에 순위하는 2~3개 쿼리 변형 확인:
- 롱테일 키워드
- 특정 틈새
- 덜 경쟁적인 각도
수학 계산(재미있음)
경쟁력 있는 RRF 점수 0.02 도달:
- 순위 15에서 2회 노출: 2 × 0.0133 = 0.0266 ✓
- 순위 20에서 3회 노출: 3 × 0.0125 = 0.0375 ✓
토픽 클러스터 구축
다양한 각도를 목표로 하는 여러 페이지 생성. 일부는 충분히 높은 순위로 검색되고 다른 것은 그렇지 않음. 누적 효과가 중요.
결론
순위 60은 ChatGPT 웹 검색에 사실상 보이지 않음.
부질의당 38~64개 출처만 검색되고 이들이 여러 쿼리에 분산되므로, AI 생성 응답에 포함될 기회를 가지려면 대략 상위 10~20에 순위해야 한다.
승리 전략은 순위 60에서 55로 개선하는 것이 아니라, 상위 20에 도달할 수 있는 특정 쿼리를 찾아 지배하는 것.
SEO 전문가와 콘텐츠 제작자를 위한 핵심
- 평균 순위의 작은 개선에 집착 금지
- 상위 20에 도달할 수 있는 특정 쿼리 변형을 찾아 지배 시작
- AI 검색 시대에는 모든 것에서 60위보다 세 특정 쿼리에서 10위가 낫다.
방법론
AYSIMA ChatGPT 확장 프로그램으로 테스트 실시. 결과는 각 검색 작업에 대해 ChatGPT가 실행하는 모든 쿼리에서 검색한 총 출처를 표시. 실제 쿼리 구조(단일 대 다중)는 명확히 결정할 수 없지만 표준 정보 검색 관행상 다중 쿼리 가능성이 높음.
다음 단계
저자는 LLM 재순위 지정 프로세스에 관해 작업 중이며 새로운 글 발행 예정.