← 목록으로

AI 검색 순위에서 콘텐츠 신선도 편향: 설정 증거와 실험 연구

SEOmetehanai.substack.com조회수 0248일 전

핵심

ChatGPT의 생산 설정에 신선도 점수 활성화(use_freshness_scoring_profile: true)가 하드코딩되어 있고, 와세다대학 연구팀이 이를 실험으로 정량화했다. 결과적으로 권위성 있는 기존 콘텐츠가 낮은 품질의 최신 콘텐츠에 밀려나는 현상이 확인되었다.

설정 증거 (ChatGPT 구성 파일)

저자가 2025년 8월 발견한 ChatGPT 설정:

결론: 2022년의 가장 권위 있는 가이드도 더 낮은 품질의 최신 자료에 의해 알고리즘적으로 매장된다.

실험 증거 (와세다대학 연구)

와세다대학 연구팀이 GPT-4o, GPT-4, GPT-3.5, LLaMA-3, Qwen-2.5 등 7개 주요 모델을 대상으로 통제 실험 시행:

순위 이동 규모

순위 구간별 시간 편향 패턴

영향 사례

모델별 신선도 편향 저항도

신선도 편향에 강한 모델:

신선도 편향에 취약한 모델:

핵심 교훈: 모델 크기보다 아키텍처가 중요. 작은 Qwen 모델들이 훨씬 큰 LLaMA 모델보다 나은 성능을 보였다.

신선도 편향의 영향 범위

실무 대응 전략

구조적 질문

현재 인센티브는 "새로울수록 낫다"를 선호한다. 이는 진실이 아니고, 권위도 아니다. 단지 시간일 뿐이다.

향후 전망

단기(6~12개월): 발행일자 게임 확산. "매일 업데이트" 배지가 웹에 범람 중기(1~2년): AI 제공업체들이 "실질적 업데이트 감지" 기술 도입 장기(3년 이상): 쿼리 종속적 시간 모델 등장 — 산업이 이를 요구한다면

그렇지 않으면 품질과 무관하게 오래된 지식이 AI 검색에서 사라질 수 있다.

발견 타임라인

AI 검색에서 상위 10개 순위가 1~5년 더 새로워질 수 있고, 개별 문단은 95개 순위를 뛸 수 있으며, 관련성 판정 4개 중 1개가 발행일자만으로 뒤바뀐다. 완벽함을 이기는 것은 업데이트 빈도다. 실제로 업데이트 빈도가 유일하게 중요한 것이다.