ChatGPT가 공개 접미사 목록을 이용해 도메인과 서브도메인을 구별하는 방식
핵심
공개 접미사 목록(Public Suffix List, PSL)은 웹상의 도메인 소유권 경계를 정의하는 Mozilla 유지 관리 목록으로, ChatGPT가 인용 및 도메인 처리 시스템에서 이를 활용 중이다.
공개 접미사 목록이 하는 역할
공개 접미사 목록은 한 주체의 제어가 끝나고 다른 주체의 제어가 시작되는 지점을 정의한다.
예시:
metehan.ai→ 등록 가능 도메인(registrable domain): metehan.aimetehan.vercel.app→ 등록 가능 도메인: vercel.appblog.metehan.ai→ 여전히 metehan.ai 소유
PSL은 어떤 도메인이 진정으로 독립적인지, 어떤 도메인이 공유 호스팅 플랫폼 아래에 존재하는지를 구별한다. 원래 브라우저의 쿠키 보안을 위해 만들어졌지만, 이제는 Chrome, Firefox, Meta, 인증서 발급 기관, 이메일 인증 시스템, 웹 크롤러 등 전 세계적으로 사용되는 기본 웹 인프라가 됐다.
ChatGPT에서의 PSL 활용 확인
ChatGPT의 브라우저 기반 소스 코드 분석을 통해 인용 및 도메인 처리 시스템에서 공개 접미사 목록 처리에 대한 명시적 참조가 발견됐다. 이는 추측이 아니라 ChatGPT 웹 인터페이스를 구동하는 클라이언트 측 JavaScript에서 검증 가능하다.
중요한 함의:
- 도메인 소유권이 귀속을 결정한다: 모든 Medium 게시물은 사용자 도메인이 아닌 medium.com에 권위를 부여한다
- 플랫폼 콘텐츠가 브랜드를 희석한다: Notion 페이지는 자신의 도메인 주체가 아닌 notion.site를 강화한다
- 진정한 소유권이 독립적 정체성을 만든다: yourname.ai는 명확하게 귀속 가능한 개별 출처를 확립한다
기술적 논리
대규모 웹 시스템, 브라우저, 검색 엔진, 스팸 필터, 보안 크롤러는 PSL 데이터를 사용해:
- URL을 소유권 경계별로 그룹화한다 (예: BBC의 news.bbc.co.uk와 sport.bbc.co.uk를 동일 주체로 취급)
- 서브도메인을 등록 가능 도메인으로 정규화한다
- 다중 테넌트 플랫폼(*.github.io, *.notion.site, *.vercel.app)의 악용을 방지한다
- 서브도메인 수준이 아닌 소유권 수준에서 권위를 귀속한다
플랫폼 콘텐츠 vs. 실제 소유권
호스팅 플랫폼에 게시하는 경우:
- 게시물: medium.com/@yourname/brilliant-insight
- PSL 등록 가능 도메인: medium.com
- 권위 귀속: 당신이 아닌 Medium의 코퍼스(corpus)
자신의 도메인을 소유한 경우:
- 게시물: yourname.ai/brilliant-insight
- PSL 등록 가능 도메인: yourname.ai
- 권위 귀속: 자신의 고유 주체
AI 시스템의 관점에서 이 두 가지는 구조적으로 다르다. 전자는 거대한 집계자에 기여하고, 후자는 개인의 별개 권위를 구축한다.
다중 테넌트 플랫폼이 목록에 포함되는 이유
PSL에는 github.io, notion.site, vercel.app, blogspot.com 같은 플랫폼이 포함되어 있다. 이는 사용자가 다른 사용자의 서브도메인에 대해 쿠키를 설정하거나 권위를 주장할 수 없도록 하기 위함이다.
하지만 이 보안 기능에는 결과가 있다:
- john.github.io와 jane.github.io는 PSL 관점에서 별개이다
- 그러나 둘 다 github.io 아래의 효과적인 소유권 경계 내에 존재한다
- PSL 데이터를 읽는 AI 시스템은 개별 사용자 서브도메인이 아닌 github.io 수준에서 신호를 집계할 수 있다
- john.com을 소유하면 이러한 모호함이 완전히 제거된다
AI 검색 최적화(AEO)를 위한 함의
이 발견이 AI 가시성에 작업하는 실무자들을 위해 만드는 사고층:
-
소유권 경계는 구조적으로 중요하다 PSL이 제어의 시작점을 정의한다. PSL 경계 밖의 콘텐츠는 당신에게 완전히 귀속되지 않을 수 있다.
-
도메인 아키텍처는 주체 인식에 영향을 미친다 PSL 데이터를 사용하는 AI 시스템은 yourname.ai를 별개 주체로 보지만, yourname.medium.com은 Medium 콘텐츠로 등록한다.
-
플랫폼 콘텐츠가 분산된 권위를 만든다 Substack이나 LinkedIn의 최고 작업물은 자신의 권위 그래프가 아닌 그 플랫폼의 권위 그래프를 구축한다. (Substack과 LinkedIn은 PSL 목록에 없다. 이것이 작동하지 않을 것임을 의미하지는 않는다.)
-
편의의 대가는 귀속의 손실이다 호스팅 플랫폼은 쉬운 발행을 제공하지만 AI 시스템에서 소유권이 모호해지는 구조적 비용이 따른다.
순위 아래의 층
공개 접미사 목록은 순위 결정 요소가 아니다. 이는 인프라다.
이는 의미론 층 아래에 위치하여, 알고리즘이 무엇을 표시할지 결정하기 전에 누가 무엇을 소유하는지를 정의한다.
전통 SEO에서는 크롤 가능성, 링크, 콘텐츠 품질에 최적화한다. AEO에서는 의미론적 소유권 경계, 즉 한 출처가 끝나고 다른 출처가 시작되는 기술적 선도 고려해야 할 수 있다.
ChatGPT의 PSL 데이터 사용은 이러한 경계가 우발적이지 않음을 시사한다. 이는 구조적이다.
핵심 요점
공개 접미사 목록은 더 이상 단순한 브라우저 보안 메커니즘이 아니다. 이는 AI 검색 시스템에서 권위 귀속을 형성할 수 있는 경계 정의 층이다.
임베딩과 리랭킹(reranking)이 어떤 콘텐츠가 표시될지를 결정하는 반면, PSL 데이터는 누가 인정받을지를 결정할 수 있다.
링크 기반 검색을 AI 기반 발견이 대체하는 생태계에서, 등록 가능 도메인을 소유하는 것은 단순한 모범 사례가 아니다. 이는 기본 구조다.
기술 참고사항
검증: ChatGPT의 PSL 사용은 브라우저 DevTools를 통해 네트워크 요청 및 클라이언트 측 JavaScript 처리를 검사하면 관찰할 수 있다. PSL 데이터 구조를 참조하는 도메인 정규화 함수를 찾아보라.
PSL 유지: 공개 접미사 목록은 Mozilla가 유지 관리하며 커뮤니티 기여를 통해 정기적으로 업데이트된다. 정식 버전은 publicsuffix.org에서 호스팅된다.