에이전트 웹 시대의 온톨로지: 의미를 잃지 않는 AI 행동을 위한 기반

wordlift.io조회수 255일 전

핵심

온톨로지는 원래 인간 지식을 기계가 이해하도록 만들기 위해 만들어졌으나, AI 에이전트 시대에는 그 역할이 확대된다. 이제 온톨로지는 형식적 상호운용성 표준에서 벗어나 AI 에이전트가 검색, 검증, 기억, 계획, 행동을 할 때 의미를 잃지 않게 하는 런타임 구조가 되어야 한다.

온톨로지의 역사적 진화

기계가 읽을 수 있는 의미의 추구

온톨로지의 고전적 정의는 Tom Gruber, Nicola Guarino, Aldo Gangemi 등의 연구에 기반한 "공유된 개념화의 형식적이고 명시적인 명세"다. 이는 도메인의 암묵적 구조를 명시적으로 만들고, 인간의 암묵적 지식을 기계가 읽을 수 있는 모델로 변환한다.

이 비전은 Tim Berners-Lee, James Hendler, Ora Lassila가 2001년 Scientific American 기고문에서 제시한 시맨틱 웹의 중심이 되었다. 그들은 정보가 명확한 의미를 담아야 컴퓨터와 인간이 효과적으로 협업할 수 있다고 주장했다.

도구와 기술의 발전

RDF: 그래프 모델 제공
RDFS, OWL: 어휘, 클래스, 속성, 공리(axiom)를 제공
SKOS: 통제 어휘(controlled vocabulary)를 링크드 데이터로 공개하기 용이하게 함
SHACL: RDF 그래프 구조를 검증하는 실질적 방법 도입

이 기술들은 IRI를 통한 식별자, 명시적 관계, 분산 어휘, 추론(inferencing), 링크드 데이터, 재사용 가능한 지식 모델 같은 강력한 개념들을 만들어냈다.

그러나 온톨로지 엔지니어링은 느리고, 전문 지식을 필요로 하며, 인간이 표현하고 싶은 것과 프로덕션 시스템이 운영할 수 있는 것 사이의 간극을 만들었다. 그 사이에 대형언어모델(LLM)이 등장했다.

LLM 시대의 온톨로지 엔지니어링 변화

LLM이 온톨로지 엔지니어링을 가능하게 하는 방식

대형언어모델은 온톨로지가 탄생하는 재료인 언어를 처리할 수 있다. LLM은:

문서를 읽고 용어를 추출
클래스를 제안하고 정의를 제시
관계 후보를 식별하고 능력 질문(competency questions)을 생성
문서화를 작성하고 모델이 도메인의 의도된 의미를 포착하는지 검증

이것이 온톨로지 엔지니어를 불필요하게 만드는 것은 아니다. 역할이 변한다. 온톨로지 엔지니어는 수동 모델러에서 의미 워크플로우 조율자로 변모한다: 추출을 안내하고, 제안을 검토하고, 모호함을 해결하고, 어느 도메인 부분이 형식화를 필요로 하는지 결정한다.

최근 LLM 지원 온톨로지 엔지니어링 연구는 온톨로지 생명주기의 거의 모든 단계에 걸쳐 있다:

LLMs4OL: LLM이 온톨로지 학습(ontology learning) 작업을 지원하는 방식 연구
OntoGPT: 프롬프트, LLM, 온톨로지 기반 접지(grounding)를 결합해 텍스트에서 구조화된 지식 추출
Agent-OM: LLM 에이전트가 계획, 메모리, 도구를 통해 온톨로지 매칭을 지원하는 방식 탐색

온톨로지 엔지니어링은 대화형, 반복적, 반자동화되지만, 더 깊은 변화는 온톨로지가 어떻게 구성되는가에 있다.

논리 중심에서 에이전트 친화적 온톨로지로

형식 논리의 한계

기존 온톨로지 스택은 형식 정확성(클래스, 속성, 도메인, 범위, 제약, 카디널리티, 공리)을 우선했다. 이는 여전히 필수다. 그러나 대형언어모델은 형식 논리만으로는 의미를 잘 처리하지 못한다. LLM은 토큰, 예시, 설명, 어휘 단서, 임베딩(embedding), 도구 스키마, 검색된 증거에서 의미를 도출한다.

이것이 온톨로지 문법을 하이브리드 형태로 밀어낸다: 부분 형식 모델, 부분 언어 인터페이스.

자연언어 필드의 중요성

각 클래스, 속성, 엔티티, 형태는 점점 더 풍부한 자연언어 필드의 이점을 본다:

rdfs:comment
skos:definition
skos:scopeNote
skos:example
schema:description
schema:abstract
dcterms:description

클래식 온톨로지에서 주석은 인간이 클래스를 이해하도록 돕는다. 에이전트 지향 온톨로지에서 같은 주석은 검색, 추출, 명확화, 도구 선택, 접지(grounding), 생성을 영향을 미친다. 온톨로지는 기호 체계와 언어 모델 둘 다 읽을 수 있게 된다.

렉시컬 계층과 의미 중심 검색

검색의 새로운 역할

Microsoft의 Web IQ 연구가 최근 주장한 바와 같이, AI 시스템의 품질은 생성 출력을 신뢰할 수 있고 관련성 있으며 검증 가능한 정보에 연결하는 능력에 점점 더 달려 있다. 검색은 에이전트가 현실과의 정렬을 유지하고 신뢰할 수 있는 결정을 내리는 메커니즘이 되어가고 있다.

형식 온톨로지는 엔티티와 관계의 의미를 정의하지만, 에이전트는 자연언어에서 그 엔티티들을 발견하고, 지원 증거를 검색하고, 검색된 정보를 도메인의 구조화된 이해로 다시 연결해야 한다. 과제는 **의미 모델링만이 아니라 의미 접지(semantic grounding)**다.

렉시컬 그래프 계층의 필요성

WordLift의 작업에서 형식 그래프와 에이전트 사이에 앉는 추가 계층의 필요성이 발견되었다: 렉시컬 그래프와 검색 계층.

형식 온톨로지: 것들의 의미를 정의
렉시컬 계층: 그것들이 언어에서 어떻게 나타나는지, 어떻게 언급되는지, 어떻게 검색되는지, 어떻게 혼동되는지, 증거와 어떻게 연결되는지를 정의

AI 에이전트는 보통 SPARQL 쿼리에서 시작하지 않는다. 사용자 질문, 작업, 상품 설명, 대화 조각에서 시작한다. 에이전트는 언어에서 엔티티로, 엔티티에서 증거로, 증거에서 접지된 답변이나 행동으로 이동해야 한다.

임베딩 텍스트의 지정

WordLift의 SEOVOC에서는 seovoc:embeddingText와 seovoc:embeddingValue 같은 속성을 도입했다:

seovoc:embeddingText: 엔티티를 위해 임베딩되어야 하는 텍스트 표현을 정의
seovoc:embeddingValue: 결과 벡터 표현을 저장하거나 참조

온톨로지는 더 이상 엔티티만 설명하는 것이 아니다. 엔티티가 벡터 공간에 어떻게 들어가야 할지를 설명한다. 어떤 언어가 메모리가 되어야 하고, 어떤 의미 신호가 보존되어야 하고, 검색된 증거가 그래프의 정준 엔티티로 다시 연결되어야 하는지를 시스템에 지시한다.

온톨로지는 메모리 형성의 지시사항을 담기 시작한다.

벡터 검색만으로는 메모리가 아니다. 벡터 검색은 유사성을 검색한다. 온톨로지 메모리는 신원, 유형, 출처, 맥락, 시간, 작업과 관계가 있는 유사성을 검색한다. 메모리 계층은 렉시컬, 기호, 벡터 표현이 서로를 강화하는 구조화된 검색 환경이어야 한다.

검증: 부서지기 쉬운 부정에서 실행 가능한 제약으로

고전적 온톨로지의 부정 문제

클래식 온톨로지 엔지니어링은 종종 부정 제약을 사용한다: 분리된 클래스, 보완 클래스, 부정 속성 주장, 폐쇄 세계(closed-world) 검증 패턴. 이들은 형식 추론을 위해 여전히 가치 있다. 그러나 생성 맥락에서 LLM이 안정적으로 처리하기 어렵다.

부정이 많은 제약은 생성 맥락에서 느슨하게 해석되지 말고 검증 계층에서 실행되어야 한다.

에이전트 지향 온톨로지는 세상을 더 많이 가능한 것, 예상되는 것, 허용되는 것, 필수인 것 측면에서 표현한다. 부정은 SHACL 검증, 정책 확인, 능력 질문 테스트, 결정론적 평가 파이프라인에 속한다.

SHACL의 확장된 역할

SHACL은 RDF 그래프 검증 방법으로 시작했지만 그 역할이 확대되고 있다. SHACL 1.2 명세는 명시적으로 형태(shapes)를 다음에 유용하다고 명시한다:

검증
추론
도메인 모델링
에이전트에 정보를 제공할 온톨로지 생성
사용자 인터페이스 구축
코드 생성
데이터 통합

SHACL 저자 Veronika Heimsbakk의 강조에 따르면, 온톨로지를 운영 가능하게 만드려면 의미 자산을 실행 가능한 명세로 취급해야 한다. 온톨로지는 데이터가 어떻게 생성, 교환, 검증, 응용프로그램과 에이전트에 의해 소비되는지를 안내하는 실질적 도구가 된다.

OWL: 세상의 개념 구조를 정의
SHACL: 실무에서 유효하고 사용 가능하며 실행 가능한 데이터가 무엇인지 정의

AI 에이전트에게 이 구분은 필수적이다.

온톨로지, 도구, 에이전트 워크플로우

그래프의 여러 유형

온톨로지 디자인은 에이전트 워크플로우 디자인에 더 가까워지고 있다. LangGraph 같은 프레임워크는 에이전트 시스템을 상태, 노드, 엣지의 그래프로 표현한다. 온톨로지 엔지니어에게는 친숙하지만, 같은 종류의 그래프는 아니다.

온톨로지 그래프: 도메인을 설명—엔티티, 유형, 관계, 의미
렉시컬 그래프: 엔티티의 발견을 용이하게 하고 에이전트가 언어와 언급에서 지식 그래프에 표현된 정준 개념으로 이동하도록 도움
행동 그래프: Schema.org와 GS1 Web Vocabulary 같은 어휘에 표현된 명사와 Universal Commerce Protocol 같은 프로토콜을 통해 노출된 동사와 능력을 연결. 작업(tasks), 도구, 상태, 전환, 결정, 재시도, 결과, 에이전트가 그래프의 엔티티에 대해 수행할 수 있는 행동을 설명

새로운 패턴: 온톨로지-도구 컴파일

새로운 강한 신호 중 하나는 **온톨로지-도구 컴파일(ontology-to-tools compilation)**의 출현이다. LLM에 자유로운 형식의 프롬프트를 주고 구조화된 데이터를 생성하도록 요청하는 대신, 온톨로지를 생성 과정 중에 의미 제약을 강제하는 호출 가능한 도구로 컴파일할 수 있다. 온톨로지는 실행 가능한 계약(executable contract)이 된다.

에이전트 시스템에서 이것은 Model Context Protocol(MCP) 같은 프로토콜과 자연스럽게 연결된다. MCP 도구는 모델에 스키마, 설명, 호출 가능한 작업을 노출한다. 이러한 도구들이 온톨로지에서 생성되거나 정렬되면, 에이전트는 단순히 도구가 존재한다는 것뿐만 아니라 그것이 무엇을 의미하는지, 어떤 엔티티 유형에 대해 작동하는지, 어떤 제약이 적용되는지, 결과가 지식 그래프를 어떻게 업데이트해야 하는지를 안다.

온톨로지를 메모리로

대형언어모델의 상태 부재

대형언어모델은 기본적으로 무상태(stateless)다. RAG 시스템은 검색을 더하지만, 대부분 검색은 여전히 정적 문서와 유사도 검색을 기반으로 한다. 장기간 존속하는 에이전트에게는 충분하지 않다. 에이전트는 시간이 지남에 따라 변화하고, 신원을 보존하고, 이벤트를 추적하고, 현재 지식과 낡은 지식을 구분하고, 사실을 증거에 연결하는 메모리가 필요하다.

최근 에이전트 메모리 연구는 **의미 메모리(semantic memory)**와 **에피소드 메모리(episodic memory)**를 점점 더 구분한다:

의미 메모리: 안정적 지식—엔티티, 개념, 관계, 사실
에피소드 메모리: 경험—이벤트, 관찰, 상호작용, 결정, 시간이 지남에 따른 변화

AriGraph 같은 연구는 LLM 에이전트를 위한 그래프 기반 메모리 구조를 탐색하고, Zep 같은 시스템은 엔터프라이즈 에이전트를 위한 메모리 계층으로 시간 지식 그래프를 사용한다.

온톨로지는 둘 다 조직할 수 있다. 어떤 종류의 메모리가 존재하는지, 엔티티와 어떻게 관련되는지, 어떻게 타임스탬프되는지, 어떤 출처를 가지는지, 어떻게 검색되어야 하는지를 정의한다.

구조화된 메모리 환경으로서의 온톨로지

모델에게 큰 평면적 맥락을 소비하도록 요청하는 대신, **반복적 언어 모델링(recursive language modeling)**은 그래프를 탐색할 환경으로 취급한다. 모델은 작업을 분해하고, 첫 계층의 맥락을 검색하고, 새 엔티티나 간극을 식별하고, 정제된 질문으로 그래프에 다시 들어가고, 충분히 접지된 정보를 가질 때까지 계속한다.

온톨로지는 재귀를 안내한다: 어떤 엔티티 유형이 중요한지, 어떤 관계를 따를 수 있는지, 어떤 증거가 허용되는지, 언제 답변이 충분히 접지되었는지를 모델에게 말해준다. 모델이 가장 가까운 청크를 찾는 것이 아니라 구조화된 메모리 환경을 탐색하고 있기 때문에 검색 품질이 향상된다.

엣지 디바이스로의 지식 이동

이는 또한 지식을 엣지 디바이스로 가져오고, 구조화된 메모리를 휴대폰에서 직접 실행되는 소형 언어 모델에 더 가깝게 밀어내는 것을 도와주고 있다. 예를 들어 WordLift의 Google AI Edge GraphQL 통합은 엣지 AI 시나리오에서 온톨로지 기반 지식 검색을 가능하게 한다. 이 설정에서 온톨로지는 재귀를 안내한다. 어떤 엔티티 유형이 중요한지, 어떤 관계를 따를 수 있는지, 어떤 증거가 허용되는지, 어떤 제약이 적용되는지, 언제 답변이 충분히 접지되었는지를 모델에게 말해준다.

온톨로지를 훈련과 정렬 자산으로

온톨로지는 특히 작은, 비공개, 도메인 특화 모델을 위한 훈련과 정렬 자산이 되고 있다. 원문서만 훈련하는 대신, 엔터프라이즈는 온톨로지를 사용해 구조화된 훈련 자료를 제공할 수 있다:

정준 개념과 정의
엔티티 유형과 관계 패턴
예시와 분류체계(taxonomies)
능력 질문과 추론 경로
검색과 검증 추적

이것이 온톨로지를 **커리큘럼(curriculum)**으로 만든다. 소형 언어 모델은 도메인의 개념 구조에 대해 훈련 또는 정렬될 수 있다. 무엇이 중요한지, 용어가 무엇을 의미하는지, 개념이 어떻게 관련되는지, 엔티티를 어떻게 분류하는지, 증거를 어떻게 검색하는지, 그래프에 부합하는 출력을 어떻게 생성하는지를 배울 수 있다.

Large Ontology Models 연구는 이 방향을 가리키고 있으며, 온톨로지-언어 쌍, 지시 튜닝(instruction tuning), 온톨로지 기반 추론이 엔터프라이즈 지식 관리와 도메인 특화 모델 행동을 어떻게 지원할 수 있는지를 탐색한다.

이는 **수직 에이전트(vertical agents)**에 특히 중요하다. 많은 엔터프라이즈 설정에서 목표는 일반 지능을 구축하는 것이 아니라 신뢰할 수 있는 도메인 행위자를 만드는 것이다: SEO 에이전트, 상품 데이터 에이전트, 조달 에이전트, 법률 접수 에이전트, 의료 부호화 보조 기구, 브랜드 인텔리전스 에이전트. 이러한 시스템에서 온톨로지는 단순한 참조 모델이 아니다. 훈련 스캐폴드(training scaffold)와 정렬 계층이다.

계층화된 온톨로지 스택

에이전트 시대의 온톨로지는 계층화되어 있다. 도메인 계층이 여전히 필요하지만 그것만으로는 충분하지 않다. 실용적 스택은 다음과 같다:

도메인 계층: 엔티티, 클래스, 속성, 공리, 개념적 약속(conceptual commitments)
데이터 계층: 식별자, 출처, 신선도(freshness), 신뢰, 버전 관리, 시간적 타당성
렉시컬 및 검색 계층: 레이블, 별칭, 정의, 임베딩 텍스트, 임베딩 값, 증거 발견 신호
작업 계층: 목표, 능력 질문, 워크플로우, 예상 결과
도구 계층: 호출 가능한 함수, API, MCP 도구, 선행 조건(preconditions), 사후 조건(postconditions), 권한(permissions)
메모리 계층: 의미 사실, 에피소드 이벤트, 시간적 상태, 반복적 검색 경로
검증 계층: SHACL 형태, OWL 일관성, 정책 확인, 능력 질문 테스트
거버넌스 계층: 소유권, 감시 가능성(auditability), 데이터 계보(lineage), 접근 제어, 규정 준수 제약
학습 계층: 예시, 그래프-텍스트 쌍, 미세 조정(fine-tuning) 데이터셋, 검색 추적, 평가 결과

온톨로지 디자인의 중심 질문

이 스택은 온톨로지 디자인의 중심 질문을 바꾼다:

에이전트가 정확도를 극대화하고, 토큰을 효율적으로 사용하고, 검사 가능하게 유지하고, 이 도메인 내에서 지식을 안정적으로 검색, 검증, 유지, 적용하기 위해 필요로 하는 정보, 제약, 맥락 신호, 메모리 구조는 무엇인가?

온톨로지 디자인 실무의 변화

실질적 디자인 원칙

풍부한 자연언어 표면(Rich natural-language surfaces)
- 모든 중요 클래스와 속성은 레이블, 정의, 초록, 예시, 사용 노트를 가져야 한다. 이들은 모델 인터페이스의 부분이다.
논리 의미론을 에이전트 지시사항으로부터 분리
- 형식 공리는 형식으로 유지. 에이전트 대면 설명은 개념이 어떻게 사용되는지, 언제 적용되는지, 어떤 증거가 그것을 지원하는지, 인접한 개념과 어떻게 다른지를 설명.
임베딩 텍스트를 의도적으로 디자인
- 벡터 공간에 들어가는 텍스트는 큐레이션되고, 정준이고, 필요하면 다국어이고, 그것이 표현하는 엔티티와 연결되어야 한다.
부정을 운영화(Operationalize negation)
- 모델이 맥락에서 복잡한 부정 논리를 해석하도록 의존하지 말 것. 부정 제약을 SHACL, 테스트, 결정론적 검증 계층으로 옮기기.
온톨로지 모듈을 워크플로우로 맵핑
- 에이전트가 작업을 수행해야 하면, 온톨로지는 관련된 엔티티, 증거, 도구, 상태, 제약을 노출.
능력 질문을 평가 자산으로 변환
- 그것들은 단순한 요구사항이 아니다. 온톨로지와 에이전트에 대한 회귀 테스트.
생성된 모든 사실에 출처를 첨부
- 에이전트는 무엇이 참인지뿐 아니라 그것이 어디에서 왔는지, 언제 관찰되었는지, 다른 사실과 어떻게 관련되는지, 여전히 타당한지를 알아야 한다.
메모리를 위해 디자인
- 시간, 이벤트, 업데이트, 사용자 선호, 반복적 검색 경로를 모델화.
온톨로지를 훈련 자산으로 취급
- 더 작은 모델이 도메인에서 안정적으로 행동하길 원한다면, 온톨로지는 예시, 추적, 구조화된 커리큘럼을 생성.

결론: 도메인 의미론으로 지능 확장하기

온톨로지 디자인의 진화는 기계가 읽을 수 있는 의미론(machine-readable semantics)에서 에이전트가 운영할 수 있는 의미론(agent-operable semantics)으로의 이동으로 이해할 수 있다.

기계가 읽을 수 있는 의미론: 소프트웨어를 위해 지식을 명시적으로 만듦
에이전트가 운영할 수 있는 의미론: 검색, 추론, 생성, 도구 호출, 메모리 업데이트, 행동을 하는 시스템이 지식을 사용 가능하게 함

이것이 중요한 이유는 대형언어모델이 강력하지만 제한적이기 때문이다. 복잡한 코딩 작업을 풀 수 있으면서도 기본적 상식 테스트에 실패할 수 있다. "Car Wash Test"가 이를 완벽하게 포착한다: AI 지능은 불규칙하다. 어떤 영역에서는 인상적이고 다른 영역에서는 놀랍도록 부서지기 쉽다.

이 부서지기 쉬움은 엔터프라이즈 환경에서 중대해진다. 큰 AI 랩은 계속해서 범용 지능을 개선하겠지만, 모든 상품 카탈로그, 조달 프로세스, 규정 준수 규칙, 편집 정책, 의료 워크플로우, 금융 분류체계, 지역 비즈니스 제약을 모델링할 수 없다.

무수한 현실 사용 사례가 여전히 미해결로 남아 있다. 모델이 쓸모없어서가 아니다. 그렇지 않다. 그러나 지능만으로는 충분하지 않다. 에이전트는 것들이 무엇을 의미하는지, 어떤 행동이 허용되는지, 어떤 증거가 허용되는지, 어떤 메모리가 지속되어야 하는지, 어떤 제약이 강제되어야 하는지, 결과를 언제 신뢰할 수 있는지를 알기 위해 도메인 의미론이 필요하다.

이것이 온톨로지가 필수적인 지점이다. 에이전트가 할 수 있는 것을 확장하는 자연적 방식과 그것을 하는 동안 우리가 얼마나 멀리 신뢰할 수 있는지를 정의하는 실질적 방식을 제공한다.

온톨로지는 다음을 제공한다:

신원: 언어가 만드는 변동에 대항해
구조: 임베딩이 제공하는 유사성에 대항해
검증: 생성이 제공하는 유창함에 대항해
출처: 답변이 증거를 필요로 할 때
메모리: 맥락 윈도우가 사라질 때
거버넌스: 에이전트가 행동할 권한이 필요할 때

온톨로지 없이 에이전트는 임기응변한다. 온톨로지와 함께 에이전트는 운영한다.

온톨로지는 더 이상 단순한 도메인의 지도가 아니다. AI 에이전트의 제어 평면(control plane): 의미, 증거, 행동, 메모리, 신뢰를 정의하는 계층이다.

시맨틱 웹에서 온톨로지는 기계가 세상을 이해하도록 도왔다.

에이전트 웹에서 온톨로지는 에이전트가 의미를 잃지 않으면서 세상에서 행동하도록 도운다.