인문정보학 온톨로지 설계 가이드라인
김현
한국학중앙연구원 인문정보학 교수
온톨로지란? What is Ontology
- ‘온톨로지’란 정보화의 대상이 되는 세계를 전자적으로 표현할 수 있도록 구성한 데이터 기술 체계이다. 원래 온톨로지라는 말은 철학에서 ‘존재론’이라고 번역되는 용어로서 ‘존재에 대한 이해를 추구하는 학문’의 의미를 갖는 말이었다. 그러한 용어가 정보과학 분야에서 중요한 개념으로 등장하게 된 것은 인간이 세계를 이해하는 틀과 컴퓨터가 정보화 대상(콘텐츠)을 이해하는 틀 사이에 유사성이 있다고 보았기 때문이다. 그 틀은 바로 대상을 구성하는 요소들에 대응하는 개념들과 그 개념들 간의 연관 관계이다.[1] 넓은 의미에서는 모든 정보화의 틀이 다 온톨로지일 수 있겠지만, 대상 자원을 ‘클래스’(class)로 범주화하고, 각각의 클래스에 속하는 개체(individuals)들이 공통의 ‘속성’(attribute)을 갖도록 하고, 그 개체들이 다른 개체들과 맺는 ‘관계’(relation)를 명시적으로 기술하는 것이 가장 일반적인 온톨로지 설계 방법이라고 할 수 있다. (김현, 『디지털 인문학 입문』(HUEBOOKS, 2016) p. 164)
- 정보기술 분야에서 말하는 ‘온톨로지(ontology)’에 대한 가장 일반적인 정의는 그루버(Gruber, Thomas. 1959~ )가 말한 ‘명시적 명세화의 방법에 의한 개념화’(explicit specification of a conceptualization)이다.[2] 여기서 ‘개념화’(conceptualization)라는 것은 정보화하고자 하는 대상 세계를 일정한 체계 속에서 파악하는 것, 예를 들면 그 세계에 무엇이 있고, 그것은 어떤 속성을 품고 있으며, 그것들 사이의 관계는 무엇인가 하는 일정한 질문의 틀 속에서 대상 세계를 이해하는 방식이라고 할 수 있다. ‘명세화’(specification)란 대상 세계에 존재하는 개체, 속성, 관계 등을 일목요연한 목록으로 정리하는 것, 그리고 ‘명시적’(explicit)이라는 것은 그 정리된 목록을 사람뿐 아니라 ‘컴퓨터가 읽을 수 있도록’(machine readable) 한다는 것이다. (같은 책 p. 164)
온톨로지 설계 용어 Terms for Ontology Design
온톨로지 구성 요소
(권장 용어) |
용도[3] | Web Ontology Language
(OWL) |
---|---|---|
Class, 클래스 | 공동의 속성을 가진 개체들을 묶는 범주
a group of individuals that belong together because they share some properties. |
owl:Class |
Individual, 개체 | 클래스에 속하는 개체
Instances of classes |
owl:NamedIndividual |
Relation, 관계 | (같거나 다른 클래스에 속하는) 개체들 사이의 관계
relationships between pairs of individuals |
owl:ObjectProperty |
Attribute, 속성 | 개체가 속성으로 갖는 데이터 값
relationships from individuals to data values |
owl:DatatypeProperty |
Relation Attribute, 관계 속성 | 관계 정보에 부수되는 속성
attributes related to relations |
N/A in OWL
Can be used when you implement Graph Database with Cypher Query Language. |
Domain, 정의역 | 특정 ObjectProperty 또는 DatatypeProperty의 주어가 될 수 있는 클래스를 한정
A domain of a property which limits the individuals to which the property can be applied |
rdfs:domain |
Range, 치역 | 특정 ObjectProperty의 목적어가 될 수 있는 클래스를 한정
The range of a property limits the individuals that the property may have as its value |
rdfs:range |
이름 공간(Namespace)
※ 온톨로지의 모든 구성 요소에는 그것을 유일하게 식별할 수 있는 식별자가 부여된다. 식별자의 형식: '이름 공간 접두어:'+'이름 공간 안에서의 식별자' ※ 이름공간(namespace)이란 하나의 이름이 단 하나의 개체만을 가리키는 범위를 추상적으로 상정한 것이다. 이름 공간에도 이름이 부여되는데 인터넷 상에서 유일성을 보장하기 위해서 URI 형식을 취한다. 이름 공간(namespace)의 URI는 그저 이름일 뿐이며, 그 주소에 해당하는 사이트가 인터넷 상에 꼭 있어야 하는 것은 아니다.
온톨로지 설계 요소(클래스, 관계, 속성 등의 정의) 이름 공간
개체(Individual)의 이름 공간
※ 개체 일반의 이름 공간
※ 특정 큐레이션 프로젝트의 개체를 위한 이름공간 (학생들의 연구 프로젝트에 적용)
※ 분야별 한국학 용어(Classified Korean Studies Terms, 한국학중앙연구원 디지털인문학연구소에서 고유한 식별자를 부여한 한국학 학술용어)의 이름공간.
인물: 인물/기관
공간: 지명/장소/시설명
사건: 사건/행사
시간: 시대/시간범위/시점
문헌: 고도서/고문서/고기록
사물: 물품/도구/동식물
개념: 개념/용어
문화유산: 지정문화재/등록문화재
참고문헌: 현대 문헌
특정 데이터 모델의 이름 공간
Data Model Name | Prefix | Namespace | Contributor |
---|---|---|---|
한국학 데이터 일반 | ksdm: | xmlns:ksdm="http://dh.aks.ac.kr/ontologyes/ekc#" | 한국학중앙연구원 인문정보학교실 |
한국 바로 알리기 지식 정보 Understanding Korea Project |
ukdm: | xmlns:ukdm="http://dh.aks.ac.kr/ontologies/ukdm#" | 김현, 한국학중앙연구원 한국바로알리기사업실 |
한글 문화 유산 | hhdm: | xmlns:hhdm="http://digerati.aks.ac.kr/terms/hhdm#" | 김현, 국립한글박물관 |
한국 기독교 선교 문화 유산 | chdm: | xmlns:chdm="http://digerati.aks.ac.kr/terms/chdm#" | 김현, 백종구, 김바로 |
문중 고문서 아카이브 | hddm: | xmlns:hddm="http://digerati.aks.ac.kr/terms/fddm#" | 김현, 김하영, 류인태 |
- ↑ 김현, 「한국 고전적 전산화의 발전 방향 - 고전 문집 지식 정보 시스템 개발 전략 -」, 『민족문화』 28, 민족문화추진회, 2005
- ↑ Gruber, ‘A Translation Approach to Portable Ontology Specifications’, Knowledge Systems Laboratory Technical Report KSL 92-71, Stanford University, 1992
- ↑ OWL Web Ontology Language Overview, W3C Recommendation