인문정보학 온톨로지 설계 가이드라인
DH 교육용 위키
김현
한국학중앙연구원 인문정보학 교수
목차
온톨로지란? What is Ontology
- ‘온톨로지’란 정보화의 대상이 되는 세계를 전자적으로 표현할 수 있도록 구성한 데이터 기술 체계이다. 원래 온톨로지라는 말은 철학에서 ‘존재론’이라고 번역되는 용어로서 ‘존재에 대한 이해를 추구하는 학문’의 의미를 갖는 말이었다. 그러한 용어가 정보과학 분야에서 중요한 개념으로 등장하게 된 것은 인간이 세계를 이해하는 틀과 컴퓨터가 정보화 대상(콘텐츠)을 이해하는 틀 사이에 유사성이 있다고 보았기 때문이다. 그 틀은 바로 대상을 구성하는 요소들에 대응하는 개념들과 그 개념들 간의 연관 관계이다.[1] 넓은 의미에서는 모든 정보화의 틀이 다 온톨로지일 수 있겠지만, 대상 자원을 ‘클래스’(class)로 범주화하고, 각각의 클래스에 속하는 개체(individuals)들이 공통의 ‘속성’(attribute)을 갖도록 하고, 그 개체들이 다른 개체들과 맺는 ‘관계’(relation)를 명시적으로 기술하는 것이 가장 일반적인 온톨로지 설계 방법이라고 할 수 있다. (김현, 『디지털 인문학 입문』(HUEBOOKS, 2016) p. 164)
- 정보기술 분야에서 말하는 ‘온톨로지(ontology)’에 대한 가장 일반적인 정의는 그루버(Gruber, Thomas. 1959~ )가 말한 ‘명시적 명세화의 방법에 의한 개념화’(explicit specification of a conceptualization)이다.[2] 여기서 ‘개념화’(conceptualization)라는 것은 정보화하고자 하는 대상 세계를 일정한 체계 속에서 파악하는 것, 예를 들면 그 세계에 무엇이 있고, 그것은 어떤 속성을 품고 있으며, 그것들 사이의 관계는 무엇인가 하는 일정한 질문의 틀 속에서 대상 세계를 이해하는 방식이라고 할 수 있다. ‘명세화’(specification)란 대상 세계에 존재하는 개체, 속성, 관계 등을 일목요연한 목록으로 정리하는 것, 그리고 ‘명시적’(explicit)이라는 그 정리된 목록을 사람뿐 아니라 ‘컴퓨터가 읽을 수 있도록’(machine readable) 한다는 것이다. (같은 책 p. 164)
온톨로지 설계 용어 Terms for Ontology Design
온톨로지 구성 요소
(권장 용어) |
용도[3] | Web Ontology Language
(OWL) |
---|---|---|
Class, 클래스 | 공동의 속성을 가진 개체들을 묶는 범주
a group of individuals that belong together because they share some properties. |
owl:Class |
Individual, 개체 | 클래스에 속하는 개체
Instances of classes |
owl:NamedIndividual |
Relation, 관계 | (같거나 다른 클래스에 속하는) 개체들 사이의 관계
relationships between pairs of individuals |
owl:ObjectProperty |
Attribute, 속성 | 개체가 속성으로 갖는 데이터 값
relationships from individuals to data values |
owl:DatatypeProperty |
Relation Attribute, 관계 속성 | 관계 정보에 부수되는 속성
attributes related to relations |
N/A in OWL
Can be used when you implement Graph Database with Cypher Query Language. |
Domain, 정의역 | 특정 ObjectProperty 또는 DatatypeProperty의 주어가 될 수 있는 클래스를 한정
A domain of a property which limits the individuals to which the property can be applied |
rdfs:domain |
Range, 치역 | 특정 ObjectProperty의 목적어가 될 수 있는 클래스를 한정
The range of a property limits the individuals that the property may have as its value |
rdfs:range |
IRIs for Named Individuals
분류 한국학 용어 Classified Korean Studies Terms
인물: 인물/기관
공간: 지명/장소/시설명
사건: 사건/행사
시간: 시대/시간범위/시점
문헌: 고도서/고문서/고기록
문화유산: 지정문화재/등록문화재/비지정문화재
개념: 개념/용어
참고문헌: 현대 문헌
인명: 현대 인물
미분류 한국학 용어 Korean Studies Terms Candidates
클래스, 관계, 속성 이름 IRIs for Class, Relation, Property Names
※ 데이터 모델 설계 과정에서 새로운 이름을 부여하였을 때 사용
Prefix for the Specified Data Model
Data Model Name | Prefix | Namespace | Contributor |
---|---|---|---|
한국학 데이터 일반 | ksdm: | xmlns:ksdm="http://digerati.aks.ac.kr/terms/ksdm#" | 한국학중앙연구원 인문정보학교실 |
한글 문화 유산 | hhdm: | xmlns:hhdm="http://digerati.aks.ac.kr/terms/hhdm#" | 김현, 국립한글박물관 |
한국 기독교 선교 문화 유산 | chdm: | xmlns:chdm="http://digerati.aks.ac.kr/terms/chdm#" | 김현, 백종구, 김바로 |
서원 문화 유산 | cadm: | xmlns:cadm="http://digerati.aks.ac.kr/terms/cadm#" | 김현, 김바로 |
불교 문화 유산 | bhdm: | xmlns:bhdm="http://digerati.aks.ac.kr/terms/bhdm#" | 서소리 |
도자유물 가상 박물관 | phdm: | xmlns:phdm="http://digerati.aks.ac.kr/terms/phdm#" | 호정 |
한국 전통 복식 | tcdm: | xmlns:tcdm="http://digerati.aks.ac.kr/terms/tcdm#" | 김아람, 차서연, 편나영, 김현승, 김미정 |
화기 문화 유산 | fadm: | xmlns:fadm="http://digerati.aks.ac.kr/terms/fadm#" | 조연수 |
문중 고문서 아카이브 | hddm: | xmlns:hddm="http://digerati.aks.ac.kr/terms/hddm#" | 김현, 김하영, 류인태 |
문화유적 안내 정보 | hsdm: | xmlns:hsdm="http://digerati.aks.ac.kr/terms/hsdm#" | 김사현 |
한국 바로 알리기 지식 정보 Understanding Korea Project |
ukdm: | xmlns:ukdm="http://digerati.aks.ac.kr/terms/ukdm#" | 김현, 한국학중앙연구원 한국바로알리기사업실 |
- ↑ 김현, 「한국 고전적 전산화의 발전 방향 - 고전 문집 지식 정보 시스템 개발 전략 -」, 『민족문화』 28, 민족문화추진회, 2005
- ↑ Gruber, ‘A Translation Approach to Portable Ontology Specifications’, Knowledge Systems Laboratory Technical Report KSL 92-71, Stanford University, 1992
- ↑ OWL Web Ontology Language Overview, W3C Recommendation