FaBio and Cito:ontologies for describing bibliographic resources and citations

seonae's wiki
Seonae (토론 | 기여) 사용자의 2019년 11월 3일 (일) 22:11 판 (Related works)

이동: 둘러보기, 검색

Introduction

학술 저작과 출판이 활발하던 때에 온라인 출판 가능성은 관심을 받았지만 현재까지도 그러한 작업에서 웹 표준을 적용하지는 않는다. 오히려 XML기반의 정보 모델과 DTD를 적용하는 경우가 간간이 있지만 그것은 웹이 등장하기 이전 종이 출판 시대에는 합리적이었을지는 몰라도 지금은 시대착오적이다. 서로 다른 자원을 가진 출판물과 메타데이터는 서로 양립이 불가능해서 수작업으로 매핑하는 작업이 필요하기 때문이다. 출판계와 같은 큰 규모의 커뮤니티에서 전 산업에 아울러 이용될 수 있는 표준적 정의의 부재는 돈, 시간, 노력의 손실을 초래한다.

반면, 현대의 웹 정보 관리 기술에서는 RDF, OWL2와 같은 표준을 채택하여 자동화된 방식으로 메타데이터 쿼리를 날리고, 다양한 웹기반 자원들을 통합할 수 있다. 학문적 의사소통 과정에서 과학의 실천이 중심적이기 때문에 출판업자들은 그러한 기준을 채택하는 것이 필수적이다. 이것은 저자와 출판업자, 그리고 독자들의 요구를 잘 수용하는 온톨로지의 이용을 필요로 한다. 이 논문의 목적은 시맨틱 출판 혁명(Semantic publishing revolution)의 중요한 요소인 두 온톨로지를 소개하려는 것이다.

시맨틱 출판 혁명은 출판물을 향상시키고, 기계적인 발견(automatic discovery)을 용이하게 하며, 관련된 아티클을 의미적으로 연결하고, 아티클 내에서 데이터에 접근할 수 있게 하며, 논문간의 데이터를 통합하기 위해 시맨틱 웹 기술을 이용하는 것이다. 시맨틱 출판과 웹표준을 이용한 학술 인용은 과학 출판 영역에서 흥미로운 주제 중 두 가지를 보여준다. 이 분야의 연구 영역은 4가지의 발전을 포함한다.

  • 학술 저작과 출판의 요구를 충족시키는 semantic models(vocabularies, ontologies)
  • 온톨로지를 쉽게 이해할 수 있게 하는 visualization and documentation tools
  • 관련 문헌에 이러한 모델을 적용할 수 있게 하는 annotation tools
  • 많은 양의 온라인 문서를 검색할 때 시맨틱 주석을 쓸 수 있게 하는 new algorithms

이 논문에서는 시맨틱 출판의 작업에 주력하는 두 가지 온톨로지의 원리와 구조를 묘사하는 게 가장 큰 목적이다. 바로 FaBiO(FRBR-aligned Bibliographic Ontology)와 CiTO(Citation Typing Ontology)가 그것이다. 이 온톨로지들은 SPAR(Semantic Publishing and Referencing Ontologies)에 속한다.

Characteristics, starting point and priciples

이 작업이 이전의 작업들보다 두드러지는 주요한 특징은 학술저자와 출판업자 같은 최종 이용자(end users)들의 요구사항을 충족시키에 충분한 표현력을 갖는 두가지의 온톨로지를 생성한 것이다. 또 우리는 2개의 새로운 표현 기술을 개발해왔는데, LODE(Live OWL Documentation Environment)Graffoo(Graphical Framework For OWL Ontologies)이다. 이 도구들은 더이상 여기서는 논의하지 않겠지만 온톨로지의 문서화, 시각화, 탐색(navigation)을 용이하게 하고, 온톨로지의 모델링과 지식의 구조화 능력이 부족한 학술 연구자, 출판업자, 사서 등의 잠재적 이용자들이 더 쉽게 이해할 수 있도록 한다.

이 작업에 도움을 받기 위해 출판업자, 연합 단체, 학술단체 등의 요구사항을 수렴하였으며, 가능한 기존의 모델과 온톨로지 및 어휘를 재사용하고자 했다. 이 작업의 시작점은 CiTO 버전1.6이며, 이것은 아직 준비 단계이고 불완전하지만 서지적 문서의 기술을 위한 용어와 인용의 특성을 잘 포함하는 특성이 담긴 단일한 온톨로지를 포함하고 있다.

우리의 첫번째 결정은 이 온톨로지를 모듈화하는 것이었는데, 그것은 기존 버전의 각 측면을 더욱 발전시키고, 각각의 온톨로지 모듈을 쉽게 이해할 수 있도록 작고 균일하게 유지하기 위함이다. 이에 따라 온톨로지의 모듈화에 대한 방법론을 수립하고, 3가지의 원칙을 세워 준수하였다.

  • 문헌들과 인용의 특성에 대한 서지적 기술은 2개로 분리되지만 상호운용가능한 온톨로지에 의해 표현되어야 한다.
  • 각 온톨로지 모듈의 재사용성을 극대화하기 위해 논리적 제약은 오직 엄격히 요구되는 곳에서만 추가되어야 한다.
  • 우리가 기술하고자 하는 영역의 일부에 잘 알려지고 널리 공유된 어휘가 이미 존재하는 경우에는 이것들이 적절하게 수용되고 재사용되어야 한다.

Related works

여기서는 간략하게 잘 알려진 어휘들을 소개하고자 한다.

  • Dublin Core+Dublin Core Metadata Elements)'
  • PRISM(Publishing Requirements for Industry Standard Metadata)
  • SKOS(Simple Knowledge Organization System)
  • FOAF(Friend of a Friend Ontology)
  • SWRC(Semantic Web for Research Communities)
  • FRBR(Functional Requirements for Bibliographic Records) : 4가지의 상호 연관된 관점으로 기술.(Work, Expression, Manifestation, Item)
  • BIBO(Bibliographic Ontology)
  • SWAN(Semantic Web Applications in Neuroscience)

Representing bibliographic information using FaBiO

Bibliographic reference metadata encoding using BIBO

Bibliographic reference metadata encoding using FRBR

Bibliographic reference metadata encoding using FaBiO

New capabilities when using FaBiO

Characterising citations with CiTO

Community uptake of FaBiO and CiTO

Conclusions