"CiTO, the Citation Typing Ontology"의 두 판 사이의 차이

seonae's wiki
이동: 둘러보기, 검색
(Citation characterization)
(The relationship of CiTO with other metadata schemas and ontologies)
 
(같은 사용자의 중간 판 10개는 보이지 않습니다)
41번째 줄: 41번째 줄:
 
===Citation characterization===
 
===Citation characterization===
 
CiTO의 두번째 목적은 서지 인용의 특성화를 가능하게 하는 것이다. 하나의 출판물이 다른 출판물들을 인용하는 이유는 다양하다. 대개, 그것은 더 최근에 출판된 인용 작업들이 배경 정보, 생각, 방법, 또는 데이터 등을 형성하는 등의 여러 도움을 과거의 피인용 작업들에서 얻을 수 있기 때문이다. 그러나 드물게도 이전의 작업들에 대해 비판하거나 논쟁하기 위해서 인용을 하기도 한다. CiTO는 그러한 구별을 포착하여 출판할 수 있게 하는데 예를 들면 이렇다. 특정 출판물을 인용할 때 저자의 의도는 저자들이 자신들의 인용을 기술하는 메타데이터를 생성하면서도 피인용 작업들을 기술하고 있는 메타데이터와는 상당히 구별된다. CiTO를 이용하여 기록가능한 인용 유형 관계의 전체 목록은 아래의 표에 있다.
 
CiTO의 두번째 목적은 서지 인용의 특성화를 가능하게 하는 것이다. 하나의 출판물이 다른 출판물들을 인용하는 이유는 다양하다. 대개, 그것은 더 최근에 출판된 인용 작업들이 배경 정보, 생각, 방법, 또는 데이터 등을 형성하는 등의 여러 도움을 과거의 피인용 작업들에서 얻을 수 있기 때문이다. 그러나 드물게도 이전의 작업들에 대해 비판하거나 논쟁하기 위해서 인용을 하기도 한다. CiTO는 그러한 구별을 포착하여 출판할 수 있게 하는데 예를 들면 이렇다. 특정 출판물을 인용할 때 저자의 의도는 저자들이 자신들의 인용을 기술하는 메타데이터를 생성하면서도 피인용 작업들을 기술하고 있는 메타데이터와는 상당히 구별된다. CiTO를 이용하여 기록가능한 인용 유형 관계의 전체 목록은 아래의 표에 있다.
[[파일:citetable1.png|500px|center]]
+
[[파일:citetable1.png|900px|center]]
  
 
''cito:cites''와 ''cito:isCitedBy''를 제외하고 위의 모든 프로퍼티는 cito:cites의 하위 프로퍼티이다. 이 모든 하위 프로퍼티들은 인용 작업과 피인용 작업의 관계를 특징 짓고 그들의 역 프로퍼티는 적용되지 않는다. 그러므로 ''cito:supports''와 ''cito:obtainsSupportFrom''은 분리되고 구분되는 프로퍼티이며, 서로의 역관계가 아니다. 하나의 단일한 인용은 실제적이고 은유적인 몇몇의 다른 관계에 의해 특징지어질 수 있다. 온톨로지의 텍스트적 정의에 따라 이용자는 어느 관계가 가장 적절한지를 결정한다. N3(Notation3)형태로는 아래와 같이 기술될 수 있다.
 
''cito:cites''와 ''cito:isCitedBy''를 제외하고 위의 모든 프로퍼티는 cito:cites의 하위 프로퍼티이다. 이 모든 하위 프로퍼티들은 인용 작업과 피인용 작업의 관계를 특징 짓고 그들의 역 프로퍼티는 적용되지 않는다. 그러므로 ''cito:supports''와 ''cito:obtainsSupportFrom''은 분리되고 구분되는 프로퍼티이며, 서로의 역관계가 아니다. 하나의 단일한 인용은 실제적이고 은유적인 몇몇의 다른 관계에 의해 특징지어질 수 있다. 온톨로지의 텍스트적 정의에 따라 이용자는 어느 관계가 가장 적절한지를 결정한다. N3(Notation3)형태로는 아래와 같이 기술될 수 있다.
53번째 줄: 53번째 줄:
  
 
===citation frequency===
 
===citation frequency===
 +
세번째 목적은 인용 빈도를 기록하기 위함인데, local과 global의 두가지 유형이 있다. 우리는 저널 임팩트 팩터(Impact Factor)에 익숙한데, 그것은 전체적으로 그들이 포함한 논문의 인용에 대한 global 빈도에 기반한다. 오용과 스파이킹(spiking)에 대한 취약점에도 불구하고, IF는 저널의 질을 평가할 때 널리 이용되고 있는데, 보다 덜 적절하게는 모든 인용은 피인용 작업에 대한 '신뢰감의 투표(votes of confidence)'라는 전제를 깔고 개별 논문의 질과, 저자들과 기관의 학술적 장점에 대한 계산식으로 이용되고 있다. 거칠게 말해서, 문헌 A가 문헌 B는 한번 인용하지만 문헌 C는 텍스트 내의 다른 곳에서 10번 인용하고 있다면 인용 문헌의 관점(citing paper)에서는 문헌 B의 global 빈도와 관계가 없이 문헌 C가 더 중요하다.
 +
*local frequency : 하나의 문헌 내에서 인용이 이루어지는 빈도
 +
*global frequency : 전체 문헌 집단 내에서 인용이 이루어지는 빈도
 +
 +
CiTO는 특정 날짜에 구글 스콜라나, SCOPUS 등과 같은 제 3자 기관과 협의하여, 문헌 A에서 인용하고 있는 문헌들의 텍스트 내에서의 인용 빈도(local)와 각 인용되고 있는 전체에서의 인용 빈도(global) 모두를 기록할 수 있다. global 인용에서는 전체 학술 커뮤니티에서 각각 피인용 문헌들의 중요성에 대한 대리 추정치(proxy estimates)를 제공함으로써 계산한다. CiTO에서 그러한 정보는 아래의 표에서 보이는 프로퍼티들을 이용하여 기록한다.
 +
[[파일:ctable2.png|900px|center]]
 +
 +
아래와 같은 방식으로 기술할 수 있다.
 +
 +
<pre>
 +
<http://example1.com/citingwork>
 +
  cito:cites <http://example2.com/citedwork> ;
 +
  cito:inTextCitationFrequency [
 +
      a cito:InTextCitationCount ;
 +
      cito:inTextCountValue "10"^^xsd:integer ;
 +
      cito:inTextCitationTarget <http://example2.com/citedwork> ;
 +
] ; .
 +
<http://example2.com/citedwork>
 +
  cito:isCitedBy <http://example1.com/citingwork> ;
 +
  cito:globalCitationFrequency [
 +
      a cito:GlobalCitationCount ;
 +
      cito:globalCountValue "206"^^xsd:integer ;
 +
      cito:globalCountSource <>;http://scholar.google.com
 +
      cito:globalCountDate "2009-03-11"^^xsd:date ;
 +
] ;
 +
</pre>
 +
 +
‘A cites B’와 'B is cited by A'는 모두 다른 진술에서 추론가능하기 때문에 이 트리플 세트에는 의도적인 중복이 있다. 이정도의 중복은 실제적 유용성을 갖는데, 직접 인용문을 사용하여 인용 네트워크 시각화 프로그램 입력을 깔끔하게 할 수 있기 때문이고 또 두 번째 트리플의 명시적이고도 호혜적인 진술은 이후 두 세트가 분리되어도 인용 작업의 정체성을 보존할 수 있기 때문이다. 그림 1(위에)에서 제시된 것과는 다른 관점이 그림 2(아래)에서 제시된다. 구글 스콜라의 수치 데이터를 이용하였는데, 노드 크기는 각각 2006년 이전 참조에서 얻은 global 인용 횟수의 세제곱근에 비례하는 반면 각각의 인용 참조 연결은 피인용문헌의 인용 문헌에 대한 중요성을 암시하는 각각의 인용 문헌 내에서 인용 문헌의 local 인용 횟수의 제곱근에 비례한다.
 +
 +
[[파일:cnetwork2.jpg|800px|center]]
 +
 +
===characterization of cited works: use of the FRBR classification model===
 +
CiTO의 네번째 목적은 피인용 작업들을 특징지어서, CiTO를 적용한 참고 문헌 목록을 보는 사람들이 그 인용의 특성에 대해 더 나은 평가를 할 수 있게 된다. 이 특성화 작업에서 CiTO는 미국 의회도서관에서 출판물의 다른 양상을 특징화하려는 목적으로 만든 FRBR(Functional Requirements for Bibliographic Records)의 분류모델을 채택하였다. 독자들은 최근에 FRBR이 CIDOC CRM(Conceptual Reference Model)과 조화를 이루어서, CIDOC CRM을 이용하여 FRBR을 인코딩한 FRBRoo를 표현하게 된 것에 흥미를 느낄지도 모른다.
 +
이 FRBR의 분류는 ''Works, Expressions, Manifestations, Items''로 구분된다.
 +
*''Works'' : 뚜렷한 지적 생산물이거나 예술적 생산물로, 다양한 표현방식을 통하여 인식된 추상적 개념이다. 예로, 당신의 가장 최근 연구 논문이 될수도 있다.
 +
*''Expressions'' : Work가 물리적 또는 전자적인 형태로 구체화될때마다 취하는 구체적인 형태이다. 당신의 최근 연구 논문에 대해서, 5번째 원고, 선인쇄본(preprint), 출판사가 할당한 DOI(Digital Object Identifier)를 가진 출판버전 등이 모두 같은 작업에 대한 표현들이다.
 +
*''Manifestations'' : 학술적 작업의 표현을 표명하는 것은 그것의 특정한 물리적 또는 전자적 구현을 정의한다. 만약 당신의 최근 연구 논문이 인쇄 저널에서, HTML페이지로 된 저널의 온라인 버전에서, 또 다운 가능한 PDF로 하나의 아티클로서 등장한다면, 이것들은 당신의 작업의 기록 버전의 표현에 대해 3가지의 분리된 표명이다. 같은 DOI를 갖고 있지만 같은 정보에 대해 다른 방식으로 보여질 수 있는 것이다.
 +
*''Items'' : 하나의 표명에 대한 단일한 예제적 사본으로, 사람이 소유할 수 있는 물리적인 혹은 전자적인 객체이다. 예를들어 책상위의 저날 아티클 복사본 한 부나 출판사에서 구매한 아티클의 PDF파일이나 컴퓨터 하드 드라이브에 디지털 형태로 놓인 파일이다.
 +
 +
CiTO에서 ''cito:Work''의 정의는 주로 서지 참조를 포함하는 학술저작을 인용하거나 인용되는 작업에 국한되며, 그것이 없는 희곡이나 사진같은 예술적 작업은 배제시킨다. 추가적으로 원래의 FRBR 명세서는 FRBR 분류가 Expression의 물리적 manifestation 뿐만 아니라 디지털 작업에도 적용되는지에 대한 것이 다소 애매했다면, CiTO에서는 그렇지 않다. 예를 들어 ''cito:Work''는 ''frbr:Work''의 하위 클래스이지 동등한 클래스가 아니다.
 +
 +
그러나 ''cito:Work''가 인용 작업과 피인용 작업 모두를 포괄하고, 학술논문에서 인용된 특정한 것들이 학술저작으로서 엄격하게 고려되어왔기 때문에 다소 더 제한적인 ScholaryWork라는 용어 대신 Work라는 용어를 CiTO에 적용하였다.
 +
 +
CiTO는 ''cito:Work''에 대해서는 41개의 하위 클래스를, ''cito:Expression''에 대해서는 43개의 하위클래스를 정의하고 있으며 각각 [https://jbiomedsem.biomedcentral.com/articles/10.1186/2041-1480-1-S1-S6/tables/3 표3]과 [https://jbiomedsem.biomedcentral.com/articles/10.1186/2041-1480-1-S1-S6/tables/4 표4]에서 볼 수 있다. 현재의 학술적 실제에서 인용은 대개 작업의 피인용 표현에 대한 표명 명세서를 요구하지 않지만, CiTO는 [https://jbiomedsem.biomedcentral.com/articles/10.1186/2041-1480-1-S1-S6/tables/5 표5]에서 보이는 ''cito:Menifestation''의 하위 클래스 5개를 이용하여 Manifestation의 특성을 기록할 수 있게 하고 있다.
 +
 +
===To what do citations refer?===
 +
근본적인 철학적 단계에서 인용이 대상은 작업(Work) 그 자체이다. 그러나 CiTO 인용의 객체가 일반적으로 특정한 Work의 표인이 되어야만 하는 실용적인 이유가 3가지가 있다.
 +
 +
먼저, LOD로서 RDF 인용 정보를 출판하는 것은 인용 작업과 피인용 작업 모두 URI(Uniform Resource Identifiers)로 참조하는 것이 필요하다. FRBR의 작업은 추상적인 개념이기 때문에 URI를 할당받지 않으며, 대신 참조할수 없는 URI를 생성하기 위해 이용되는 DOI를 할당받는다.
 +
둘째로, 원칙적으로는 인용이 작업의 표현을 가지고 있어야 맞지만, 예를 들어 다른 나라 언어로 번역된 경우는 실제로 특정일에 작가가 원래만든 인용이 작업물의 특정한 표현이 되는데, 즉 특정 출판된 기록의 버전이다.
 +
셋째로, CiTO는 피인용 작업에서 텍스트 내의 인용 횟수를 구체화하기 위해 이용될지도 모르며, 피인용 작업의 global 인용 횟수는 local 인용 때에 받은 것이다. 당신의 가장 최근 연구 논문에서 인용된 특정 작업들에 대한 텍스트 내의 인용 횟수와 인용된 참고문헌들의 총 갯수는 그 논문이 다양한 원고들을 통해 발달되어서 변화했다. 그러므로, CiTO에서 텍스트 내의 인용 횟수를 결정함에 있어서 중요한 버전은 최종 출판된 기록의 표현 버전이다.
 +
그래서 이런 이유들로 ''cito:cites''의 도메인과 범위는 ''cito:Work, cito:Expression, cito:Manifestation''으로 제한된다.
 +
 +
===Other CiTO capabilities===
 +
pass
 +
 +
===CiTO vocabulary definitions===
 +
CiTO를 만들면서 그 클래스와 프로퍼티를 정의하는데 있어서 대단한 노력이 들었다. 이 정의들은 온톨로지 자체와 논문의 부록 2번에 텍스트 형태로 제공된다. CiTO는 DCMI 유형 어휘 정의를 채택하였으며, 다른 CiTO 클래스 이름은 SWAP에서 정의된 어휘의 모든 항목을 포함한다.
 +
 +
===Granularity and scope===
 +
고전적이고 서지적인 학문에 대해 논평적인 관습은 피인용 작업의 개별 섹션, 문단, 구절을 인용하는 방법론을 발달시켜왔다. 이와 대조적으로 오늘날 과학적 인용은 전형적으로 완성된 개체로서 피인용 작업을 가져온다.
  
 
==The relationship of CiTO with other metadata schemas and ontologies==
 
==The relationship of CiTO with other metadata schemas and ontologies==
 +
*and FRBR : FRBR의 분류가 CiTO에 적용됨
 +
*and SWAP(Scholarly Works Application Profile)  :  학술 작업에 대해 메타데이터 요구사항을 기술하는 것으로 FRBR 모델을 따르고 있지만 CiTO와는 범위가 다르다. SWAP은 기금 단체나 저작권 협회 같은 서지인용 범위 바깥을 둘러싸는 환경에 대해서도 고려하고 있다. 반대로 CITO는 인용 작업과 피인용 작업 사이의 실제적이고 은유적인 관계만을 고려한다. 가능한한 CiTO는 SWAP의 용어와 클래스 정의를 적용하였지만 안타깝게도 SWAP은 RDF 스키마를 잘 따르지 않는다.
 +
*and BIBO : 서지 참조를 특징짓기 위한 메타데이터 스키마와 온톨로지를 생성하려는 이전의 많은 노력 중에서도, OWL로 작성된 BIBO는 피인용 작업의 성격을 RDF로 세부적으로 기술할 수 있게 해준다. 전통적인 학술 작업을 포괄하면서, 연표나 방송자료, 법률 문서 등까지 포함할 수 있지만 그것은 CiTO 하위 클래스의 대부분과는 동등한 클래스를 갖고 있지 않다. 안타깝게도, BIBO는 FRBR의 분류 체계를 따르지 않아서 학술적인 명명법에 있어서는 정밀성이 부족하다.
 +
*and SWAN : pass
 +
 +
===Future revisions of CiTO, and harmonization with other ontologies===
 +
미래의 작업에서 CiTO는 더 완전하게 다른 어휘들과 통합될 것이다.
 +
CiTO의 주요 목적은 인용을 특징짓는 것인 반면 BIBO는 피인용 작업들을 특성화하는 것이기 때문에 이 온톨로지들은 기본적으로 공통되는 부분이 있다.(orthogonal) 추후에 작업에서 가능한 많은 부분 CiTO와 BIBO가 조화를 이룰 것이라 예상된다.
  
 
==Example of CiTO in use==
 
==Example of CiTO in use==
  
 
==Conclusion==
 
==Conclusion==

2019년 11월 5일 (화) 15:00 기준 최신판

the Citation Typing Ontology

Background

context and rational

온라인 출판과 서지 검색 엔진의 등장은 개별 연구 논문을 찾기 쉽게 해주었지만 현재의 학술 인용 시스템은 과학적 문학, 연결 논문(linking papers), 저자들과 연구 프로젝트 내에 존재하는 지식 네트워크에 부적절하게 노출되어 있다. 문제의 대부분은 자유롭게 인용가능한 데이터의 부족에서 기인한다. 이 오픈 액세스 시대에 학술데이터 사이클의 핵심 요소인 저널의 아티클의 참고문헌 목록이 학자들에게 자유롭게 이용되지 못한다는 것은 충격적인 일이다.

이 글은 인용을 특성화시키는 새 도구인 CiTO를 설명하고, CiTO가 인용을 특성화하기 위해 어떻게 이용되며 이 데이터는 기계가독적인 형태로 어떻게 출판될 수 있는지를 보여주고자 한다. 만약 CiTO를 적용할 수 있는 기계가독적 인용 데이터가 모든 학술출판물과 연결되고 웹 상에서 자유롭게 출판된다면, 인용 네트워크의 구성과 질문(interrogation)은 많은 학문적 이점과 함께 아주 단순해질 것이다.

what is CiTO

CiTO는 과학 연구 논문과 다른 학술적 저작들(그런 출판물들과 또 웹 정보자원 모두)에 있는 참조 인용의 본질을 기술하고, 시맨틱 웹에서 이 내용을 출판하기 위한 온톨로지이다. 이는 생의학 연구자들의 필요에 의해 계획되었다. 인용은 인용(citing) 출판물과 피인용(cited) 출판물 간의 실제적이고 은유적인 관계들로 묘사된다. 이 글은 CiTO에 대해 기술한 뒤, 서지 참고 목록의 주석을 작성하고 인용 네트워크를 시각화함에 있어서 그것이 유용함을 보여줄 것이다.

CiTO의 최신 버전은 2010년 3월 26일에 발행된 ver 1.6이다. 이 온톨로지는 OWL로 작성되었으며, http://purl.org/spar/cito의 네임스페이스를 사용하고 있다. 웹 브라우저를 통해서도 온톨로지에 접근할 수 있으며 프로테제(Protege)를 통해서도 접근할 수 있다.

What is meant by a citation

CiTO의 맥락에서, 서지 인용은 피인용 작업을 일컫는 다른 출판물을 인용하고 있는 작업 내의 참조(reference)이다. 과학 연구 논문에서 인용은 대개 2가지 형태로 나타나는데, in-text citation으로 일컬어지는 논문의 텍스트 내에서 축약된 형태(condensed form)와 문헌의 끝에 참고문헌 목록 내의 완전한 형태(full form)이다. 단어 '인용(citation)'의 이용은 피인용 작업 그 자체를 암시하기 위해서 단어와 흔히 관련된 이용과는 분명하게 구별되어야만 한다. CiTO내에서 'cite'와 'citation'은 인용의 행위 그 자체를 의미하지 그 인용의 대상을 의미하지 않는다.

CiTO scope and usage

citation publication and citation networks

CiTO의 첫번째 목적은 인용 작업(citing work) 내의 인용들을 RDF라고 하는 기계가독적 형태로 표현하고자 하는 것이다.

<http://example1.com/citingwork> cito:cites <http://example2.com/citedwork>

심지어 인용의 존재를 나타내는 간단한 문장은 중요한 가능성을 보여주는데, 예를 들어 몇 가지의 논문에서 RDF 인용 리스트를 결합함으로써 인용 네트워크를 쉽게 생성할 수 있게 된다.

반대로 우리는 이렇게도 말할 수 있다.

<http://example2.com/citedwork> ctio:isCitedBy <http://example1.com/citingwork>

이것은 논리적 관점에서 장황함에도 불구하고, 특정 환경에서는 유용하다.

아래의 그림은 Reis et al(2008)에서 직접적으로나 간접적으로 인용된 몇가지의 문헌을 연결하여 간단한 인용네트워크를 보여준다. 이 그림은 임시 수직축을 따라 노드들을 배열하는 RDF 그래프 시각화 툴 Welkin에 CiTO 인용의 RDF 그래프를 넣어서 자동적으로 생성한 것이다.

Cnetwork.jpg


컴퓨터가 쉽게 읽을 수 있는 형태로 인용 네트워크 정보에 접근할 수 있는 것의 중요성은 최근에 Greenberg의 논문에서 강조되었다. 그는 완전한 인용 네트워크를 구성하였는데, 1992년에서 2007년 사이에 PubMed목록에 있는 영어 논문 중 알츠하이머와 관련되어 뇌에 축적되는 단백질인 베타 아미로이드가 포함체 근육염(inclusion body myositis)과 함께 환자의 골격근을 손상시킨다는 연구에 대한 242개의 문헌과 675건의 인용을 결합하였다. 이를 통해 그는 3가지의 중요한 점을 발견하게 되었다.

  • 가설을 반박하거나 약화시키기 보다 지지하는 논문을 편향적으로 인용하는 것(근거없는 권위).
  • 지지함에 있어서 추가 증거를 제시하지 않고 가설을 강화하는 것.
  • 초기 논문에서 가설에 대해 진술한 것을 인용함으로써 사실의 진술로 변환하는 것.

걱정스럽게도, 그는 정보 행위의 자유법(The Freedom of Information Act)으로부터, 국립 보건원이 후원하는 보조금 신청에서도 이와 같은 경향을 발견하였다. 따라서 인용이 편파적인 학술 방법이고 사회적 소통의 강력한 형태인 반면, Greenberg는 특정 주제에 대한 인용 네트워크 분석을 통해 편견, 강화, 사실의 창조 그리고 주장에 대한 근거없는 권위의 생성 등을 포함하여 인용의 사회적 이용에 왜곡이 있음을 밝혀내었다. 이 모든 것은 당신이 갖고 있는 인용 네트워크가 이용가능하다면 인용 네트워크 분석이 얼마나 가치있는지를 보여주고 있다. CiTO는 인용 네트워크의 생성 작업을 쉽게해주면서, 출판할 수 있는 기계가독적 형태의 인용 데이터를 인코딩하는 방법을 제공해준다.

Citation characterization

CiTO의 두번째 목적은 서지 인용의 특성화를 가능하게 하는 것이다. 하나의 출판물이 다른 출판물들을 인용하는 이유는 다양하다. 대개, 그것은 더 최근에 출판된 인용 작업들이 배경 정보, 생각, 방법, 또는 데이터 등을 형성하는 등의 여러 도움을 과거의 피인용 작업들에서 얻을 수 있기 때문이다. 그러나 드물게도 이전의 작업들에 대해 비판하거나 논쟁하기 위해서 인용을 하기도 한다. CiTO는 그러한 구별을 포착하여 출판할 수 있게 하는데 예를 들면 이렇다. 특정 출판물을 인용할 때 저자의 의도는 저자들이 자신들의 인용을 기술하는 메타데이터를 생성하면서도 피인용 작업들을 기술하고 있는 메타데이터와는 상당히 구별된다. CiTO를 이용하여 기록가능한 인용 유형 관계의 전체 목록은 아래의 표에 있다.

Citetable1.png

cito:citescito:isCitedBy를 제외하고 위의 모든 프로퍼티는 cito:cites의 하위 프로퍼티이다. 이 모든 하위 프로퍼티들은 인용 작업과 피인용 작업의 관계를 특징 짓고 그들의 역 프로퍼티는 적용되지 않는다. 그러므로 cito:supportscito:obtainsSupportFrom은 분리되고 구분되는 프로퍼티이며, 서로의 역관계가 아니다. 하나의 단일한 인용은 실제적이고 은유적인 몇몇의 다른 관계에 의해 특징지어질 수 있다. 온톨로지의 텍스트적 정의에 따라 이용자는 어느 관계가 가장 적절한지를 결정한다. N3(Notation3)형태로는 아래와 같이 기술될 수 있다.

<http://example1.com/citingwork>
   cito:cites <http://example2.com/citedwork>;
   cito:usesMethodIn <http://example2.com/citedwork>;
   cito:extends <http://example2.com/citedwork>;
   cito:sharesAuthorsWith <http://example2.com/citedwork>;

citation frequency

세번째 목적은 인용 빈도를 기록하기 위함인데, local과 global의 두가지 유형이 있다. 우리는 저널 임팩트 팩터(Impact Factor)에 익숙한데, 그것은 전체적으로 그들이 포함한 논문의 인용에 대한 global 빈도에 기반한다. 오용과 스파이킹(spiking)에 대한 취약점에도 불구하고, IF는 저널의 질을 평가할 때 널리 이용되고 있는데, 보다 덜 적절하게는 모든 인용은 피인용 작업에 대한 '신뢰감의 투표(votes of confidence)'라는 전제를 깔고 개별 논문의 질과, 저자들과 기관의 학술적 장점에 대한 계산식으로 이용되고 있다. 거칠게 말해서, 문헌 A가 문헌 B는 한번 인용하지만 문헌 C는 텍스트 내의 다른 곳에서 10번 인용하고 있다면 인용 문헌의 관점(citing paper)에서는 문헌 B의 global 빈도와 관계가 없이 문헌 C가 더 중요하다.

  • local frequency : 하나의 문헌 내에서 인용이 이루어지는 빈도
  • global frequency : 전체 문헌 집단 내에서 인용이 이루어지는 빈도

CiTO는 특정 날짜에 구글 스콜라나, SCOPUS 등과 같은 제 3자 기관과 협의하여, 문헌 A에서 인용하고 있는 문헌들의 텍스트 내에서의 인용 빈도(local)와 각 인용되고 있는 전체에서의 인용 빈도(global) 모두를 기록할 수 있다. global 인용에서는 전체 학술 커뮤니티에서 각각 피인용 문헌들의 중요성에 대한 대리 추정치(proxy estimates)를 제공함으로써 계산한다. CiTO에서 그러한 정보는 아래의 표에서 보이는 프로퍼티들을 이용하여 기록한다.

Ctable2.png

아래와 같은 방식으로 기술할 수 있다.

<http://example1.com/citingwork>
   cito:cites <http://example2.com/citedwork> ;
   cito:inTextCitationFrequency [
      a cito:InTextCitationCount ;
      cito:inTextCountValue "10"^^xsd:integer ;
      cito:inTextCitationTarget <http://example2.com/citedwork> ;
] ; .
<http://example2.com/citedwork>
   cito:isCitedBy <http://example1.com/citingwork> ;
   cito:globalCitationFrequency [
      a cito:GlobalCitationCount ;
      cito:globalCountValue "206"^^xsd:integer ;
      cito:globalCountSource <>;http://scholar.google.com
      cito:globalCountDate "2009-03-11"^^xsd:date ;
] ; 

‘A cites B’와 'B is cited by A'는 모두 다른 진술에서 추론가능하기 때문에 이 트리플 세트에는 의도적인 중복이 있다. 이정도의 중복은 실제적 유용성을 갖는데, 직접 인용문을 사용하여 인용 네트워크 시각화 프로그램 입력을 깔끔하게 할 수 있기 때문이고 또 두 번째 트리플의 명시적이고도 호혜적인 진술은 이후 두 세트가 분리되어도 인용 작업의 정체성을 보존할 수 있기 때문이다. 그림 1(위에)에서 제시된 것과는 다른 관점이 그림 2(아래)에서 제시된다. 구글 스콜라의 수치 데이터를 이용하였는데, 노드 크기는 각각 2006년 이전 참조에서 얻은 global 인용 횟수의 세제곱근에 비례하는 반면 각각의 인용 참조 연결은 피인용문헌의 인용 문헌에 대한 중요성을 암시하는 각각의 인용 문헌 내에서 인용 문헌의 local 인용 횟수의 제곱근에 비례한다.

Cnetwork2.jpg

characterization of cited works: use of the FRBR classification model

CiTO의 네번째 목적은 피인용 작업들을 특징지어서, CiTO를 적용한 참고 문헌 목록을 보는 사람들이 그 인용의 특성에 대해 더 나은 평가를 할 수 있게 된다. 이 특성화 작업에서 CiTO는 미국 의회도서관에서 출판물의 다른 양상을 특징화하려는 목적으로 만든 FRBR(Functional Requirements for Bibliographic Records)의 분류모델을 채택하였다. 독자들은 최근에 FRBR이 CIDOC CRM(Conceptual Reference Model)과 조화를 이루어서, CIDOC CRM을 이용하여 FRBR을 인코딩한 FRBRoo를 표현하게 된 것에 흥미를 느낄지도 모른다. 이 FRBR의 분류는 Works, Expressions, Manifestations, Items로 구분된다.

  • Works : 뚜렷한 지적 생산물이거나 예술적 생산물로, 다양한 표현방식을 통하여 인식된 추상적 개념이다. 예로, 당신의 가장 최근 연구 논문이 될수도 있다.
  • Expressions : Work가 물리적 또는 전자적인 형태로 구체화될때마다 취하는 구체적인 형태이다. 당신의 최근 연구 논문에 대해서, 5번째 원고, 선인쇄본(preprint), 출판사가 할당한 DOI(Digital Object Identifier)를 가진 출판버전 등이 모두 같은 작업에 대한 표현들이다.
  • Manifestations : 학술적 작업의 표현을 표명하는 것은 그것의 특정한 물리적 또는 전자적 구현을 정의한다. 만약 당신의 최근 연구 논문이 인쇄 저널에서, HTML페이지로 된 저널의 온라인 버전에서, 또 다운 가능한 PDF로 하나의 아티클로서 등장한다면, 이것들은 당신의 작업의 기록 버전의 표현에 대해 3가지의 분리된 표명이다. 같은 DOI를 갖고 있지만 같은 정보에 대해 다른 방식으로 보여질 수 있는 것이다.
  • Items : 하나의 표명에 대한 단일한 예제적 사본으로, 사람이 소유할 수 있는 물리적인 혹은 전자적인 객체이다. 예를들어 책상위의 저날 아티클 복사본 한 부나 출판사에서 구매한 아티클의 PDF파일이나 컴퓨터 하드 드라이브에 디지털 형태로 놓인 파일이다.

CiTO에서 cito:Work의 정의는 주로 서지 참조를 포함하는 학술저작을 인용하거나 인용되는 작업에 국한되며, 그것이 없는 희곡이나 사진같은 예술적 작업은 배제시킨다. 추가적으로 원래의 FRBR 명세서는 FRBR 분류가 Expression의 물리적 manifestation 뿐만 아니라 디지털 작업에도 적용되는지에 대한 것이 다소 애매했다면, CiTO에서는 그렇지 않다. 예를 들어 cito:Workfrbr:Work의 하위 클래스이지 동등한 클래스가 아니다.

그러나 cito:Work가 인용 작업과 피인용 작업 모두를 포괄하고, 학술논문에서 인용된 특정한 것들이 학술저작으로서 엄격하게 고려되어왔기 때문에 다소 더 제한적인 ScholaryWork라는 용어 대신 Work라는 용어를 CiTO에 적용하였다.

CiTO는 cito:Work에 대해서는 41개의 하위 클래스를, cito:Expression에 대해서는 43개의 하위클래스를 정의하고 있으며 각각 표3표4에서 볼 수 있다. 현재의 학술적 실제에서 인용은 대개 작업의 피인용 표현에 대한 표명 명세서를 요구하지 않지만, CiTO는 표5에서 보이는 cito:Menifestation의 하위 클래스 5개를 이용하여 Manifestation의 특성을 기록할 수 있게 하고 있다.

To what do citations refer?

근본적인 철학적 단계에서 인용이 대상은 작업(Work) 그 자체이다. 그러나 CiTO 인용의 객체가 일반적으로 특정한 Work의 표인이 되어야만 하는 실용적인 이유가 3가지가 있다.

먼저, LOD로서 RDF 인용 정보를 출판하는 것은 인용 작업과 피인용 작업 모두 URI(Uniform Resource Identifiers)로 참조하는 것이 필요하다. FRBR의 작업은 추상적인 개념이기 때문에 URI를 할당받지 않으며, 대신 참조할수 없는 URI를 생성하기 위해 이용되는 DOI를 할당받는다. 둘째로, 원칙적으로는 인용이 작업의 표현을 가지고 있어야 맞지만, 예를 들어 다른 나라 언어로 번역된 경우는 실제로 특정일에 작가가 원래만든 인용이 작업물의 특정한 표현이 되는데, 즉 특정 출판된 기록의 버전이다. 셋째로, CiTO는 피인용 작업에서 텍스트 내의 인용 횟수를 구체화하기 위해 이용될지도 모르며, 피인용 작업의 global 인용 횟수는 local 인용 때에 받은 것이다. 당신의 가장 최근 연구 논문에서 인용된 특정 작업들에 대한 텍스트 내의 인용 횟수와 인용된 참고문헌들의 총 갯수는 그 논문이 다양한 원고들을 통해 발달되어서 변화했다. 그러므로, CiTO에서 텍스트 내의 인용 횟수를 결정함에 있어서 중요한 버전은 최종 출판된 기록의 표현 버전이다. 그래서 이런 이유들로 cito:cites의 도메인과 범위는 cito:Work, cito:Expression, cito:Manifestation으로 제한된다.

Other CiTO capabilities

pass

CiTO vocabulary definitions

CiTO를 만들면서 그 클래스와 프로퍼티를 정의하는데 있어서 대단한 노력이 들었다. 이 정의들은 온톨로지 자체와 논문의 부록 2번에 텍스트 형태로 제공된다. CiTO는 DCMI 유형 어휘 정의를 채택하였으며, 다른 CiTO 클래스 이름은 SWAP에서 정의된 어휘의 모든 항목을 포함한다.

Granularity and scope

고전적이고 서지적인 학문에 대해 논평적인 관습은 피인용 작업의 개별 섹션, 문단, 구절을 인용하는 방법론을 발달시켜왔다. 이와 대조적으로 오늘날 과학적 인용은 전형적으로 완성된 개체로서 피인용 작업을 가져온다.

The relationship of CiTO with other metadata schemas and ontologies

  • and FRBR : FRBR의 분류가 CiTO에 적용됨
  • and SWAP(Scholarly Works Application Profile)  : 학술 작업에 대해 메타데이터 요구사항을 기술하는 것으로 FRBR 모델을 따르고 있지만 CiTO와는 범위가 다르다. SWAP은 기금 단체나 저작권 협회 같은 서지인용 범위 바깥을 둘러싸는 환경에 대해서도 고려하고 있다. 반대로 CITO는 인용 작업과 피인용 작업 사이의 실제적이고 은유적인 관계만을 고려한다. 가능한한 CiTO는 SWAP의 용어와 클래스 정의를 적용하였지만 안타깝게도 SWAP은 RDF 스키마를 잘 따르지 않는다.
  • and BIBO : 서지 참조를 특징짓기 위한 메타데이터 스키마와 온톨로지를 생성하려는 이전의 많은 노력 중에서도, OWL로 작성된 BIBO는 피인용 작업의 성격을 RDF로 세부적으로 기술할 수 있게 해준다. 전통적인 학술 작업을 포괄하면서, 연표나 방송자료, 법률 문서 등까지 포함할 수 있지만 그것은 CiTO 하위 클래스의 대부분과는 동등한 클래스를 갖고 있지 않다. 안타깝게도, BIBO는 FRBR의 분류 체계를 따르지 않아서 학술적인 명명법에 있어서는 정밀성이 부족하다.
  • and SWAN : pass

Future revisions of CiTO, and harmonization with other ontologies

미래의 작업에서 CiTO는 더 완전하게 다른 어휘들과 통합될 것이다. CiTO의 주요 목적은 인용을 특징짓는 것인 반면 BIBO는 피인용 작업들을 특성화하는 것이기 때문에 이 온톨로지들은 기본적으로 공통되는 부분이 있다.(orthogonal) 추후에 작업에서 가능한 많은 부분 CiTO와 BIBO가 조화를 이룰 것이라 예상된다.

Example of CiTO in use

Conclusion