"DH Workshop 20240913 발표문(서동신)"의 두 판 사이의 차이

DHLab
이동: 둘러보기, 검색
(시맨틱 데이터 구현 예시)
(연구 논문 목차)
 
(같은 사용자의 중간 판 7개는 보이지 않습니다)
2번째 줄: 2번째 줄:
  
  
=디지털 원어민 세대의 한문고전 교육을 위한 동양고전DB 모델 개발 연구=
+
=한국학 데이터 활용성 제고 방안 연구 : 데이터의 기술(記述) 형식을 중심으로=
<p style="text-align:right">김현 (한국학중앙연구원 인문정보학 교수)</p>
+
<p style="text-align:right">서동신 (한국학중앙연구원 인문정보학 박사과정 수료, 한국학정보화실 정전문위원)</p>
<!-- p style="text-align:right">서동신 (한국학중앙연구원 인문정보학 박사과정 수료, 한국학정보화실 정전문위원)</p -->
 
  
  
11번째 줄: 10번째 줄:
 
===연구 목적===
 
===연구 목적===
  
전통문화연구회에서 운영하는 동양고전종합DB는 책으로 출판된 한문고전번역서의 텍스트를 온라인 상에서 검색하고 읽을 수 있도록 하는 서비스이다. 이것은 소비자들의 콘텐츠에 대한 접근성을 획기적으로 향상시켜서, 시간·공간의 제약 없이 동양 고전의 세계를 들여다 볼 수 있게 하는 역할을 하고 있지만, 이러한 방식의 정보화는 어디까지나 매체의 전환을 위주로 한 것이며, 그 매체에 담긴 콘텐츠의 내용을 디지털 데이터로 활용할 수 있게 하는 것은 아니다. 데이터베이스에 수록된 텍스트가 서로 어떠한 관계에 있는지 살펴보거나, 내용을 좀 더 깊이 있게 이해하기 위해서 유관한 참고자료를 찾는 일은 모두 그 데이터베이스 밖에서 별도의 일로 수행해야 한다.  
+
이 논문은 오늘날 이루어지는 한국학 분야에서 연구와 교육 및 창의적 저작 활동의 기반 요소인 한국학 데이터가 한층 더 효과적으로 활용되도록 하는 방안을 모색하는 것을 목적으로 한다. 그리고 한국학 데이터의 활용성을 높이기 위한 방안 도출을 위해 데이터의 기술(記述) 형식을 최우선 고려 대상으로 삼는다. 이는 정보기술의 기반 위에서 전개되는 이 시대 인문학 연구·향유의 환경에 맞게 전 세계적 추세로 진행되고 있는 각 분야별 데이터 기술·교환 형식의 표준화 연구 동향과 문제의식을 공유하되, 기존 학문 분야의 데이터 특성을 최대한 유지하면서 그것의 활용성을 높이고 이와 더불어 차세대 한국학 데이터 기술 형식에 대한 데팍토 표준의 유도를 위한 전략을 제안하는 데에 의의가 있다.
  
21세기 데이터 시대의 디지털 저작물은 텍스트(text)뿐만 아니라, 그 텍스트 속의 文脈(context)도 데이터로 기록하여 독자들로 하여금 의미 있는 지식을 보다 넓고 깊게 탐구할 수 있게 하는 방향으로 진화해 가고 있다. 이러한 새로운 개념의 디지털 저작물은 교육이나 연구를 위한 문헌 자료로서의 역할을 넘어서서 교육·연구활동을 수행하는 무대이자 환경의 역할을 수행한다. 본 연구는 전통문화연구회의 동양고전 데이터베이스가 그와 같은 미래형 디지털 저작물로 진화하기 위해서 어떻게 새롭게 구성되어야 하며, 그러한 발전을 이루기 위해서 단계적으로 추진해야 할 편찬 과제가 무엇인지를 제시하는 것을 목적으로 한다.
+
아울러 통상적으로 일컫는 ‘데이터 표준화’라는 표현은 학술적 내포가 특히 중요한 인문학자들에게 오해와 왜곡을 발생시킬 소지가 있기에 본고에서는 필요 시 ‘데이터 기술 형식의 표준화’와 같은 형태로 표현할 것이며, 이러한 용어 사용상의 관점도 존중될 필요가 있다는 인식이 여타 학계와 업계에 공유될 것을 제안한다.  
  
===연구 내용===
+
===연구 내용과 범위===
  
현재의 동양고전종합DB는 『論語』의 경문과 주석문, 번역문 텍스트를 전통적인 편제에 따라 순차적인 텍스트로 제공한다.  본 연구를 통해 강구한 새로운 데이터베이스 모델은 텍스트를 독자의 관심과 요구에 따라 다양한 형태로 편성해서 볼 수 있게 하고, 그렇게 함으로써 보다 효과적으로 텍스트 속의 지식에 접근할 수 있도록 하는 시맨틱 데이터베이스(Semantic Database, 의미 기반 데이터베이스)이다.  
+
이 논문에서 다루는 활용성 제고 및 표준화 연구의 대상은 한국학 정보화의 대상이 되는 데이터 및 그것의 기술 형식이며, 이 데이터 기술 형식에 대한 표준화 수행의 범위는 필자가 상정한 지형도, 즉 ‘통합플랫폼과 공공데이터의 상보적 역할’에 의거하여 공공데이터 정책의 측면과 통합플랫폼 운영의 측면에서 적용 가능한 영역까지로 한다. 여기서의 ‘통합플랫폼’은 여러 곳에서 ‘통합플랫폼’이라는 명명하에 제작된 모든 서비스 채널을 포괄하는 것이 아니라 ‘국가지식정보 통합플랫폼’(‘디지털집현전’)과 ‘한국학자료통합플랫폼’ 두 가지를 통칭하는 것이다. 현 집필 시점까지는 한국학 데이터 기술 형식의 표준화와 관련하여 핵심적으로 상정 가능한 범위가 그러하기 때문에, 본고에서 언급하는 ‘통합플랫폼’의 개념적 범위를 이렇게 상정하기로 한다.
  
이와 같은 기능을 제공할 시맨틱 데이터베이스의 구현을 위해서는 텍스트 속의 중요한 의미 요소에 대한 정보를 식별하고, 그 요소들 사이의 의미론적 연관관계를 데이터로 기술하는 과정을 거쳐야 한다. 본 연구에서는 『論語』 경문 텍스트 속에서 ‘인명’, ‘지명’, ‘역사적·사상적 개념어’, ‘문헌 전거’ 등의 정보 요소를 추출하고, 이 요소들 사이의 의미론적 연관관계를 기계가독형 텍스트의 표준 문법이라고 할 수 있는 RDF(Resource Description Framework) 문으로 기술하는 방법으로  『論語』  경문 속 정보 요소의 데이터 네트워크를 구현하고, 이를 기반으로 『論語』 경문 시맨틱 데이터베이스의 데이터 모델을 제시하였다. .
+
데이터 활용성 제고의 방법으로는 조직 전반에 걸친 데이터 기술 형식 표준화 및 규격화, 정보 공유를 위해 유지해야 할 공통 데이터 요소 도출, 데이터 요소의 등록·관리 체계 구축, 정보시스템의 개발 및 유지보수 시 승인된 데이터 요소 활용 등을 고려할 수 있는데, 이 모두를 개괄하여 한 마디로 넓은 의미의 ‘표준화’라고 집약할 수도 있다. 본고에서는 한국학 데이터의 활용성 제고 방안으로서 그 첫 번째 요소인 데이터 기술 형식 표준화 및 규격화를 중심으로 연구를 수행하되, 나머지 요소들을 함께 고려하여 총체적으로 연계된 체계에서의 방안을 모색할 것이다.
  
 
===기대 효과 및 활용 방안===
 
===기대 효과 및 활용 방안===
  
본 연구를 통해 강구한 한문고전 시맨틱 데이터베이스 구현 방법론과 활용 전략은 전통문화연구회의 동양고전종합DB를 ‘디지털 원어민 세대의 한문고전 교육을 위한 교육 환경’으로 발전시킬 수 있는 방안을 제시할 것이며, 전통문화연구회의 정보화 분야 중장기 발전 계획 수립을 위한 테스트 베드로 활용할 수 있을 것이다.  
+
본 연구를 통해 도출된 방안이 제 역할을 하게 된다면, 다음과 같은 효과를 기대할 있을 것이다. 우선 중복된 데이터나 조직・업무・시스템별 불일치 데이터가 줄어들기 때문에 각종 의사소통을 포함한 정보의 파악과 비교 확인 과정에서 소요될 시간과 에너지를 줄여 연구와 업무의 효율 및 적시성이 높아진다. 무엇보다도 이는 한국학 관련 연구자와 실무자들로 하여금 오류가 줄어든 정확도 높은 학술자료를 이용할 수 있게 할 뿐만 아니라 올바른 의사결정을 내릴 수 있도록 한다. 이는 개인과 조직 및 국가의 경쟁력을 확보하는 데에 적잖은 영향을 끼친다. 그리고 데이터의 통합 시 불필요한 부대 작업을 줄이고 신속・정확한 처리가 가능하며, 정보시스템의 변경과 유지보수를 용이하게 하여 비용과 시간의 절감은 물론 안정적인 운영 및 긴급 상황에서의 신속・정확한 조치가 가능해진다. 이는 미래의 다양한 상황에 대한 예측 가능성도 높이는 결과를 가져온다. 더 나아가 기존에 통용되어 온 한국학 데이터 기술 형식을 표준화하는 차원을 넘어 현재 성장하고 있는 차세대 한국학 데이터 기술 형식의 지능화 전략까지 제대로 실현된다면, 동음이의어나 이음동의어(이칭 포함)를 비롯한 다양한 혼란 요소를 줄이고 미지의 연계 정보를 계발하여 글로벌 지식베이스 기반의 정치(精緻)한 지식을 효율적으로 전달할 수 있을 뿐만 아니라 이를 통해 인공지능의 추론 능력 고도화와 신뢰성 증대 및 메타버스에서의 원활한 지식 콘텐츠 유통이 가능해질 것이다.  
  
 
==연구 논문 목차==
 
==연구 논문 목차==
29번째 줄: 28번째 줄:
 
<pre>
 
<pre>
 
Ⅰ. 서론
 
Ⅰ. 서론
Ⅱ. 동양고전종합DB의 개선 과제와 발전 방향
+
 1. 연구의 목적
 1. 동양 고전 정보화 사업의 개선 과제
+
 2. 선행연구 검토
 2. 데이터 시대의 고전 정보화 사업 추진 전략
+
 3. 연구 방법과 범위
Ⅲ. 시맨틱 논어(論語) 데이터베이스 구현 전략
+
 
 1. 『論語注疏』의 텍스트 편찬 체제
+
Ⅱ. 한국학 데이터 활용성 제고의 토대
 2. 『論語注疏』의 지식 요소
+
 1. 데이터 표준화, 그 오해
Ⅳ. 시맨틱 논어(論語) 데이터베이스 온톨로지 설계
+
  1) 데이터의 내포
 1. 온톨로지란 설계의 기본 방향
+
  2) 데이터 고르기
 2. 클래스(Class) 및 속성(Attribute: Datatype Property) 설계
+
 2. 데이터 기술(記述) 형식과 한국학
 3. 관계성(Relation: Object Property) 설계
+
  1) 데이터의 기술 형식
. 시맨틱 논어(論語) 데이터베이스 구현
+
  2) 한국학 정보화의 터 고르기
 1. 시맨틱 데이터 편찬
+
 
 2. 시맨틱 논어(論語) 데이터 시각화
+
Ⅲ. 한국학 데이터 기술 형식 표준화의 지형도
Ⅵ. 시맨틱 동양고전종합DB와 漢文 古典 敎育
+
 1. 공공데이터 진영의 적극적 역할
. 결론
+
  1) 공공데이터 논의를 위한 솎아 내기
 +
  2) 공공기관의 데이터베이스 표준화
 +
  3) 공공데이터 품질관리 수준진단·평가
 +
 2. 통합플랫폼 진영의 온정적 역할
 +
  1) 통합플랫폼 논의를 위한 이랑짓기
 +
  2) 국가지식정보 통합플랫폼
 +
  3) 한국학자료 통합플랫폼
 +
 
 +
. 한국학 데이터 활용성 제고 방안
 +
 1. 데이터 기술 형식의 표준화 방안
 +
  1) DB표준-기관표준-공통표준 수립
 +
  2) 공공데이터 제공 표준의 보완
 +
  3) 범정부 메타데이터 표준 관리항목 및 기타 고려사항
 +
 2. 데이터 기술 형식의 지능화 전략
 +
  1) 메타데이터 레지스트리와 마스터데이터 관리
 +
  2) 시맨틱 데이터와 인공지능의 연계
 +
  3) 메타버스와 한국학 콘텐츠
 +
 
 +
. 맺음말
 
</pre>
 
</pre>
 +
 +
==발표 자료 (PDF Download)==
 +
<br/>
 +
[[파일:Pdf-icon.png|60px|link=http://digerati.aks.ac.kr/DhLab/2020/학위논문중간발표/한국학데이터활용성제고방안연구_서동신_240913중간발표PT자료.pdf]]
 +
[http://digerati.aks.ac.kr/DhLab/2024/학위논문중간발표/한국학데이터활용성제고방안연구_서동신_240913중간발표PT자료.pdf 한국학 데이터 활용성 제고 방안 연구]
 +
<br/>
  
 
==중간발표용 논문 정리 자료 (PDF Download)==
 
==중간발표용 논문 정리 자료 (PDF Download)==
54번째 줄: 77번째 줄:
 
==중간발표용 논문 정리 자료 (PDF View)==
 
==중간발표용 논문 정리 자료 (PDF View)==
 
<!-- ==시맨틱 데이터 구현 예시== -->
 
<!-- ==시맨틱 데이터 구현 예시== -->
[[파일:한국학데이터활용성제고방안연구_서동신_240913중간발표용초고.pdf]]  
+
[[파일:한국학데이터활용성제고방안연구_서동신_240913중간발표용초고.pdf|960픽셀||왼쪽]]
 +
[[파일:한국학데이터활용성제고방안연구_서동신_240913중간발표용초고.pdf|960픽셀|page=2|왼쪽]]  
 
<!-- rf. howto for PDF Handler extension : https://weftnwarp.kr/site-it/archives/%EB%AF%B8%EB%94%94%EC%96%B4%EC%9C%84%ED%82%A4mediawiki-%EA%B8%B0%EB%B3%B8-%EC%A0%9C%EA%B3%B5-%EC%9D%B5%EC%8A%A4%ED%85%90%EC%85%98extension-pdf-handler-%EC%84%A4%EC%B9%98%EC%99%80-%ED%99%9C/#PDF_Handler -->  
 
<!-- rf. howto for PDF Handler extension : https://weftnwarp.kr/site-it/archives/%EB%AF%B8%EB%94%94%EC%96%B4%EC%9C%84%ED%82%A4mediawiki-%EA%B8%B0%EB%B3%B8-%EC%A0%9C%EA%B3%B5-%EC%9D%B5%EC%8A%A4%ED%85%90%EC%85%98extension-pdf-handler-%EC%84%A4%EC%B9%98%EC%99%80-%ED%99%9C/#PDF_Handler -->  
 
<!-- * 孔子 제자들의 仁
 
<!-- * 孔子 제자들의 仁

2024년 9월 13일 (금) 02:06 기준 최신판

DH Workshop


한국학 데이터 활용성 제고 방안 연구 : 데이터의 기술(記述) 형식을 중심으로

서동신 (한국학중앙연구원 인문정보학 박사과정 수료, 한국학정보화실 정전문위원)


연구 개요

연구 목적

이 논문은 오늘날 이루어지는 한국학 분야에서 연구와 교육 및 창의적 저작 활동의 기반 요소인 한국학 데이터가 한층 더 효과적으로 활용되도록 하는 방안을 모색하는 것을 목적으로 한다. 그리고 한국학 데이터의 활용성을 높이기 위한 방안 도출을 위해 데이터의 기술(記述) 형식을 최우선 고려 대상으로 삼는다. 이는 정보기술의 기반 위에서 전개되는 이 시대 인문학 연구·향유의 환경에 맞게 전 세계적 추세로 진행되고 있는 각 분야별 데이터 기술·교환 형식의 표준화 연구 동향과 문제의식을 공유하되, 기존 학문 분야의 데이터 특성을 최대한 유지하면서 그것의 활용성을 높이고 이와 더불어 차세대 한국학 데이터 기술 형식에 대한 데팍토 표준의 유도를 위한 전략을 제안하는 데에 의의가 있다.

아울러 통상적으로 일컫는 ‘데이터 표준화’라는 표현은 학술적 내포가 특히 중요한 인문학자들에게 오해와 왜곡을 발생시킬 소지가 있기에 본고에서는 필요 시 ‘데이터 기술 형식의 표준화’와 같은 형태로 표현할 것이며, 이러한 용어 사용상의 관점도 존중될 필요가 있다는 인식이 여타 학계와 업계에 공유될 것을 제안한다.

연구 내용과 범위

이 논문에서 다루는 활용성 제고 및 표준화 연구의 대상은 한국학 정보화의 대상이 되는 데이터 및 그것의 기술 형식이며, 이 데이터 기술 형식에 대한 표준화 수행의 범위는 필자가 상정한 지형도, 즉 ‘통합플랫폼과 공공데이터의 상보적 역할’에 의거하여 공공데이터 정책의 측면과 통합플랫폼 운영의 측면에서 적용 가능한 영역까지로 한다. 여기서의 ‘통합플랫폼’은 여러 곳에서 ‘통합플랫폼’이라는 명명하에 제작된 모든 서비스 채널을 포괄하는 것이 아니라 ‘국가지식정보 통합플랫폼’(‘디지털집현전’)과 ‘한국학자료통합플랫폼’ 두 가지를 통칭하는 것이다. 현 집필 시점까지는 한국학 데이터 기술 형식의 표준화와 관련하여 핵심적으로 상정 가능한 범위가 그러하기 때문에, 본고에서 언급하는 ‘통합플랫폼’의 개념적 범위를 이렇게 상정하기로 한다.

데이터 활용성 제고의 방법으로는 조직 전반에 걸친 데이터 기술 형식 표준화 및 규격화, 정보 공유를 위해 유지해야 할 공통 데이터 요소 도출, 데이터 요소의 등록·관리 체계 구축, 정보시스템의 개발 및 유지보수 시 승인된 데이터 요소 활용 등을 고려할 수 있는데, 이 모두를 개괄하여 한 마디로 넓은 의미의 ‘표준화’라고 집약할 수도 있다. 본고에서는 한국학 데이터의 활용성 제고 방안으로서 그 첫 번째 요소인 데이터 기술 형식 표준화 및 규격화를 중심으로 연구를 수행하되, 나머지 요소들을 함께 고려하여 총체적으로 연계된 체계에서의 방안을 모색할 것이다.

기대 효과 및 활용 방안

본 연구를 통해 도출된 방안이 제 역할을 하게 된다면, 다음과 같은 효과를 기대할 수 있을 것이다. 우선 중복된 데이터나 조직・업무・시스템별 불일치 데이터가 줄어들기 때문에 각종 의사소통을 포함한 정보의 파악과 비교 확인 과정에서 소요될 시간과 에너지를 줄여 연구와 업무의 효율 및 적시성이 높아진다. 무엇보다도 이는 한국학 관련 연구자와 실무자들로 하여금 오류가 줄어든 정확도 높은 학술자료를 이용할 수 있게 할 뿐만 아니라 올바른 의사결정을 내릴 수 있도록 한다. 이는 개인과 조직 및 국가의 경쟁력을 확보하는 데에 적잖은 영향을 끼친다. 그리고 데이터의 통합 시 불필요한 부대 작업을 줄이고 신속・정확한 처리가 가능하며, 정보시스템의 변경과 유지보수를 용이하게 하여 비용과 시간의 절감은 물론 안정적인 운영 및 긴급 상황에서의 신속・정확한 조치가 가능해진다. 이는 미래의 다양한 상황에 대한 예측 가능성도 높이는 결과를 가져온다. 더 나아가 기존에 통용되어 온 한국학 데이터 기술 형식을 표준화하는 차원을 넘어 현재 성장하고 있는 차세대 한국학 데이터 기술 형식의 지능화 전략까지 제대로 실현된다면, 동음이의어나 이음동의어(이칭 포함)를 비롯한 다양한 혼란 요소를 줄이고 미지의 연계 정보를 계발하여 글로벌 지식베이스 기반의 정치(精緻)한 지식을 효율적으로 전달할 수 있을 뿐만 아니라 이를 통해 인공지능의 추론 능력 고도화와 신뢰성 증대 및 메타버스에서의 원활한 지식 콘텐츠 유통이 가능해질 것이다.

연구 논문 목차

Ⅰ. 서론
 1. 연구의 목적
 2. 선행연구 검토
 3. 연구 방법과 범위

Ⅱ. 한국학 데이터 활용성 제고의 토대
 1. 데이터 표준화, 그 오해
  1) 데이터의 내포
  2) 데이터 고르기
 2. 데이터 기술(記述) 형식과 한국학
  1) 데이터의 기술 형식
  2) 한국학 정보화의 터 고르기

Ⅲ. 한국학 데이터 기술 형식 표준화의 지형도
 1. 공공데이터 진영의 적극적 역할
  1) 공공데이터 논의를 위한 솎아 내기
  2) 공공기관의 데이터베이스 표준화
  3) 공공데이터 품질관리 수준진단·평가
 2. 통합플랫폼 진영의 온정적 역할
  1) 통합플랫폼 논의를 위한 이랑짓기
  2) 국가지식정보 통합플랫폼
  3) 한국학자료 통합플랫폼

Ⅳ. 한국학 데이터 활용성 제고 방안
 1. 데이터 기술 형식의 표준화 방안
  1) DB표준-기관표준-공통표준 수립
  2) 공공데이터 제공 표준의 보완
  3) 범정부 메타데이터 표준 관리항목 및 기타 고려사항
 2. 데이터 기술 형식의 지능화 전략
  1) 메타데이터 레지스트리와 마스터데이터 관리
  2) 시맨틱 데이터와 인공지능의 연계
  3) 메타버스와 한국학 콘텐츠

Ⅴ. 맺음말

발표 자료 (PDF Download)


Pdf-icon.png 한국학 데이터 활용성 제고 방안 연구

중간발표용 논문 정리 자료 (PDF Download)


Pdf-icon.png 한국학 데이터 활용성 제고 방안 연구

중간발표용 논문 정리 자료 (PDF View)

한국학데이터활용성제고방안연구 서동신 240913중간발표용초고.pdf
한국학데이터활용성제고방안연구 서동신 240913중간발표용초고.pdf