결론: 데이터 기반의 시맨틱 아카이브와 스토리서사

논문연구
이동: 둘러보기, 검색

역사 기록물에서 추출한 지식요소 즉 데이터를 바탕으로 스토리를 재현하는 큐레이션 작업의 모델

국채보상운동 기록물을 바탕으로 설계한 시맨틱 데이터베이스에서 노드들 간의 관계와 맥락을 따라 6개의 중심적인 주제가 발견되었다.
이들 주제를 스토리로 큐레이션하는 모델을 예시하였다. 이렇게 구축한 데이터들 간의 관계에서 자연스럽게 드러나는 서사요소, 즉 스토리 주제를 시각화하여
큐레이션 모델의 새로운 패러다임으로 제시했다. 각 주제를 요약하면 아래와 같다.

(1) 아시아 지식인들 사이의 교류와 연대,
(2) 국채보상운동과 출판문화운동의 관계
당시 서포(書舖), 서사(書肆), 책사(冊舍)로 불리던 서점(書店)은 오늘날의 라디오나 TV 방송과 같은 미디어가 존재하지 않았던 국채보상운동기에
책을 발간할 뿐 아니라 중국와 일본에서 수입하여 번역, 출판하고 유통함으로써, 신문과 함께 가장 중요한 신지식 공급과 소통의 도구였다.
(3) 국채보상운동, 독립운동, 계몽교육운동의 중심인물들,
(4) 신문화의 문예부흥기,
(5) 여성의 국채보상운동 참여와 단체 활동,
(6) 이토 히로부미 통감의 적극적 국채보상운동 방해정책과 그로 인한 영일간의 외교 갈등
이들 주제는 사실상 본 연구자가 국채보상운동 아카이브 구축에 관한 연구를 진행하면서 가장 관심 있게 들여다보고 싶었던 부분이었다.
따라서 데이터 수집과 온톨로지 설계에 있어서도 이들 주제에대한 해답을 제시할 수 있는 근거 자료가 되는 아카이브의 구축을 지향하였다고 할 수 있다.

처음부터 ‘큐레이션의 기획 의도’를 갖고 아카이브를 설계하고 추진하였다고 해도 실질적인 데이터의 수집과 정리 작업은 역사적으로 존재했던 사실의 기반 위에서 이루어지는 것이며,
없던 데이터를 생성하거나 변조할 수는 없기 때문이다. 그러므로 존재하는 데이터의 한계로 인해 큐레이션의 목적을 이루지 못할 수도 있는 것이다.


데이터베이스를 구축하기 위한 온톨로지 설계와 데이터베이스 구축 과정에서 데이터가 근거를 제시할 수 있는 주제 영역을 선정하게 되는데
이것은 디지털 큐레이션의 목적에 맞는 디지털 아카이브를 구축하는 데 있어서 필수적인 선행 과정이다.
예견하는 주제가 있음으로써 그 주제의 스토리를 찾을 수 있는 데이터 요소 사이의 ‘연관 관계’를 설정할 수 있다.
기록물에서 확인되는 연관 관계를 시맨틱 데이터의 구조 안에 규정함으로써 그 관계를 기계가 인식할 수 있게 되고,
그러한 환경에서만 시맨틱 아카이브는 이용자의 지적 호기심에 답하는 자료를 찾아 줄 수 있는 것이다.
이러한 접근법은 전통적 인문학의 영역이 갖는 장벽과 한계를 뛰어넘어 지식정보 간의 연계망을 계속 확장해 갈 수 있게 해 준다.

1907년 무렵 있었던 국채보상운동 뿐 아니라 1997년 대한민국이 겪은 금융위기 때의 금모으기 운동, 또는 유사한 위기 상황에 처한 외국의 여러 사례에 관한 정보까지 주제의 일부로 포함할 수 있다.
역사적 데이터 속에서 크고 작은 스토리 요소와 맥락을 찾는 시도는 관심 밖에 놓여 있던 풍부한 역사적 데이터에서 "근거 있는" 창의적 추론의 가능성을 보여준다.
데이터라는 지식정보 조각들을 역사라는 큰 기획의 부분으로 이해할 때 문학적, 예술적, 인간적 상상력을 자극하는 새로운 서사의 자료가 될 수 있다.
새롭게 발견되는 지식요소와 의미는 다시 국채보상운동 디지털 아카이브에 추가되어 그 지식망을 계속 확장해 나갈수 있다.
이처럼 확장가능성이 열려 있고 다른 지식 자원들과 연결된 디지털 아카이브는 미래의 연구자와 예술 창조자들이 유용하게 활용할 수 있을 것이다.

본 연구의 의의는 다음과 같이 요약할 수 있다.

첫째, 기존 국채보상운동 연구의 시각을 넓혀 시대적 상황과 광범위한 지리적 지식요소를 포함할 수 있다는 점이다.
이것은 백과사전적 아카이브(엔사이브) 모델인데 맥락 정보가 포함된 통합적 시맨틱 데이터베이스를 구축하는 방법이다.
기존의 국채보상운동과 그 연관 기록물 내용의 디지털 데이터화 작업은 주로 기록물 자체에 대한 지식만 제공하였다.
반면에 시맨틱 데이터베이스로 구축되는 새로운 개념의 아카이브는 자료와 자료 사이의 관계, 지식요소 간의 맥락 정보를 중시하고 이들을 데이터에 구조적으로 포함한다.

둘째, 본 연구가 제시하는 큐레이션 모델은 역사를 보는 특정한 시각의 선택을 강요하지 않는다는 특징이 있다.
결과적으로 역사적 인물에 대한 평가와 사상의 충돌과 갈등을 탈피 할 수 있는 가능성을 열어 준다는 의의를 가진다.
우리나라 근대사 서술에는 연구 주체와 시기, 역사관에 따라 극심한 격차와 갈등이 존재해 왔다.
그런 이유로 한 시대 역사가 갖는 수많은 측면과 특징들 중에서 유독 근대사에 관해서는 정치사, 이념사, 투쟁사에 편중한 서술에 치우치는 경향이 있었다.
국채보상운동 아카이브는 특정 영역에 국한된 데이터베이스를 설계하지 않고 역사적 사건과 관련된 다방면의 데이터를 통합적으로 포함하는 것을 목표로 하는 것이다.

셋째, 기존의 역사적 사건의 기술이 그 사건에 직접 관련된 자료에만 한정되는 경향이 있었던 데에 반해 본 연구가 지향하는 시맨틱 아카이브는 사건의 직접적 자료뿐만 아니라
국내외 시대적 환경에 관한 자료 및 그 상호 관계성을 살필 수 있는 근거 자료들을 모두 취급할 수 있는 방법을 강구하였다.
지금까지 해 온 것처럼 대상을 직접적 관련성의 범위에 국한하여 맥락을 파악하는 것은 스토리텔링 측면에서 등장하는 내용이 빈약하고 줄거리가 단조롭게 될 가능성이 크다.
한말과 대한제국기의 시대적 상황을 중심으로 여러 차원의 환경을 살피고, 그에 관한 아카이브의 구조와 자료 속의 맥락 정보를 시맨틱 데이터에 담고자 하였다.
이는 국채보상운동과 직접관련된 데이터뿐 아니라 운동이 추진되고 확산되고 좌절되게 한 정치적, 사회적, 국제적 맥락을 알려주는 지식의 아카이브로서 기능할 수 있게 하는 방법을 제시한 것이다.

이러한 아카이브 모델은 연구의 여지가 남아 있는 근대사의 다른 사건들에도 활용될 수 있을 것으로 기대한다.
데이터가 영역의 경계나 특정 역사관에 의해 배제되거나 제한되지 않고 통합적으로 구성된다면 자연히 과격하게 일방으로 치우진 정보는
그 반대 시각의 자료들에 의하여 완화되어 균형을 이룰 수 있을 것이다.
역사를 연구하고 가르치는 목적은 연구, 교육, 오락 등 다양할 수 있으나 특정한 시각의 해석과 의미부여를 강요하면 지적 자유는 사라지고 말 것이다.

본 연구자는 이런 방법으로 수행된 연구를 기반으로 국채보상운동 디지털 아카이브 연구를 계속하여 더욱 발전시킬 수 있는 방안을 강구하고자 한다.
이러한 노력에서 당면한 한 가지 중요한 문제는 국채보상운동 데이터의 세계적 유통과 활용이다.
국채보상운동 기록물은 이미 유네스코가 세계기록유산으로 인정한 한국을 대표하는 기록문화유산이다. 이 내용이 앞으로 세계적으로 알려져서
학계에서는 연구의 주제가 되고 문학과 예술계에서는 창작의 소재로 활용되려면 국제적 지식정보망에 연계되어 온라인으로 제공되어야 할 것이다.

여기에는 두 가지 문제가 있다. 하나는 데이터의 형태가 국제적 호환성을 가져야 한다는 점과 콘텐트의 사용언어 문제이다.
다행스럽게도 본 연구에서 설계하고 구축한 시맨틱 데이터베이스는 그 구조와 용어가 국제적 표준을 따르고 있다.
국채보상운동의 데이터베이스는 이미 체계화⋅구조화되어 있고 시맨틱 데이터베이스로 만드는데 사용된 용어는 이미 영어로 되어있다.
따라서 데이터의 개별적 내용인 노드(Node)의 이름만 영어로 표기한다면 그 스토리를 영어로 텍스트화 하는 것은 용이하다.
본 연구에서 작성한 시맨틱 아카이브는 시맨틱 웹 같은 방식으로 아카이브를 구축했으므로 과거와는 다른 차원에서 영어뿐 아니라 다국어 데이터베이스 구축에 적합하게 되어있다.
이러한 가능성을 더욱 발전시켜서 국제적으로 활용될 수 있는 국제적 아카이브로 발전시키는 연구를 진행하고자 한다.

디지털 인문학으로서 역사 서사의 큐레이션은 아직 발전 중에 있는 연구와 실천의 분야이다.
서사적 요소를 추출하여 스토리로 역사를 재현하는데 미리 정해진 정답이 따로 있다고 볼 수는 없다.
다만 역사 서사의 큐레이터는 역사적 사건에 대한 종합적인 지식과 함께 문학적 상상력과 이야기꾼의 예술적 재능이 필요할지도 모른다.
바람직한 역사재현을 위해서 디지털 큐레이터는 전통 인문학자의 학술논문 급의 전문적 서술과, 문학적 창작자인 "작가"의 자유분방하고 주관적인 서술 사이에서
가장 사실에 근접하는 근거 있는 스토리를 작가보다 더 쉽고 재미나게 "이야기"해야 하는 사명을 띠고 있다.
이 연구의 아카이빙과 디지털 큐레이션 모델은 바로 이 두 가지의 요건을 충족시키는 모델이며, 본 연구가 통합적 디지털 한국학 아카이브의 구축과 확산에 기여하게 되기를 바란다.