데이터 시대의 『임원경제지』 편찬 모델

pungseok
Admin (토론 | 기여)님의 2020년 8월 30일 (일) 01:47 판 (데이터 시대의 인문지식 정보화: ‘문헌의 정보화’에서 ‘지식의 정보화’로)
이동: 둘러보기, 검색
2020-09-03QR.png


머리말

임원경제연구소 연구진들의 18년간 치열한 노력으로 ‘조선 최고의 실용대백과사전’, 『임원경제지』의 현대한국어 번역이 상당 부분 진행되었고, 2024년에는 완역의 결실이 맺어질 예정이다. 그 결과물은 거질의 인쇄된 책자로도 간행되겠지만, 이 기념비적인 저작물의 내용이 실제적으로 활용될 수 있게 하는 길은 당연히 21세기의 지식사회에서 유효한 디지털적인 방법으로 찾아야 할 것이다.

디지털로 소통하는 시대에 디지털 매체를 통해 지식을 전파하고자 한다면, 그 매체에 이 지식을 어떻게 담아야 하고, 그로 인해 어떠한 효과를 거둘 것인지에 대한 고민이 필요하다. 이 발표는 「임원경제지」 전체의 정본화 텍스트와 현대한국어 번역 성과를 21세기의 독자들에게 실제적으로 전달할 ‘21세기 버전 디지털 판 임원경제지’의 설계 모델을 제시하려는 것이다.

데이터 시대의 인문지식 정보화: ‘문헌의 정보화’에서 ‘지식의 정보화’로

오늘날의 고전 정보화는 21세기 시점에서 유효한 방법으로 수행하는 고전 텍스트 편찬사업이어야 한다. 과거에 만들어진 문헌을 디지털 미디어에 전사하는 일을 넘어서서, 문헌에 담긴 옛 지식을 찾아서 그것이 오늘날에 효용성 있게 쓰일 수 있는 방법으로 재조직하는 것을 지향해야 한다는 것이다.

문헌의 정보화 지식의 정보화
문헌의 정보화.jpg 지식의 정보화.jpg
‣ 지금까지의 고전 자료 정보화는 책에 담긴 지식을 정보화하기보다는 종이 매체로 만들어진 문헌을 정보화 하는 것으로 이해
‣ 대상 문헌의 내용과 편찬 체계를 그대로 디지털 저작물 형태로 복원
‣ 종이 책이 채용한 형식에 얽매이지 않고 그 속의 담긴 지식의 활용성을 증대시킬 수 있는 디지털화
‣ 정보화의 대상이 되는 고전 자체에서 유의미한 데이터를 찾아내고, 그 데이터의 특성에 적합한 디지털화 방법을 강구

임원경제지 시맨틱 데이터베이스 구현 전략

단순히 데이터를 저장하고 저장된 텍스트에 대한 문자열 검색 서비스를 제공하는 종래의 고전 자료 데이터베이스의 수준을 넘어서서, 텍스트 속의 문맥 요소를 식별하고, 이를 매개로 다른 데이터베이스의 유관 자료를 찾아서 제공해 줄 수 있는 기능의 발전된 데이터베이스를 ‘시맨틱 데이터베이스’라고 한다.[1] 임원경제지 시맨틱 데이터베이스 구현을 위한 기본 전략을 다음과 같이 제시한다.

1. 임원경제지의 텍스트 편성 체계를 그대로 따르는 형태의 데이터베이스①와 임원경제지 속의 지식 요소를 그 다각적인 문맥으로 살필 수 있는 데이터베이스②를 이원적으로 구현한다. 

※ 편의상 데이터베이스 ①은 ‘임원경제지 데이터’, 데이터베이스 ②는 ‘임원경제 사전 데이터’라고 부르기로 한다. 후자를 ‘사전’이라고 명명하는 이유는 『조선왕조실록』에 대한 『조선왕조실록 사전』의 역할처럼 원전 문헌 속의 지식 요소들을 추출하고 그 내용을 체계적으로 정리해서 보여주는 기능을 수행할 수 있기 때문이다.

 2.‘임원경제지 데이터’(데이터베이스①)과 ‘임원경제 사전 데이터’(데이터베이스②)는 유기적으로 연계되어 있어서 어느 곳에서나 서로 참조될 수 있도록 한다. 

※‘임원경제지 데이터’를 통해 원저작물의 편제를 따라가다가 특별한 대상에 대해 다각적으로 알고자 할 때에는 바로 그것과 연관된 다양한 지식 요소들을 ‘임원경제 사전 데이터’의 데이터 네트워크 속에서 살필 수 있다. 반대로, ‘임원경제 사전’에 수록된 모든 지식 정보들은, 그것이 ‘임원경제지’의 텍스트 속에서 어떠한 맥락에서 어떤 의미로 언급되었는지를 확인할 수 있다.

 3.‘임원경제지 데이터’는 서종, 권차, 장, 절, 항, 목 등의 편찬 체계뿐 아니라, 인용문과 참고문헌을 명확한 데이터로 기술함으로써, 지식의 연원과 변천을 추적·분석할 수 있도록 한다. 
 4.‘임원경제 사전 데이터’는  ‘임원경제지’ 텍스트 안에 담긴 지식 요소뿐 아니라, 그것을 이해하고 설명하는 데 필요한 유관 지식까지 포함한다.  단, ‘임원경제 사전’ 편찬의 시작 단계에서는 기존의 『임원경제지』 번역 과정에서 생산한  ‘주석’의 내용을 중점적으로 지식요소화하는 방법을 취할 수 있다. 
 5.‘임원경제 사전 데이터’는  온라인 상에서 접근 가능한 유관 지식을 바로 연결해 볼 수 있도록 ‘온라인 참조’ 기능을 강화한다. 특히 『임원경제지』에 수록된 내용을 시각적으로 확인할 수 있는 도해와 유물 사진 등을 지속적으로 확충할 수 있게 한다. 
 6.‘임원경제 사전 데이터’는 궁극적으로 크라우드 환경에서 이용자들에 의해 지속적으로 콘텐츠의 연계 범위가 확대되게 함으로써, 고금동서의 다양한 백과사전적 지식과의 통섭을 지양한다. 

  1. 시맨틱 데이터베이스(Semantic Database)라는 말은 다의적으로 쓰일 수 있으나, 이 글에서 의미하는 것은 ‘시맨틱 웹(Semantic Web) 개념의 데이터베이스’ 또는 ‘시맨틱 웹의 구성 요소가 될 수 있는 데이터베이스’이다.
    시맨틱 웹이란 컴퓨터가 인식할 수 있도록 명확한 의미를 부가한 데이터의 웹이다. 컴퓨터가 인식할 수 있는 데이터 기술 규칙을 만드는 것은 정보기술의 영역에서 추구할 과제이지만, 그 규칙을 응용하고 확장하여 미래의 사이버 공간에서 인문지식이 소통될 수 있도록 만드는 것은 디지털 인문학자들의 과제이다. (김현 외, 『디지털 인문학 입문』 , HUBOOKs, 2016. p. 147.)