행위

ContextualElementsInSihwa

red

한문학데이터큐레이션 강의 페이지로 가기


여말선초시화에서 발견되는 문맥요소 편찬



연구 목적


이 연구는 여말선초 한국 시화에서 나타나는 텍스트의 문맥적인 요소를 조사하고 관련 정보를 시각화하여 여러 가지 맥락적인 정보를 제공하는 것을 목표로 한다. 시화는 비평의 계승관계가 뚜렷하게 부각되는 장르로, 주요 시화집을 살펴보면 같은 사건이나 인물, 장소에 대해 논의하는 경우가 매우 빈번하다. 따라서 시화집 한두 편을 넘어서 시화집 일반을 논의하기 위해서는 시화집 간의 맥락적인 정보가 필수적으로 요구되는데, 기존의 시화집 단위에 치중된 논의 방식은 관련 자료를 전체적으로 취합할 수 없었기 때문에 시화집 이상의 단위를 논의할 때 연구자의 역량과 관계없이 논리적인 비약이 수반되곤 하였다. 시화에서 논의되고 있는 여러 사건, 인물, 장소 등에 대한 관계 정보를 제공하여 이러한 난점을 해결하고, 장기적으로 시화 장르를 전체적으로 조망하는 방향성을 가진 연구의 원천자료로 활용될 수 있도록 하는 것을 궁극적인 목표로 한다.

연구 대상


대상서적 저자 내용
파한집 이인로 1220년(고종 7년) 지어진 우리나라 최초의 시화집이다.
보한집 최자 1254년(고종 41년) 지어진 시화집으로, 파한집을 보충하는 속편의 형식으로 제작되었다.
역옹패설 이제현 1342년(충혜왕 3년) 지어진 시화집으로, 전집은 역사서의 성향을, 후집은 시화서의 경향을 띠고 있다.
동인시화 서거정 1474년(성종 5년) 지어진 시화집으로, 잡다한 내용이 포함되지 않은 우리나라 최초의 순수 시화집이다.


연구 방법


온톨로지 설계


온톨로지 다이어그램


클래스(Class)

클래스 표시색 상세내용
시화 brown 시화가 속한 시화집을 지칭한다. 이 온톨로지에서는 "파한집", "보한집", "역옹패설", "동인시화"가 이에 해당한다.
조목 violet 시화집에 포함된 시화를 지칭한다. 편의상 시화집에 속한 시화의 조목 연번은 의미단락이 분절되는 부분을 기준으로 하여 임의로 구분하였다. 예컨대 동인시화 상권에서 3번째 시화로 분류되는 경우 동인시화_상3으로 표기하였다.
주제 cyan 시화가 담고 있는 핵심 주제를 지칭한다. 시화의 주제 역시 임의로 구분하되, 중구난방이 되는 것을 억제하기 위해 몇 가지 원칙을 정하였다. 즉, 가급적 4글자 이내의 한문으로 표기하였고, 비슷한 주제의 경우 최대한 광의로 포함시켰으며, 한 조목이 여러 주제를 포함할 경우 모두 연결하였다.
삽입시 red 시화가 삽입하고 있는 시를 지칭한다. 삽입시의 경우 제목이 노출되지 않은 경우가 많기 때문에 시의 첫 구로 표기하는 것을 원칙으로 하였으며, 간혹 시가 중간 부분부터 인용되어 있는 경우 최대한 문맥요소가 연결되도록 설명을 부가하였다. 속성에서 상술하겠다.
논평 purple 시화가 포함하고 있는 시, 장소, 인물 등에 대한 여러 품평을 통칭하여 지칭한다.
평어 navy 대체로 두 글자 혹 네 글자 정도로 표기되는 시에 대한 인상비평어를 지칭한다. 논평의 일부분이지만 시화 간의 특수한 연결고리를 매칭하여 줄 수 있는 핵심적인 용어이므로 이처럼 따로 표기하였다.
문헌 orange 시화에서 언급되는 여러 문헌을 지칭한다.
인물 blue 시화에서 언급되는 여러 인물을 지칭한다.
공간 green 시화에서 언급되는 여러 공간을 지칭한다.


관계(Relation)

한글정의 영문정의 상세내용
다루다 covers 시화와 조목의 관계를 지칭한 용어이다. 시화와 조목은 완전한 포함관계로 시화는 조목의 집합으로 이루어진다.
포함하다 hasPart 조목과 주제, 삽입시, 논평의 관계를 지칭한 용어이다. 조목과 주제, 삽입시, 논평의 관계 역시 완전한 포함관계이나 시화와 조목, 조목과 주제, 삽입시, 논평의 관계는 단위의 크기가 다르므로 용어를 달리하여 표기하였다.
요소이다 isElementOf 논평과 평어의 관계이다. 평어는 논평의 일부분이다.
수록하다 contains 조목과 문헌의 관계를 표현하기 위한 용어이다. 문면에서 수록을 밝힌 문헌들만을 포함하였다. 때로는 조목과 조목의 관계가 될 때도 있다.
저술자이다 writer 시화와 인물, 문헌과 인물의 관계를 지칭한 용어이다.
창작자이다 creator 삽입시와 인물의 관계를 지칭한 용어이다.
비평자이다 criticizer 논평과 인물의 관계를 지칭한 용어이다.
언급하다 mentions 조목과 공간의 관계를 지칭한 용어이다.


속성(Attribute)

(내용 서술)

데이터 샘플링


샘플 데이터 적용 네트워크 그래프


데이터 샘플링 결과 분석

(내용 서술)

연구 데이터


데이터 규모

● 전체 데이터: 352
 -노드 데이터: 155(시화: 4건, 조목:17건, 작품:43건, 논평:34건, 평어:12건, 주제:13건, 인물:21건, 공간:11건)
 -링크 데이터: 197(hasPart:17건, covers:53건, contains:34건, isRelatedTo:18건, isElementOf:14건,author:4건, creator:43건, mentions:14건)


데이터 시트



연구 결과

본래 시화 전체를 다루는 것을 목적으로 하였으나 지금은 "정지상"이라는 인물을 다룬 조목들을 우선적으로 입력하였다. 따라서 본래 연구 목적 하에서보다 Cypher Query가 생성될 여지가 적어졌다. 요컨대 지금의 결과물은 먼저 시화 전체에서 "정지상"이라는 인물과 관련된 조목을 찾는 Cypher Query가 우선적으로 입력된 것과 비슷한 상태인 셈이다.

Cypher Query


질의어 1. 정지상과 관련된 시화에 등장하는 인물들이 지은 작품들에서는 어떤 장소들이 등장할까?

1-1. 전체 시화 중 정지상과 관련된 시화만을 출력

(전체 시화가 입력되면 필요한 과정이겠지만, 현재로써는 출력이 불필요함)

1-2. 인물이 지은 작품을 출력

Match (a:`작품`)-[r:creator]->(b:`인물`) return a, r, b

1-3. 작품이 언급한 공간을 출력

match (a:`작품`)-[r:mentions]->(b:`공간`) return a, r, b

1-4. 인물이 지은 작품이 언급한 공간을 출력

Match (c:`공간`)<-[s:mentions]- (a:`작품`)-[r:creator]->(b:`인물`) return a, b, c, r, s

질의어 2. 정지상과 관련된 시화들은 어떤 평어로 그를 평하고 있을까?

2-1. 전체 시화 중 정지상과 관련된 시화만을 출력

(전체 시화가 입력되면 필요한 과정이겠지만, 현재로써는 출력이 불필요함)

2-2. 시화가 포함한 논평을 출력

match (a:`조목`)-[r:contains]->(b:`논평`) return a, r, b

2-3. 논평의 요소인 평어를 출력

match (a:`논평`)-[r:isElementsOf]->(b:`평어`) return a, r, b

2-4. 정지상과 관련된 시화가 포함한 논평의 요소인 평어를 출력

match (a:`조목`)-[r:contains]->(b:`논평`)-[s:isElementsOf]->(c:`평어`) return a, b, c, r, s

질의어 3. 동인시화에서는 정지상에 대해 어떤 주제로 언급하고 있는가?

3-1. 전체 시화 중 동인시화만을 출력

match (a:시화{name:'동인시화'}) return a

3-2. 동인시화에서 정지상이 언급된 시화만을 출력

(전체 시화가 입력되면 필요한 과정이겠지만, 현재로써는 출력이 불필요함)

3-3. 시화와 연관된 주제를 출력

match (a:`조목`)-[r:isRelatedTo]->(b:`주제`) return a, r, b

3-4. 동인시화에서 정지상이 언급된 시화와 연관된 주제를 출력

분석 결과



앞서 시화의 여러 맥락 정보를 제공하고자 한다는 연구 목적을 밝힌 바 있는데, 데이터 분석을 통해 결과를 도출하고 보니 설계에 있어서의 몇 가지 난점만 극복하고 데이터 입력의 수고로움만 감안한다면 맥락 정보를 이보다 훌륭하게 제공하는 방법은 없을 듯하다. 다만 당장의 분석에서는 부족한 설계와 입력량으로 인하여 다소간의 문제점이 노출되었으므로 향후 보완할 점을 중심으로 하여 결과를 보고하고자 한다.

질의어 1은 시화에서 정지상과 그와 관련된 인물들이 지은 시에 등장하는 장소를 출력하고자 하였고 정확하게 원하는 값을 출력하는 데 성공하였다. 그런데 출력된 장소가 한 시당 한두 개에 그치고 있다. 이는 입력자가 장소를 입력할 때에 보수적으로 접근하여 시화나 시제에서 장소를 명시한 경우만을 시에 등장하는 장소로 규정하였기 때문이다. 그리하여 이 질의어를 통해 얻을 수 있는 유의미한 소득은 정지상이 시의 제재로 삼은 장소는 이러저러한 곳이 있다고 하는 정도에서 그치고 말았으며, 추가적인 확장을 기대할 수 없게 되었다. 실상 정지상의 시는 서경을 읊은 것이 많은데 이 질의어에서 그 점이 반영되지 않은 것은 전적으로 데이터 양의 부족에서 기인한다. 차후 데이터 양을 보완하여 이 문제를 시정하고자 한다.

질의어 2는 정지상과 관련된 시화들이 어떤 평어로 그를 평하는지를 출력하고자 하였다. 시화의 시평은 전체적으로 조감하기에 다소 느슨한 감이 있으므로 대부분의 시화 연구에서는 평어를 중시하는 경향이 있다. 어떤 인물에 대한 평어가 일률적으로 도출될 수 있음을 확인하였으므로 이 질의어가 잘 출력되는 것만으로도 이 데이터베이스는 존재가치가 있다고 할 수 있겠다. 그런데 데이터베이스를 구축하면서 '시평' 부분에 대해서는 시평의 길이가 워낙 들쑥날쑥하고 그대로 입력하기가 까다로워서 조목명_시평1, 조목명_시평2의 형식으로 입력하게 되었다.

참고 자료


(내용 서술)

주석