행위

LaoqidaAndPiaotongshi

red

김성민 KU2017 (토론 | 기여) 사용자의 2021년 6월 13일 (일) 22:56 판 (분석결과 설명)

한문학데이터큐레이션 강의 페이지로 가기


데이터 기반 『노걸대』와 『박통사』 비교 연구



연구 목적

문헌 『노걸대』와 『박통사』는 각 조목마다 회화체, 즉 대화 형식으로 구성되어 있고, 각 인물간의 대화를 중심으로 스토리가 전개되는 서사적 형식을 갖추고 있다. 동시에 중국어 교육을 목적으로 쓰여진 작품이라는 점에서 공통점을 서로 공유하고 있다. 문학적인 관점에서 비교한 연구들은 진행중이거나 이미 완료된 것들도 흔히 찾아 볼 수 있다.
이번 연구는 두 문헌의 공통적인 관계를 알아보고자 한다.
가장 궁극적인 목적은 두 문헌의 '조목'과 '조목'간의 비교이다. 조목 속에 구성되어 있는 대화의 양상들을 나열하여 서로 공통되는 부분을 연결 짓고, 어떠한 문헌이 더 일상에 가까운지, 아니면 상업에 가까운 성격을 띄는지를 연구하는 것에 기반을 둘 것이다. 더 나아가 추가적으로 어떠한 소재를 가지고 나누는 대화인지, 그리고 대화의 양상이 일상과 상업 중 어느 성격에 가까운지, 공통되는 부분들 중에서 대화의 방식의 차이를 연구하는 것을 최종 목표로 삼는다.

연구 대상

이번 연구에서는 『노걸대』와 『박통사』를 중심으로 그 외 어법자료와 관련 논문, 그리고 언어학과 관련된 도서들을 참고하여 내용 파악의 어려움을 해결할 것이다. 동시에 궁극적인 목적은 노걸대와 박통사 문헌 내에 구성되어 있는 조목들과 그 속의 대화들을 비교하고, [매개] 클래스를 설정하여 공통되는 부분을 찾아 볼 것이다. 또한 '일상'과 '상업'이라는 속성을 설정하여, 각 대화들이 어떠한 성격을 가지고 있는 지에 대해 분류하고, 어떠한 상황에서 일상의 성격이 짙은지, 아니면 반대로 옅은지를 연구해 보고자 한다.

문헌 내용
1.『노걸대』 연구의 중심 자료이다.
2.『박통사』 『노걸대』와 비교할 자료이다.
3.『번역노걸대』 『노걸대언해』와 공통점이 많다. 번역본과 『노걸대』의 차이를 비교해보며 연구할 자료이다.
4.『번역박통사』 번역본과 『박통사』의 차이를 비교해보며 연구할 자료이다.
5.관련 논문 여러 관점에서 비교한 논문들을 최대한 참고하여 언어학적 관점에서 바라 본 논문을 위주로 연구할 것이다.
6.『언어지리유형학』 언어 체계와 관련해서 참고할 자료이다.
7.중국어 어법교재 현대 중국어와 두 문헌 속의 대화들의 차이를 비교연구할 것이다.(참고한 자료의 정확한 명칭은 연구 마무리 단계에서 참고자료란에 기재할 것이다.)


연구 방법

온톨로지 설계

온톨로지 다이어그램


클래스(Class)


클래스명 클래스지정 목적
문헌 『노걸대』와 『박통사』는 중국어 학습 및 교육서라는 공통점을 가지고 있기 때문에, 비교연구가 용이하고 흥미로운 연구결과가 나올 것으로 판단되어 두 문헌을 넣게 되었다. 두 문헌을 비교연구하여, 각 문헌의 언어체계, 서술방식, 주로 쓰이는 단어, 그 단어의 빈도수를 분석하고, 두 문헌의 차이를 밝혀 문헌의 발간 목적을 연구할 것이다.
맥락 두 문헌 속에 등장하는 조목과 대화들의 양상을 큰 관점에서 조목을 보기 쉽게 세분화하여 분류하기 위해 지정하였다. 크게 물품구입, 판매, 대화형식(의문문, 평서문)으로 분류하였다.
조목 대표적인 조목의 주요내용을 밝히기 위해 지정하였다. 서로 대화를 나누며 이야기가 전개되는 형식의 문헌이고, 조목마다 대화의 내용이 달라지므로, 조목과 대화 내용을 분석하고 대화 속의 소재가 서로 어떻게 묶이는지, 공통된 것은 어떤 소재가 주를 이루는지를 확인하고 연구하기 위함이다.
대화 위에서 조목에 대한 언급을 하였다. 조목은 큰 틀의 주제를 보여주기 위함이었고, 대화는 더 세부적이고 긴 대화 내용을 삽입하여 분석하기 위함이다. 보통 한 조목당 최소 3가지 이상, 평균적으로 10가지 대화문장으로 구성되어 있다.
물품 수 많은 대화 속에서 다양한 소재가 존재한다. 물품을 구입하거나 판매하는 내용 중에서 어떠한 물품을 거래하는지를 세부적으로 분류하기 위해 지정하였다. 두 문헌 속의 다양한 물품 가운데 공통된 물품을 짝지어 확인해 볼 수 있다.
기타상황 상술한 물품 클래스와 목적은 유사하다. 다만 소재가 다르다. 물품 클래스는 상업적인 요소가 주를 이루고 있다면, 기타상황 클래스는 일상적인 요소가 주를 이룬다. 두 문헌 속의 일상적 요소들 가운데 공통된 소재를 짝지어 비교 연구하기 위해 지정하였다.
매개 물품 클래스와 기타상황 클래스에서 분류한 것을 내용양상의 측면에서 분류할 것이다. 이름 그대로 매개역할을 위해 지정하였으므로, 각 대화들을 몇가지 공통된 매개로 연결 짓기 위해 지정하였다.
속성 첫 번째 목적은 두 문헌을 한자로 표기하기 위해 지정하였다. 두 번째 목적은 물품 클래스와 기타상황 클래스에서 다양한 소재로 분류되는데, 그 소재들이 가지고 있는 대화양상을 나타내기 위해 지정하였다. 예를 들면 '말', '술'이면 상업의 속성을 가진다. 구매나 판매와 관련된 내용이기 때문이다.


관계(Relation)


명령어 명칭 내용
contains 포함하다 『노걸대』와 『박통사』이 두 문헌 속에 등장하는 조목과 대화들의 양상을 조목 속에서 보기 쉽게 세분화하여 분류하기 위해 명령어를 지정하였다.
consists 구성되다 대표적인 조목의 주요내용을 맥락에 연결시키기 위해 명령어를 지정하였다. 대화의 형식에 따라 평서, 의문문, 구입, 판매로 분류하여 각 조목을 묶기 위함이다.
hasPart 한부분이다(포함하다) 조목보다 더욱 세부적이고 긴 대화 내용을 입력하고, 내용들 속에서 공통된 부분을 분석하기 위해 명령어를 지정하였다.
mentions 언급하다 물품을 구입하거나 판매하는 내용, 그리고 행사나 취미생활 등을 하는 일상적인 대화 내용들에서 추출 가능한 소재를 문헌 속의 대화들 속의 성격과 주요 소재를 설정해주기 위해 명령어를 지정하였다.
isAbout 에대한것이다 물품 클래스와 기타상황 클래스에서 분류한 것을 내용양상의 측면에서 분류하여, 각 대화들을 설정한 매개들로 연결 짓기 위해 명령어를 지정하였다.
hasAttribute 속성을가지다 문헌의 이름을 한자로 표기하기 위해 명령어를 지정하였다. 또 다른 이유로는 소재들이 가지고 있는 대화양상이 어떠한 것인지 명시하기 위해 명령어를 지정하였다. 다시 말해, 굳이 대화를 하나 하나 전부 읽으며 찾지 않고, 사전에 보고 싶은 대화의 양상을 선택하여 선별적으로 찾아 볼 수 있게 하기 위해 명령어를 지정하였다.


속성(Attribute)


한자명(표기) 한글명 설명
老乞大 노걸대 조선시대 사역원에서 역관들의 외국어 학습 및 역과시용으로 간행한 중국어 교재.외국어학습서·중국어학습서이다. 노걸대의 첫 글자 ‘노(老)’의 의미에 대하여 몇 가지 해석이 있으나, 그 중 가장 신빙성이 있어 보이는 것은 노형(老兄)·노사(老師)·노관인(老官人) 등을 지칭한다. ‘걸대’는 요대(遼代) 이후 현재까지 몽고인을 비롯한 몇몇 북방민족들이 중국 혹은 중국인을 지칭한다. 다시 말해, 노걸대(중국음은 LauKida)는 조선 통사가 성명을 모르는 중국인을 부르는 호칭이었던 것으로 추측된다.
朴通事 박통사 중국인이 박씨(朴氏) 성을 가졌던 조선 통사(박씨는 한국에만 있는 성씨)를 부르는 호칭으로, 중국사람의 생활풍습과 제도 등에 관한 문답을 실은 책이다

고려 말부터 조선 시대에 걸쳐 《노걸대》와 더불어 대표적인 외국어 학습서로 꼽혔던 책이다.



대화유형 설명
상업 물품 구입, 판매 등 금전으로써 거래가 오가는 상업적인 성격을 가진 조목과 대화들을 물품이라는 클래스로 묶어 속성을 부여하였다.
일상 출발시간, 취미, 혼인잔치 등 취미나 소개, 시간 등 일상적인 조목과 대화들을 기타상황이라는 클래스로 묶어 속성을 부여하였다.


『노걸대』 부가 설명
1권 1책. 활자본·목판본. 현존본의 확실한 최고 간행연대는 알 수 없으나, ‘노걸대’라는 서명이 『세종실록』 5년(1423)조에 처음으로 등장한다.
이 책의 내용은 한 고려인(후기 간행본에서는 조선인)이 중국을 여행하며 여러 가지 경우에 만나는 중국인들과 대화하는 형식으로 구성되어 있고, 여행자에게 필요한 여러 가지 중국어 표현과 일반 지식들을 담고 있다. 예를 들면 여관에 드는 방법, 여관주인에게 음식을 요청하고 말[馬]먹이를 요구하는 방법, 당시의 물가, 시장에서 거래하는 방법, 의원(醫員)을 불러달라고 요청하는 방법 등으로 구성되어 있다.

데이터 샘플링

샘플 데이터 적용 네트워크 그래프

데이터 샘플링 결과 분석

『노걸대』와 『박통사』를 물품과 기타상황 클래스를 중심으로 매개를 형성하여 공통된 소재로 두 문헌을 연결시켜 보았다.
데이터를 작성하며, 개선이 필요하거나, 추가 되어야 할 부분을 발견하였다.

고려해 볼 점
순서 내용
1 조목 데이터의 양을 어느정도 넣고 더 분석 할 것인지에 대해 조금 더 고려해 보아야 할 것 같다.
2 매개라는 클래스를 설정하여 두 문헌을 연결하였다. 그러나 이 두 문헌의 유기적인 관계성을 입증하는 것에서 난관에 부딪혔다. 두 문헌이 공통된 부분이 매개뿐만 아니라 보이지 않는 상호 관계를 찾아 연구를 진행할 필요가 있어 보인다.
3 방대한 양의 데이터를 한정된 시간안에 모두 넣는 것은 현실적으로 어려울 것 같다. 일정한 양의 데이터만으로도 효과적인 결과를 도출 할 수 있는 방법을 연구해 볼 필요가 있다.


문헌에서 15개에서 20개의 조목들을 뽑아 대략 300개의 대화문을 추출하여 비교해보는 방식으로 연구를 진행하는 것이 좋을 것 같다.

연구 데이터

(내용 서술)

연구 결과

Cypher Query 작성

● 문제의식1: 『노걸대』와 『박통사』에서 상업과 관련된 부분중 공통적으로 많은 매개 데이터는 무엇이 있는가?
○ 질의어(문제의식1) 작성
- 상업과 관련된 대화 출력
match (a:Chapter{type:'판매'}) - [r:hasPart] -> (b:Dialogue) return a, r, b
match (a:Chapter{type:'구매'}) - [r:hasPart] -> (b:Dialogue) return a, r, b
match (a:Chapter{type:'계산'}) - [r:hasPart] -> (b:Dialogue) return a, r, b
match (a:Chapter{type:'설명'}) - [r:hasPart] -> (b:Dialogue) return a, r, b

- 특정 대화가 지니는 매개의 양태를 출력
match (a:Dialogue) - [r:isAbout] -> (b:Media{name:'판매'}) return a, r, b
match (a:Dialogue) - [r:isAbout] -> (b:Media{name:'구매'}) return a, r, b
match (a:Dialogue) - [r:isAbout] -> (b:Media{name:'계산'}) return a, r, b
match (a:Dialogue) - [r:isAbout] -> (b:Media{name:'설명'}) return a, r, b

- (최종결과)상업과 관련된 대화들로부터 확인되는 매개의 양태를 모두 출력
쿼리1-1 : match (a:Chapter{type:'판매'}) - [r:hasPart] -> (b:Dialogue) - [q:isAbout] -> (c:Media)
return a, r, b, q, c
쿼리1-2 : match (a:Chapter{type:'구매'}) - [r:hasPart] -> (b:Dialogue) - [q:isAbout] -> (c:Media)
return a, r, b, q, c

● 문제의식2: 『노걸대』와 『박통사』에서 상업일상 조목 가운데 어느 것이 더 많은 비율을 차지하고 있는지 알아보고자 한다. 일상과 상업 조목의 각 문헌 속 대화를 출력하라.
-문제의식의 파생: 상업이나 일상 조목 중에서 매개는 어느 부분이 주로 차지하는가?
○ 질의어(문제의식2) 작성
- 상업과 관련된 조목 속에서 대화를 먼저 출력
match (a:Chapter{type:'판매'}) - [r:hasPart] -> (b:Dialogue) return a, r, b
match (a:Chapter{type:'구매'}) - [r:hasPart] -> (b:Dialogue) return a, r, b
match (a:Chapter{type:'계산'}) - [r:hasPart] -> (b:Dialogue) return a, r, b
match (a:Chapter{type:'설명'}) - [r:hasPart] -> (b:Dialogue) return a, r, b

- 일상과 관련된 조목 속에서 대화를 출력
match (a:Chapter{type:'일시'}) - [r:hasPart] -> (b:Dialogue) return a, r, b
match (a:Chapter{type:'행사'}) - [r:hasPart] -> (b:Dialogue) return a, r, b
match (a:Chapter{type:'취미'}) - [r:hasPart] -> (b:Dialogue) return a, r, b
match (a:Chapter{type:'소개'}) - [r:hasPart] -> (b:Dialogue) return a, r, b
match (a:Chapter{type:'인사'}) - [r:hasPart] -> (b:Dialogue) return a, r, b

- (문제의식2의 파생)
위에서 출력한 일상 조목의 대화 중에서 매개의 양태를 모두 출력
match (a:Dialogue) - [r:isAbout] -> (b:Media{name:'일시'}) return a, r, b
match (a:Dialogue) - [r:isAbout] -> (b:Media{name:'행사'}) return a, r, b
match (a:Dialogue) - [r:isAbout] -> (b:Media{name:'취미'}) return a, r, b
match (a:Dialogue) - [r:isAbout] -> (b:Media{name:'소개'}) return a, r, b
match (a:Dialogue) - [r:isAbout] -> (b:Media{name:'인사'}) return a, r, b

- 위에서 출력한 상업 조목의 대화 중에서 매개의 양태를 모두 출력
match (a:Dialogue) - [r:isAbout] -> (b:Media{name:'판매'}) return a, r, b
match (a:Dialogue) - [r:isAbout] -> (b:Media{name:'구매'}) return a, r, b
match (a:Dialogue) - [r:isAbout] -> (b:Media{name:'계산'}) return a, r, b
match (a:Dialogue) - [r:isAbout] -> (b:Media{name:'설명'}) return a, r, b

- (최종결과)상업과 관련된 대화들로부터 확인되는 매개의 양태를 모두 출력
쿼리2-1 : match (a:Chapter{type:'판매'}) - [r:hasPart] -> (b:Dialogue) - [q:isAbout] -> (c:Media)
return a, r, b, q, c
쿼리2-2 : match (a:Chapter{type:'구매'}) - [r:hasPart] -> (b:Dialogue) - [q:isAbout] -> (c:Media)
return a, r, b, q, c
쿼리2-3 : match (a:Chapter{type:'계산'}) - [r:hasPart] -> (b:Dialogue) - [q:isAbout] -> (c:Media)
return a, r, b, q, c
쿼리2-4 : match (a:Chapter{type:'설명'}) - [r:hasPart] -> (b:Dialogue) - [q:isAbout] -> (c:Media)
return a, r, b, q, c

- (최종결과)일상과 관련된 대화들로부터 확인되는 매개의 양태를 모두 출력
쿼리2-5 : match (a:Chapter{type:'일시'}) - [r:hasPart] -> (b:Dialogue) - [q:isAbout] -> (c:Media)
return a, r, b, q, c
쿼리2-6 : match (a:Chapter{type:'행사'}) - [r:hasPart] -> (b:Dialogue) - [q:isAbout] -> (c:Media)
return a, r, b, q, c
쿼리2-7 : match (a:Chapter{type:'취미'}) - [r:hasPart] -> (b:Dialogue) - [q:isAbout] -> (c:Media)
return a, r, b, q, c
쿼리2-8 : match (a:Chapter{type:'소개'}) - [r:hasPart] -> (b:Dialogue) - [q:isAbout] -> (c:Media)
return a, r, b, q, c
쿼리2-9 : match (a:Chapter{type:'인사'}) - [r:hasPart] -> (b:Dialogue) - [q:isAbout] -> (c:Media)
return a, r, b, q, c

● 문제의식3: 일상 맥락 부분에서 유형이 계산인 부분과 상업 맥락 부분에서 유형이 계산인 조목의 대화는 모두 무엇이 있는가?
○ 질의어(문제의식3) 작성
- 노걸대와 박통사에서 일상 맥락의 조목만 추출
match (a:Context{sort:'일상생활'}) - [r:consists] -> (b:Chapter) return a, r, b

- 일상 맥락의 조목 중의 유형이 '계산'인 조목의 대화를 전부 추출
match (a:Chapter{type:'계산'}) - [r:hasPart] -> (b:Dialogue) return a, r, b

- 노걸대와 박통사에서 상업 맥락의 조목만 추출
match (a:Context{sort:'물품교환'}) - [r:consists] -> (b:Chapter) return a, r, b

- 상업 맥락의 조목 중의 유형이 '계산'인 조목의 대화를 전부 추출
match (a:Chapter{type:'계산'}) - [r:hasPart] -> (b:Dialogue) return a, r, b

- (최종결과)일상과 관련된 맥락으로부터 확인되는 대화들을 모두 출력
쿼리3-2 : match (a:Context{sort:'일상생활'}) - [r:consists] -> (b:Chapter) - [q:hasPart] -> (c:Dialogue)
return a, r, b, q, c

- (최종결과)상업과 관련된 맥락으로부터 확인되는 대화들을 모두 출력
쿼리3-1 : match (a:Context{sort:'물품교환'}) - [r:consists] -> (b:Chapter) - [q:hasPart] -> (c:Dialogue)
return a, r, b, q, c


분석 결과

Neo4j를 활용한 전체 분석결과 시각화

온톨로지분석결과전체.jpg






분석결과 설명

  • 노걸대와 박통사에서 원문에서 이번 분석을 위하여 수집한 데이터의 양은 약 60%이다. 이외에 40%정도 되는 데이터를 더욱 수집한다면 좀 더 구체적이며, 조금 새로운 양상의 결과가 나올 가능성도 있다. 노걸대와 박통사 원문 전체 데이터가 아닌 절반을 조금 넘는 데이터만 활용된 점을 감안하여 결과를 도출하여 보았다.
  • Q1 : 상업과 관련된 부분 중에서 공통적으로 많은 매개 데이터는 구매와 판매가 90퍼센트를 차지하였고, 이들 중에서 물품 소재인 술, 말, 염소가죽, 구슬을 구매하는 구매 데이터가 더 많았다.
  • Q2 : 박통사와 노걸대 중에서 상업과 일상 조목 중에 상업적 성향이 강한 데이터는 115개가 도출되었고, 일상적 성향이 강한 데이터는 162개가 도출되었다. 노걸대는 박통사보다 상업적인 텍스트가 많다고 알고 있지만, 막상 이 두 문헌에서 공통된 부분은 일상적 경향이 더욱 짙었다. 또한 매개는 상업 조목 중에서는 구매 부분이 주로 차지하였고, 일상 조목 중에서는 설명과 취미 부분이 주로 차지하였다.
  • Q3 : 일상 맥락에서 양상이 일상생활이면서 매개양상이 계산인 조목은 21개이고, 대화 데이터는 242개였다. 반면 상업 맥락에서 양상이 물품교환이면서 매개양상이 계산인 조목은 7개였고, 대화 데이터는 83개였다.
  • 일반적으로 물품을 소재로 한 대화 조목은 상업, 그외의 기타상황의 대화에서는 일상의 성격이 짙었다. 그러나 물품을 소재로 한 대화라고 하여 반드시 상업적인 대화만 있지는 않았다. 상업적인 큰 틀 안에 결국 일상적인 부분이 훨씬 많았다.
  • 흥미로웠던 점은 노걸대는 상업, 박통사는 일상적인 성향의 텍스트가 많다고 알려져 있는 것과는 다르게, 실제 두 문헌의 공통된 부분뿐만 아니라, 개별적인 데이터를 보았을 때에도 전반적으로 큰 틀에서, 다시 말해, 큼지막한 부분은 상업적인 대화로 구성되어 있지만, 대화를 세부적으로 확대하여 접근해보면 금전이 오고 가는 물품거래, 상업적인 대화보다 취미, 설명, 행사와 같은 일상적인 양상이 훨씬 많았다.


부족한 점

  • 연구 초반에 소재를 결정하는데에 많은 어려움이 있었다. 어떠한 것을 중심으로 연결시켜 묶어야 할지 여러 시도를 하다가 시간을 너무 많이 소모했다. 처음에 길을 잘 설정하였다면 데이터의 양적 측면에서도 좀 더 풍부하지 않았을까하는 아쉬움이 있다.
  • Cypher Query를 간략하게 만들지 못한 것이 부족하였다. 처음 데이터를 만들 때 속성 값을 추가하여 묶어 놓았어야 하는데, 그러지 못하여 쿼리가 복잡해진 점이 아쉽다.
  • 알던 중국어와는 다른 부분이 꽤 많았다. 번체자가 많아서 한국에서 쓰는 한자 그대로 해석을 하면 알맞는 경우도 있었지만, 아예 다른 의미를 나타내는 대화들이 상당히 많았다. 조목마다 해석을 할 때, 알맞는 의미 파악을 못한 부분도 간혹 있었는데 번체자를 많이 알지 못하여 하나하나 찾아보며 시간을 쏟은 것과 정확한 해석을 하지 못한 부분들이 아쉬웠다.
  • 맥락(일상, 상업)이나 매개 데이터와는 별개로 참신한 관계성을 발견하지 못한 것이 아쉬웠다.


참고 자료

1. 『노걸대』 원문.
2. 『박통사』 원문.
3. [논문] '『노걸대』와 『박통사』의 저작 배경과 자료 성격', 저자: 이종석 / 발행처: 역사문화연구소.
4. 『언어지리유형학』, 저자: 교보만태랑, 하영삼 옮김.
5. 『중국문학사』, 저자: 김학주 / 출판사: 신아사.
6. 『언어 풀어쓴 언어학개론』, 저자: 김범모 / 출판사: 한국문화사.
7. 『중국어뱅크 한어구어4』, 저자: 대계부, 류립신, 이해연 / 출판사: 동양북스.

주석