행위

LaoqidaAndPiaotongshi

red

김성민 KU2017 (토론 | 기여) 사용자의 2021년 4월 22일 (목) 17:07 판 (데이터 샘플링 결과 분석)

한문학데이터큐레이션 강의 페이지로 가기


데이터 기반 『노걸대』와 『박통사』 비교 연구



연구 목적

문헌 『노걸대』와 『박통사』는 각 조목마다 회화체, 즉 대화 형식으로 구성되어 있고, 각 인물간의 대화를 중심으로 스토리가 전개되는 서사적 형식을 갖추고 있다. 동시에 중국어 교육을 목적으로 쓰여진 작품이라는 점에서 공통점을 서로 공유하고 있다. 문학적인 관점에서 비교한 연구들은 진행중이거나 이미 완료된 것들도 흔히 찾아 볼 수 있다.

이번 연구에서는 기존 연구 사례들에서 더 나아가 언어학적인 관점에서 연구하고자 한다. 두 작품의 대화에서 주로 사용된 단어와 공통적으로 등장하는 단어가 무엇인지, 그 단어 사용의 빈도수는 어떻게 되는지 텍스트 분석을 통해 분석해보고, 어법 관점에서의 서술 방식 차이, 그리고 대화 속에서 찾을 수 있는 언어 구사 수준의 차이를 연구해보고자 한다.

추가적으로 두 문헌의 목적은 중국어 회화, 언어 교육이라는 공통점을 가지고 있지만, 문헌 내에서의 언어 체계역시 차이가 있을 수 있다. 언어 체계 차이를 밝히고 같은 외국어 교육서이지만, 어떠한 계층, 연령대를 타겟으로 책이 쓰여진 것인지, 가능하다면 비슷한 시기에 나온 문헌임에도 불구하고 왜 타겟을 다르게 정한 것인지에 대해 추가적으로 연구하고자 한다.

연구 대상

이번 연구에서는 『노걸대』와 『박통사』를 중심으로 그 외 어법자료와 관련 논문, 그리고 언어학과 관련된 도서들을 참고하여 비교 연구할 것이다.

1. 『노걸대』 : 연구의 중심 자료이다.

2. 『박통사』 : 『노걸대』와 비교할 자료이다.

3. 『번역노걸대』 : 『노걸대언해』와 공통점이 많다. 번역본과 『노걸대』의 차이를 비교해보며 연구할 자료이다.

4. 『번역박통사』 : 번역본과 『박통사』의 차이를 비교해보며 연구할 자료이다.

5. 관련 논문 : 여러 관점에서 비교한 논문들을 최대한 참고하여 언어학적 관점에서 바라 본 논문을 위주로 연구할 것이다.

6. 『언어지리유형학』 : 언어 체계와 관련해서 참고할 자료이다.

7. 중국어 어법교재 : 현대 중국어와 두 문헌 속의 대화들의 차이를 비교연구할 것이다.

연구 방법

온톨로지 설계

온톨로지 다이어그램


클래스(Class)

문헌 : 『노걸대』와 『박통사』는 중국어 학습 및 교육서라는 공통점을 가지고 있기 때문에, 비교연구가 용이하고 흥미로운 연구결과가 나올 것으로 판단되어 두 문헌을 넣게 되었다. 두 문헌을 비교연구하여, 각 문헌의 언어체계, 서술방식, 주로 쓰이는 단어, 그 단어의 빈도수를 분석하고, 두 문헌의 차이를 밝혀 문헌의 발간 목적을 연구할 것이다.

체계 : 두 문헌의 언어 서술 시스템, 즉 서술 체계와 주어 동사 목적어와 같은 어법적 체계를 비교분석하기 위함이다.

조목 : 대표적인 조목의 주요내용을 밝히기 위해 지정하였다. 서로 대화를 나누며 이야기가 전개되는 형식의 문헌이고, 조목마다 대화의 내용이 달라지므로, 조목과 공간, 대화 내용을 분석하기 위함이다.

단어 : 특정 공간에서 각 대화마다 자주 사용하는 특정단어가 존재한다. 그리고 각 문헌마다 사용되는 단어와 사용되지 않는 단어가 존재한다. 주로 공통된 단어들과 공통적이지 않은 독자적인 단어들을 분류할 것이다. 텍스트 분석의 마중물 역할을 한다.

인물 : 인물들이 다양하지는 않지만, 조목마다 계속해서 공간의 이동이 발생한다. 그 때마다 대화하는 대상도 달라질 수도 있고, 혼동이 생길 가능성이 있으므로 지정하였다.

공간 : 조목마다 다양한 공간에서의 대화가 존재한다. 공간 이동이 빈번하게 발생하기 때문에 특정 공간에서 대화하는 어투와 단어사용을 비교 분석하기 위함이다. 주로 어떠한 상황에서의 대화를 하고 있는 것인지에 대한 내용이 주를 이룬다.

대화 : 위에서 조목에 대한 언급을 하였다. 조목은 큰 틀의 주제를 보여주기 위함이었고, 대화는 더 세부적이고 긴 대화 내용을 삽입하여 분석하기 위함이다. 단어분석 : 본격적으로 텍스트 분석의 결과를 도출하는 부분이다. 단어의 빈도수와 가장 많이 사용된 단어나 어법적 표현을 상위 5개를 뽑아 그 중에서 가장 많은 단어 2개를 선정할 예정이다.

속성 : 문헌의 간행연도를 명시하기 위함이다. 원본 문헌의 확실한 간행연도는 알 수 없어서 이번 연구의 중심이 되는 『노걸대』의 번역본인 『번역노걸대』의 간행연도를 삽입하였다.

관계(Relation)

isSystemOf 의체계이다 : 각 문헌과 조목 간의 언어 체계와 문헌 자체의 형식체계를 구분하기 위함이다.

correspond 일치하다 : 두 문헌에서 일치하는 단어나 구절을 구분하기 위함이다.

consists 구성되다 : 문헌마다 구성된 조목을 분류하기 위해 삽입하였다.

compare 비교하다 : 두 문헌 비교하겠다는 것을 명시하기 위해 삽입하였다.

frequentlyMentioned 자주언급되다 : 두 문헌의 대화 내용에서 자주 등장하는 단어들을 위주로 분석하기 위함이다. 언급 빈도수가 높은 단어들을 우선 분류한 것이다.

isSituationOf 인상황이다 : 조목, 대화마다 공간 이동이 발생한다. 그 공간에서의 대화내용은 어떠한 상황에서의 대화내용인지 구분하기 위해 삽입하였다.

writer 저술자이다 : 원본 문헌의 저술자는 미상이다. 번역본의 저술자를 대체하여 명시하기 위해 삽입하였다.

isAbout 에대한것이다 : 공간에 대한 상황 속에서 더 깊이 들어가 무슨 내용을 가지고 서로 대화하는지 구체적으로 명시하기 위해 삽입하였다.

isElementOf 요소이다 : 인물을 분류하기 위함이다.

hasAttribute 속성을가지다 : 문헌의 간행연도를 표시하기 위해 삽입하였다.

속성(Attribute)

『노걸대』 조선시대 사역원에서 역관들의 외국어 학습 및 역과시용으로 간행한 중국어 교재.외국어학습서·중국어학습서이다.

노걸대의 첫 글자 ‘노(老)’의 의미에 대하여 몇 가지 해석이 있으나, 그 중 가장 신빙성이 있어 보이는 것은 노형(老兄)·노사(老師)·노관인(老官人) 등을 지칭한다.

‘걸대’는 요대(遼代) 이후 현재까지 몽고인을 비롯한 몇몇 북방민족들이 중국 혹은 중국인을 지칭한다. 다시 말해, 노걸대(중국음은 LauKida)는 조선 통사가 성명을 모르는 중국인을 부르는 호칭이었던 것으로 추측된다.

1권 1책. 활자본·목판본. 현존본의 확실한 최고 간행연대는 알 수 없으나, ‘노걸대’라는 서명이 『세종실록』 5년(1423)조에 처음으로 등장한다.

이 책의 내용은 한 고려인(후기 간행본에서는 조선인)이 중국을 여행하며 여러 가지 경우에 만나는 중국인들과 대화하는 형식으로 구성되어 있고, 여행자에게 필요한 여러 가지 중국어 표현과 일반 지식들을 담고 있다. 예를 들면 여관에 드는 방법, 여관주인에게 음식을 요청하고 말[馬]먹이를 요구하는 방법, 당시의 물가, 시장에서 거래하는 방법, 의원(醫員)을 불러달라고 요청하는 방법 등으로 구성되어 있다.


『박통사(朴通事)』 중국인이 박씨(朴氏) 성을 가졌던 조선 통사(박씨는 한국에만 있는 성씨)를 부르는 호칭으로, 중국사람의 생활풍습과 제도 등에 관한 문답을 실은 책이다 고려 말부터 조선 시대에 걸쳐 《노걸대》와 더불어 대표적인 외국어 학습서로 꼽혔던 책이다.

데이터 샘플링

샘플 데이터 적용 네트워크 그래프

데이터 샘플링 결과 분석

『노걸대』와 『박통사』를 언어학적 관점에서 비교분석을 하기위한 데이터 샘플링을 작성하였다.

데이터를 작성하며, 개선이 필요하거나, 추가 되어야 할 부분을 발견하였다.


첫 번째, 조목 데이터의 양을 어느정도 넣고 더 분석 할 것인지에 대해 조금 더 고려해 보아야 할 것 같다.


두 번째, 연구자료들을 서로 비교 참고하여, 공통된 데이터들을 수집할때 어떠한 방식을 활용할 것이며, 추가적으로 필요한 데이터 분석 프로그램이 필요한지 적용시켜볼 필요가 있다.


세 번째로, 수집된 데이터에서 가장 많이 언급된 단어나 글자를 추출하고, 추출된 데이터를 빈도수에 따라 순위를 지정하려고 한다. 이 부분도 역시 수집된 데이터를 손수 하나하나 분석하려고 한다면 많은 시간이 필요할 것으로 예상된다. 분석 시간을 조금 단축시키고 더 효율적인 방법을 찾을 필요가 있어 보인다.


분석이 어느정도 완료되고 막바지 단계에 들어가면, 어법관점에서 두 문헌의 차이를 찾기 위해 문헌에서 5개에서 10개의 조목들을 뽑아 비교해보는 방식으로 연구를 하고, 두 문헌이 지어질 때 대상을 누구로 설정한 것인지에 대한 분석으로 마무리하면 될 것으로 생각한다.

연구 데이터

(내용 서술)

연구 결과

(내용 서술)

참고 자료

(내용 서술)

주석