"QuoteFromAnalects"의 두 판 사이의 차이
red
(→데이터 수집) |
(→탐구의 목적) |
||
(사용자 2명의 중간 판 10개는 보이지 않습니다) | |||
1번째 줄: | 1번째 줄: | ||
==탐구의 목적== | ==탐구의 목적== | ||
+ | 고대부터 사람들은 속담이나 격언, 지식인들의 말을 인용하여 자신의 주장에 권위를 내세워왔다. 고대 그리스 철학자인 소크라테스의 제자들은 스승의 말을 의견의 근거로 하는 습관이 있었고, 이 풍습은 후대의 철학자와 성직자에게도 계승되어 권위자나 권위자의 저서에 대한 인용은 그 자체로 논증의 예시가 되었다. | ||
+ | |||
+ | 그 중 동양에서 가장 많이 인용되고 또 유명한 것을 꼽으라면 단연코 공자의 『논어』를 들 수 있을 것이다. 사서삼경 중 가장 오래 됐으며 동아시아 3국의 유교 문화 형성에 큰 영향을 미친 공자의 『논어』는 그 자체로 사람들의 사고 체계의 일부분으로 자리 잡아 기원전부터 현대에 이르기까지 널리 인용되고 있다. | ||
+ | |||
+ | 특히 각 국의 정치인들은 『논어』를 즐겨 인용하는데, 중국의 시진핑(習近平) 국가 주석은 평소 고시(古詩)와 『논어』를 자주 인용하는 것으로 유명하다. 실제 시진핑 국가 주석이 『논어』를 인용한 상황을 보면, 한국 방문 당시 북핵 문제를 논의하거나 미중 전략경제대화에 참석했을 때, 독일 방문 당시 일본의 난징학살을 비난한 경우 등 주로 정치적 현안과 관련해 인용한 것을 알 수 있다.[https://www.ajunews.com/view/20140912141727106] 정치인이 연설에서 발언하는 단어가 많은 논의와 검토 끝에 채택된다는 것을 고려해볼 때, 정치인이 『논어』를 인용하는 것은 분명 다양한 제반 사항과 이해 관계를 고려하여 전략적으로 사용되었으리라는 것을 추측해볼 수 있다. | ||
+ | |||
+ | 『논어』는 또한 공자의 유동적인 언어 사용을 보여준다. 공자는 같은 질문을 받고도 질문한 사람이 누구고 그가 어떤 상황에 처했느냐에 따라 다른 대답을 내놓곤 했다. 정치에 대한 질문을 받았을 때 노나라의 세력가 계강자에겐 “바르게 하는 것”이라 했지만 초나라의 야심가 섭공에겐 “가까이 있는 자들을 기쁘게 하고, 먼 곳에 있는 자들은 찾아오게 만드는 것”이라 답했다. 전자에겐 정치의 올곧음을, 후자에겐 정치의 후덕함을 강조한 것이다. | ||
+ | |||
+ | 이처럼 『논어』의 유동적인 언어 사용은 이를 인용하는 정치인의 목적과 당시 현안과 맞물려 복합적인 의미로 발현된다. 따라서 어떤 정치인이 『논어』를 인용했을 때 그가 어떠한 정치 진영에 속해있고, 어떠한 상황에서 어떻게 발언한 것인지를 정리해 보는 것은 내재된 속뜻을 파악하게끔 해줄 수 있다. 본 연구에서는 연구 대상을 2000년 이후 대한민국 정치인의 논어 인용 사례로 한정하여 진행하고자 한다. | ||
==탐구의 대상== | ==탐구의 대상== | ||
98번째 줄: | 107번째 줄: | ||
| 인용 시기||인용의 시점. 해당 정치인이 그 인용을 한 시점을 정확히 알 수 있다면 그 시점의 연도와 월까지 표기. 만약 인터뷰 기사 혹은 회고록에서 "나는 이 말을 항상 가슴에 새겨왔다" 라는 식으로 정확한 시점이 드러나지 않는 경우에는, 그 인터뷰 기사의 발행 일시를 연도와 월까지 입력. | | 인용 시기||인용의 시점. 해당 정치인이 그 인용을 한 시점을 정확히 알 수 있다면 그 시점의 연도와 월까지 표기. 만약 인터뷰 기사 혹은 회고록에서 "나는 이 말을 항상 가슴에 새겨왔다" 라는 식으로 정확한 시점이 드러나지 않는 경우에는, 그 인터뷰 기사의 발행 일시를 연도와 월까지 입력. | ||
|- | |- | ||
− | | || | + | | 정치적 현안||인용이 어떤 정치적 맥락에서 이루어졌는지를 기록한다. |
|- | |- | ||
| || | | || | ||
115번째 줄: | 124번째 줄: | ||
위에서 언급하였던 것처럼, 데이터 수집은 2000년 이후 대한민국 정치인의 논어 인용 사례를 구글에서 검색하는 방식으로 이루어진다. 이러한 검색 방식에는 두 가지가 있는데, 첫째는 ''' "정치인 논어 인용" 등의 키워드로 뉴스를 검색하는 방법'''이고, 둘째는 '''논어의 문장을 직접 구글 뉴스 탭에 검색하여, 한국 정치인이 그 문장을 인용했다는 내용의 기사를 수집하는 방법'''이다. 이러한 두 가지 방법을 간단한 벤 다이어그램으로 나타낸 것이 아래와 같다. | 위에서 언급하였던 것처럼, 데이터 수집은 2000년 이후 대한민국 정치인의 논어 인용 사례를 구글에서 검색하는 방식으로 이루어진다. 이러한 검색 방식에는 두 가지가 있는데, 첫째는 ''' "정치인 논어 인용" 등의 키워드로 뉴스를 검색하는 방법'''이고, 둘째는 '''논어의 문장을 직접 구글 뉴스 탭에 검색하여, 한국 정치인이 그 문장을 인용했다는 내용의 기사를 수집하는 방법'''이다. 이러한 두 가지 방법을 간단한 벤 다이어그램으로 나타낸 것이 아래와 같다. | ||
− | [[파일: vd.PNG|600px| | + | [[파일:vd.PNG|600px|가운데]] |
본 연구에서 필요한 데이터 집합은 파란색으로 표시된 "한국 현대 정치인의 논어 인용 기사"이다("2000년대 이후"라는 조건은 생략하여 표기하였다). 이는 논어 구절이 포함된 전체 뉴스 기사의 부분집합이다. 위에서 제시한 첫 번째 방법, 즉 "정치인 논어 인용"을 구글에 검색하였을 때 출력되는 결과 집합을 초록색으로 표시하였다. 이 방법을 사용하면 데이터 수집이 편리하기는 하지만, 결과적으로 파란색 목표 집합의 일부분밖에 수집하지 못한다. | 본 연구에서 필요한 데이터 집합은 파란색으로 표시된 "한국 현대 정치인의 논어 인용 기사"이다("2000년대 이후"라는 조건은 생략하여 표기하였다). 이는 논어 구절이 포함된 전체 뉴스 기사의 부분집합이다. 위에서 제시한 첫 번째 방법, 즉 "정치인 논어 인용"을 구글에 검색하였을 때 출력되는 결과 집합을 초록색으로 표시하였다. 이 방법을 사용하면 데이터 수집이 편리하기는 하지만, 결과적으로 파란색 목표 집합의 일부분밖에 수집하지 못한다. | ||
− | 이러한 데이터의 손실을 최소화하기 위하여 두 번째 방법을 사용한다. 즉, 논어의 문장을 일일이 구글 뉴스 탭에 검색하여 얻어지는 모든 검색 결과(분홍색 집합)를 수집한 후, 그 중에서 한국 정치인이 논어를 인용하여 발언한 사례만을 추출하는 것이다. 첫 번째 방법과 비교해 볼 때, 목표 집합(파란색)과 일치하는 결과를 얻을 수 있다는 점은 장점이지만 월등히 많은 노동력과 시간이 필요하다는 점은 큰 단점이다. 논어에는 총 498개의 장이 있고, 이를 포함하는 모든 뉴스 기사를 일일이 읽고 분석하는 것은 현실적으로 불가능하기 때문에 '''데이터의 손실은 최소화하면서 투입되는 노동과 시간 또한 큰 폭으로 줄일 수 있는 보완책'''이 | + | 이러한 데이터의 손실을 최소화하기 위하여 두 번째 방법을 사용한다. 즉, 논어의 문장을 일일이 구글 뉴스 탭에 검색하여 얻어지는 모든 검색 결과(분홍색 집합)를 수집한 후, 그 중에서 한국 정치인이 논어를 인용하여 발언한 사례만을 추출하는 것이다. 첫 번째 방법과 비교해 볼 때, 목표 집합(파란색)과 일치하는 결과를 얻을 수 있다는 점은 장점이지만 월등히 많은 노동력과 시간이 필요하다는 점은 큰 단점이다. 논어에는 총 498개의 장이 있고, 이를 포함하는 모든 뉴스 기사를 일일이 읽고 분석하는 것은 현실적으로 불가능하기 때문에 '''데이터의 손실은 최소화하면서 투입되는 노동과 시간 또한 큰 폭으로 줄일 수 있는 보완책'''이 필요하다. 그 보완책으로, 파일럿 조사를 통해 분석 대상 장(章)을 선정하는 작업을 거쳤다. |
+ | |||
+ | ====파일럿 조사==== | ||
+ | |||
+ | 파일럿 조사는 다음과 같은 방법으로 이루어졌다. | ||
+ | # 논어의 각 장을 구글의 뉴스 탭에 검색하여, 검색된 뉴스의 개수를 집계한다. | ||
+ | # 뉴스 개수가 많은 순서대로 장을 정렬한다. | ||
+ | # 뉴스 개수의 누적 비율을 계산한다. | ||
+ | |||
+ | 파일럿 조사 결과 상위 30개 장을 나열한 결과는 다음 표와 같다. | ||
+ | |||
+ | {| {{table}} | ||
+ | |+ 논어의 각 장(章)이 인용된 뉴스 개수 집계 결과 | ||
+ | | align="center" style="background:#f0f0f0;"|'''번호''' | ||
+ | | align="center" style="background:#f0f0f0;"|'''편 제목''' | ||
+ | | align="center" style="background:#f0f0f0;"|'''편''' | ||
+ | | align="center" style="background:#f0f0f0;"|'''장''' | ||
+ | | align="center" style="background:#f0f0f0;"|'''뉴스 개수''' | ||
+ | | align="center" style="background:#f0f0f0;"|'''누적비율''' | ||
+ | |- | ||
+ | | 1||공야장||5||8||294215||0.852349927 | ||
+ | |- | ||
+ | | 2||위영공||15||20||10100||0.881609938 | ||
+ | |- | ||
+ | | 3||양화||17||4||8830||0.90719072 | ||
+ | |- | ||
+ | | 4||옹야||6||18||6324||0.925511543 | ||
+ | |- | ||
+ | | 5||계씨||16||1||4690||0.939098618 | ||
+ | |- | ||
+ | | 6||안연||12||7||3795||0.95009285 | ||
+ | |- | ||
+ | | 7||양화||17||14||3710||0.960840834 | ||
+ | |- | ||
+ | | 8||술이||7||21||1520||0.965244321 | ||
+ | |- | ||
+ | | 9||양화||17||17||1480||0.969531927 | ||
+ | |- | ||
+ | | 10||공야장||5||9||1227||0.973086584 | ||
+ | |- | ||
+ | | 11||안연||12||22||969||0.975893806 | ||
+ | |- | ||
+ | | 12||위정||2||11||838||0.978321518 | ||
+ | |- | ||
+ | | 13||안연||12||17||831||0.980728951 | ||
+ | |- | ||
+ | | 14||자로||13||23||712||0.982791637 | ||
+ | |- | ||
+ | | 15||학이||1||1||592||0.984506679 | ||
+ | |- | ||
+ | | 16||자로||13||3||375||0.985593066 | ||
+ | |- | ||
+ | | 17||안연||12||8||288||0.986427411 | ||
+ | |- | ||
+ | | 18||안연||12||2||275||0.987224094 | ||
+ | |- | ||
+ | | 19||학이||1||3||267||0.987997601 | ||
+ | |- | ||
+ | | 20||미자||18||4||229||0.988661021 | ||
+ | |- | ||
+ | | 21||위영공||15||23||225||0.989312853 | ||
+ | |- | ||
+ | | 22||이인||4||25||220||0.9899502 | ||
+ | |- | ||
+ | | 23||미자||18||8||181||0.990474563 | ||
+ | |- | ||
+ | | 24||위영공||15||2||171||0.990969955 | ||
+ | |- | ||
+ | | 25||술이||7||1||169||0.991459553 | ||
+ | |- | ||
+ | | 26||위정||2||12||137||0.991856446 | ||
+ | |- | ||
+ | | 27||헌문||14||27||135||0.992247545 | ||
+ | |- | ||
+ | | 28||요왈||20||3||128||0.992618365 | ||
+ | |- | ||
+ | | 29||자로||13||25||116||0.992954421 | ||
+ | |- | ||
+ | | 30||이인||4||15||104||0.993255712 | ||
+ | |- | ||
+ | | | ||
+ | |} | ||
+ | |||
+ | 상위 30위에 해당하는 이인편 15장의 경우, 104개의 뉴스가 검색되었으며 그 누적비율은 99.3%에 달한다. 이 누적비율의 의미는, 상위 1~30위 장이 포함된 뉴스의 개수가 논어 구절이 포함된 전체 뉴스 개수의 99.3%을 차지한다는 뜻이다. 즉, 연구 대상 문장을 상위 30개 장으로 제한하더라도 논어가 포함된 전체 뉴스 기사(분홍색 집합)의 약 0.7%밖에 손실되지 않는다는 의미이다. 이 정도면 모집단에 대한 대표성이 충분하다고 생각되어, 파일럿 조사 결과 위의 상위 30개 문장을 연구 대상으로 삼기로 결정하였다. | ||
+ | |||
+ | ==== 본조사 ==== | ||
+ | 파일럿 조사를 통해 선정된 30개 문장에 대하여 본조사가 이루어진다. 본조사는 다음과 같은 방법으로 진행된다. | ||
+ | # 위 목록의 각 문장을 구글의 뉴스 탭에 검색한다. | ||
+ | # 1의 결과 중 대한민국 정치인이 2000년 이후에 논어를 인용한 뉴스만을 선별한다. | ||
+ | #* "논어 인용"이라는 행위는 크게 3가지로 나누어졌다. 첫째는 해당 정치인이 직접 "논어에 이런 말이 있다"고 출처를 언급하며 인용한 경우, 둘째는 해당 표현이 논어에서 유래한 말이나 관용 표현으로 굳어져서 논어에 관한 언급 없이 사용된 경우, 셋째는 논어에 나오는 문장을 잘못된 출처를 언급하며 인용한 경우이다(예를 들면, 정치인은 "맹자에 이러한 말이 있다"고 하였으나 사실 그 문장이 논어에서 나온 경우). 본 조사에서는 위 세 가지 경우가 모두 "논어 인용 사례"의 개념에 해당된다고 간주하고, 모두 포함하여 조사하였다. | ||
+ | # 인용한 정치인, 인용 시기(분명하지 않을 경우에는 기사 발행 시기), 인용 시기 기준 해당 정치인의 소속 정당, 인용 시기의 정치적 현안 및 맥락, 인용된 논어의 원문 구절, 해당 구절이 속한 편/장, 그 구절에서 파생된 관용 표현, 출처 등을 수집한다. 소속 정당은 해당 정치인의 정치적 성향을 분류하기 위한 것으로, 다음과 같은 기준으로 범주화된다. | ||
+ | {| {{wikitable style = "width:70%;"}} | ||
+ | | align="center" style="background:#f0f0f0;" width = "20%"|'''정치성향''' | ||
+ | | align="center" style="background:#f0f0f0;"|'''정당''' | ||
+ | |- | ||
+ | | 진보||더불어민주당, 정의당, 새정치민주연합, 통합민주당 등 | ||
+ | |- | ||
+ | | 보수||한나라당, 새누리당, 자유한국당, 미래통합당, 국민의힘, 바른미래당 등 | ||
+ | |- | ||
+ | | 중도||국민의당, 무소속 등 | ||
+ | |- | ||
+ | | | ||
+ | |} | ||
+ | |||
+ | ===온톨로지 설계=== | ||
+ | 위에서 수집된 데이터를 이용하여 온톨로지를 구성한다. 이 온톨로지로부터 정치적 성향별로 주로 인용하는 논어 구절이 무엇인지, 정치적 현안 또는 맥락에 따라 주로 인용되는 구절은 무엇인지 등을 알 수 있다. | ||
==편찬 데이터== | ==편찬 데이터== |
2020년 10월 13일 (화) 10:27 기준 최신판
탐구의 목적
고대부터 사람들은 속담이나 격언, 지식인들의 말을 인용하여 자신의 주장에 권위를 내세워왔다. 고대 그리스 철학자인 소크라테스의 제자들은 스승의 말을 의견의 근거로 하는 습관이 있었고, 이 풍습은 후대의 철학자와 성직자에게도 계승되어 권위자나 권위자의 저서에 대한 인용은 그 자체로 논증의 예시가 되었다.
그 중 동양에서 가장 많이 인용되고 또 유명한 것을 꼽으라면 단연코 공자의 『논어』를 들 수 있을 것이다. 사서삼경 중 가장 오래 됐으며 동아시아 3국의 유교 문화 형성에 큰 영향을 미친 공자의 『논어』는 그 자체로 사람들의 사고 체계의 일부분으로 자리 잡아 기원전부터 현대에 이르기까지 널리 인용되고 있다.
특히 각 국의 정치인들은 『논어』를 즐겨 인용하는데, 중국의 시진핑(習近平) 국가 주석은 평소 고시(古詩)와 『논어』를 자주 인용하는 것으로 유명하다. 실제 시진핑 국가 주석이 『논어』를 인용한 상황을 보면, 한국 방문 당시 북핵 문제를 논의하거나 미중 전략경제대화에 참석했을 때, 독일 방문 당시 일본의 난징학살을 비난한 경우 등 주로 정치적 현안과 관련해 인용한 것을 알 수 있다.[1] 정치인이 연설에서 발언하는 단어가 많은 논의와 검토 끝에 채택된다는 것을 고려해볼 때, 정치인이 『논어』를 인용하는 것은 분명 다양한 제반 사항과 이해 관계를 고려하여 전략적으로 사용되었으리라는 것을 추측해볼 수 있다.
『논어』는 또한 공자의 유동적인 언어 사용을 보여준다. 공자는 같은 질문을 받고도 질문한 사람이 누구고 그가 어떤 상황에 처했느냐에 따라 다른 대답을 내놓곤 했다. 정치에 대한 질문을 받았을 때 노나라의 세력가 계강자에겐 “바르게 하는 것”이라 했지만 초나라의 야심가 섭공에겐 “가까이 있는 자들을 기쁘게 하고, 먼 곳에 있는 자들은 찾아오게 만드는 것”이라 답했다. 전자에겐 정치의 올곧음을, 후자에겐 정치의 후덕함을 강조한 것이다.
이처럼 『논어』의 유동적인 언어 사용은 이를 인용하는 정치인의 목적과 당시 현안과 맞물려 복합적인 의미로 발현된다. 따라서 어떤 정치인이 『논어』를 인용했을 때 그가 어떠한 정치 진영에 속해있고, 어떠한 상황에서 어떻게 발언한 것인지를 정리해 보는 것은 내재된 속뜻을 파악하게끔 해줄 수 있다. 본 연구에서는 연구 대상을 2000년 이후 대한민국 정치인의 논어 인용 사례로 한정하여 진행하고자 한다.
탐구의 대상
2000년 이후 대한민국 정치인들이 논어를 인용하여 발언한 사례 중, 구글 뉴스 탭에서 접근할 수 있는 뉴스 기사로 기록되어 있는 것만을 탐구한다. "21세기 한국 정치인의 논어 인용 사례를 구글 뉴스에 검색하여 수집한다"는 작업에 필요한 시간과 노동량 등의 한계로 인하여, 탐구의 대상이 다음 30개 장(章)의 인용 사례로 축소되었는데, 이러한 선정이 어떤 과정을 거쳤는지는 아래 탐구의 방법에 상세히 서술되어 있다.
편 | 장 | 구절 요약 |
1 | 1 | 학이시습지 불역열호 |
1 | 3 | 교언영색 *양화편 17장과 같은 내용* |
2 | 11 | 온고지신 |
2 | 12 | 군자는 한 가지 용도로만 쓰이는 그릇처럼 국한되지 않는다 |
4 | 15 | 일이관지 *위영공편 2장과 같은 내용* |
4 | 25 | 덕불고 필유린 (덕이 있는 사람은 반드시 이웃이 있다) |
5 | 8 | 하나를 들으면 열을 안다 |
5 | 9 | 썩은 나무는 조각할 수 없다 |
6 | 18 | 도를 아는 것은 좋아하는 것만 못하고, 좋아하는 것은 즐기는 것만 못하다 |
7 | 1 | 술이부작 |
7 | 21 | 세 사람이 길을 가면 그 중 반드시 나의 스승이 있다 |
12 | 2 | 기소불욕 물시어인 |
12 | 7 | 무신불립 (백성이 신의가 없으면 존립할 수 없다) |
12 | 8 | 네 필의 말이 끄는 빠른 수레로도 혀에서 나오는 말을 따라잡지 못한다 |
12 | 17 | 정자정야(정치는 바르게 하는 것) |
12 | 22 | 인(仁)은 사람을 사랑하는 것이고, 지(知)는 사람을 아는 것이다 |
13 | 3 | 자신이 알지 못하는 것은 제쳐놓고 말하지 않는 것이다 |
13 | 23 | 군자는 조화를 이루되 부화뇌동하지 않으며, 소인은 부화뇌동하되 조화를 이루지 못한다 |
13 | 25 | 사람을 부림에 있어서 그릇에 맞게 한다 |
14 | 27 | 그 지위(地位)에 있지 않으면, 그 정사(政事)를 도모하지 않는다 |
15 | 2 | 일이관지 (하나의 이치로 모든 것을 꿰뚫는다) |
15 | 20 | 군자는 자신에게서 찾고 소인은 남에게서 찾는다 |
15 | 23 | 기소불욕 물시어인 *안연편 2장과 같은 내용* |
16 | 1 | 불환과이환불균 불환빈이환불안 |
17 | 4 | 닭 잡는 데 소 잡는 칼 |
17 | 14 | 도청도설 |
17 | 17 | 교언영색 |
18 | 4 | 삼일부조 |
18 | 8 | 나는 이와 달라서 가(可)한 것도 없고 불가(不可)한 것도 없다 |
20 | 3 | 천명을 알지 못하면 군자가 될 수 없고, 예를 알지 못하면 설 수 없고, 말을 알지 못하면 사람을 알 수 없다 |
총 30개의 장이지만, 위에서 파란색으로 메모한 것과 같이 서로 다른 장이 중복된 내용을 담고 있는 경우가 3개 포함되어 있기 때문에 실질적인 조사 대상 장은 27개이다.
대한민국 정치인들이 위 목록에 있는 논어의 장(章)들을 인용한 뉴스 기사를 구글 검색을 통해 수집하였다. 각 인용 사례에 대해서는 발언한 정치인의 이름, 그 정치인의 성향(진보/보수/중도), 인용한 논어의 원문 구절, 원문에서 파생된 관용적 표현, 해당 구절이 속한 논어의 편과 장, 발언 시기, 당시 정치적 맥락 및 현안, 마지막으로 해당 신문기사의 출처를 수집하였다.
변수 | 변수 설명 |
인물 | 논어를 인용한 인물의 이름 |
정치 성향 | 해당 인물의 정치적 성향. 진보, 보수, 중도의 3개 카테고리로 구분하였다. |
인용 구절 | 인용된 논어의 원문 구절 |
관용 표현 | 위 "인용 구절"에서 파생된 관용 표현. 해당 정치인이 관용 표현을 인용하였을 경우, "인용 구절"과 "관용 표현" 두 가지 변수를 모두 수집하고, 원문만을 인용하였을 경우 "관용 표현" 항목은 공란으로 둔다. |
논어의 편/장 | 해당 구절이 논어의 무슨 편 몇 장의 내용인지 표기 |
출처 | 해당 인용을 다룬 기사 혹은 SNS의 주소 (URL) |
인용 시기 | 인용의 시점. 해당 정치인이 그 인용을 한 시점을 정확히 알 수 있다면 그 시점의 연도와 월까지 표기. 만약 인터뷰 기사 혹은 회고록에서 "나는 이 말을 항상 가슴에 새겨왔다" 라는 식으로 정확한 시점이 드러나지 않는 경우에는, 그 인터뷰 기사의 발행 일시를 연도와 월까지 입력. |
정치적 현안 | 인용이 어떤 정치적 맥락에서 이루어졌는지를 기록한다. |
탐구의 방법
데이터 수집
위에서 언급하였던 것처럼, 데이터 수집은 2000년 이후 대한민국 정치인의 논어 인용 사례를 구글에서 검색하는 방식으로 이루어진다. 이러한 검색 방식에는 두 가지가 있는데, 첫째는 "정치인 논어 인용" 등의 키워드로 뉴스를 검색하는 방법이고, 둘째는 논어의 문장을 직접 구글 뉴스 탭에 검색하여, 한국 정치인이 그 문장을 인용했다는 내용의 기사를 수집하는 방법이다. 이러한 두 가지 방법을 간단한 벤 다이어그램으로 나타낸 것이 아래와 같다.
본 연구에서 필요한 데이터 집합은 파란색으로 표시된 "한국 현대 정치인의 논어 인용 기사"이다("2000년대 이후"라는 조건은 생략하여 표기하였다). 이는 논어 구절이 포함된 전체 뉴스 기사의 부분집합이다. 위에서 제시한 첫 번째 방법, 즉 "정치인 논어 인용"을 구글에 검색하였을 때 출력되는 결과 집합을 초록색으로 표시하였다. 이 방법을 사용하면 데이터 수집이 편리하기는 하지만, 결과적으로 파란색 목표 집합의 일부분밖에 수집하지 못한다.
이러한 데이터의 손실을 최소화하기 위하여 두 번째 방법을 사용한다. 즉, 논어의 문장을 일일이 구글 뉴스 탭에 검색하여 얻어지는 모든 검색 결과(분홍색 집합)를 수집한 후, 그 중에서 한국 정치인이 논어를 인용하여 발언한 사례만을 추출하는 것이다. 첫 번째 방법과 비교해 볼 때, 목표 집합(파란색)과 일치하는 결과를 얻을 수 있다는 점은 장점이지만 월등히 많은 노동력과 시간이 필요하다는 점은 큰 단점이다. 논어에는 총 498개의 장이 있고, 이를 포함하는 모든 뉴스 기사를 일일이 읽고 분석하는 것은 현실적으로 불가능하기 때문에 데이터의 손실은 최소화하면서 투입되는 노동과 시간 또한 큰 폭으로 줄일 수 있는 보완책이 필요하다. 그 보완책으로, 파일럿 조사를 통해 분석 대상 장(章)을 선정하는 작업을 거쳤다.
파일럿 조사
파일럿 조사는 다음과 같은 방법으로 이루어졌다.
- 논어의 각 장을 구글의 뉴스 탭에 검색하여, 검색된 뉴스의 개수를 집계한다.
- 뉴스 개수가 많은 순서대로 장을 정렬한다.
- 뉴스 개수의 누적 비율을 계산한다.
파일럿 조사 결과 상위 30개 장을 나열한 결과는 다음 표와 같다.
번호 | 편 제목 | 편 | 장 | 뉴스 개수 | 누적비율 |
1 | 공야장 | 5 | 8 | 294215 | 0.852349927 |
2 | 위영공 | 15 | 20 | 10100 | 0.881609938 |
3 | 양화 | 17 | 4 | 8830 | 0.90719072 |
4 | 옹야 | 6 | 18 | 6324 | 0.925511543 |
5 | 계씨 | 16 | 1 | 4690 | 0.939098618 |
6 | 안연 | 12 | 7 | 3795 | 0.95009285 |
7 | 양화 | 17 | 14 | 3710 | 0.960840834 |
8 | 술이 | 7 | 21 | 1520 | 0.965244321 |
9 | 양화 | 17 | 17 | 1480 | 0.969531927 |
10 | 공야장 | 5 | 9 | 1227 | 0.973086584 |
11 | 안연 | 12 | 22 | 969 | 0.975893806 |
12 | 위정 | 2 | 11 | 838 | 0.978321518 |
13 | 안연 | 12 | 17 | 831 | 0.980728951 |
14 | 자로 | 13 | 23 | 712 | 0.982791637 |
15 | 학이 | 1 | 1 | 592 | 0.984506679 |
16 | 자로 | 13 | 3 | 375 | 0.985593066 |
17 | 안연 | 12 | 8 | 288 | 0.986427411 |
18 | 안연 | 12 | 2 | 275 | 0.987224094 |
19 | 학이 | 1 | 3 | 267 | 0.987997601 |
20 | 미자 | 18 | 4 | 229 | 0.988661021 |
21 | 위영공 | 15 | 23 | 225 | 0.989312853 |
22 | 이인 | 4 | 25 | 220 | 0.9899502 |
23 | 미자 | 18 | 8 | 181 | 0.990474563 |
24 | 위영공 | 15 | 2 | 171 | 0.990969955 |
25 | 술이 | 7 | 1 | 169 | 0.991459553 |
26 | 위정 | 2 | 12 | 137 | 0.991856446 |
27 | 헌문 | 14 | 27 | 135 | 0.992247545 |
28 | 요왈 | 20 | 3 | 128 | 0.992618365 |
29 | 자로 | 13 | 25 | 116 | 0.992954421 |
30 | 이인 | 4 | 15 | 104 | 0.993255712 |
상위 30위에 해당하는 이인편 15장의 경우, 104개의 뉴스가 검색되었으며 그 누적비율은 99.3%에 달한다. 이 누적비율의 의미는, 상위 1~30위 장이 포함된 뉴스의 개수가 논어 구절이 포함된 전체 뉴스 개수의 99.3%을 차지한다는 뜻이다. 즉, 연구 대상 문장을 상위 30개 장으로 제한하더라도 논어가 포함된 전체 뉴스 기사(분홍색 집합)의 약 0.7%밖에 손실되지 않는다는 의미이다. 이 정도면 모집단에 대한 대표성이 충분하다고 생각되어, 파일럿 조사 결과 위의 상위 30개 문장을 연구 대상으로 삼기로 결정하였다.
본조사
파일럿 조사를 통해 선정된 30개 문장에 대하여 본조사가 이루어진다. 본조사는 다음과 같은 방법으로 진행된다.
- 위 목록의 각 문장을 구글의 뉴스 탭에 검색한다.
- 1의 결과 중 대한민국 정치인이 2000년 이후에 논어를 인용한 뉴스만을 선별한다.
- "논어 인용"이라는 행위는 크게 3가지로 나누어졌다. 첫째는 해당 정치인이 직접 "논어에 이런 말이 있다"고 출처를 언급하며 인용한 경우, 둘째는 해당 표현이 논어에서 유래한 말이나 관용 표현으로 굳어져서 논어에 관한 언급 없이 사용된 경우, 셋째는 논어에 나오는 문장을 잘못된 출처를 언급하며 인용한 경우이다(예를 들면, 정치인은 "맹자에 이러한 말이 있다"고 하였으나 사실 그 문장이 논어에서 나온 경우). 본 조사에서는 위 세 가지 경우가 모두 "논어 인용 사례"의 개념에 해당된다고 간주하고, 모두 포함하여 조사하였다.
- 인용한 정치인, 인용 시기(분명하지 않을 경우에는 기사 발행 시기), 인용 시기 기준 해당 정치인의 소속 정당, 인용 시기의 정치적 현안 및 맥락, 인용된 논어의 원문 구절, 해당 구절이 속한 편/장, 그 구절에서 파생된 관용 표현, 출처 등을 수집한다. 소속 정당은 해당 정치인의 정치적 성향을 분류하기 위한 것으로, 다음과 같은 기준으로 범주화된다.
정치성향 | 정당 |
진보 | 더불어민주당, 정의당, 새정치민주연합, 통합민주당 등 |
보수 | 한나라당, 새누리당, 자유한국당, 미래통합당, 국민의힘, 바른미래당 등 |
중도 | 국민의당, 무소속 등 |
온톨로지 설계
위에서 수집된 데이터를 이용하여 온톨로지를 구성한다. 이 온톨로지로부터 정치적 성향별로 주로 인용하는 논어 구절이 무엇인지, 정치적 현안 또는 맥락에 따라 주로 인용되는 구절은 무엇인지 등을 알 수 있다.