행위

DigitalSinology(2026) Paper06

CNUDH

SHM CNUL (토론 | 기여)님의 2026년 4월 1일 (수) 14:57 판 (무엇을(What))





Digital Periegesis

(URL: https://nodegoat.abm.uu.se/viewer.p/5/4263/scenario/6/geo/)

중어중문학과 손흥매






목차

Contents


누가(Who) 언제(When) 어디서(Where) 무엇을(What) 어떻게(How) 왜(Why)



해당 사이트에 대한 간단한 소개글



누가(Who)


吾与点(오여점)은 디지털인문학과 지능형 데이터 처리에 활용되는 온라인 플랫폼입니다. 공개 소개에 따르면, 이 플랫폼은 베이징대학교 디지털인문연구센터(PKUDHC)와 북경문점익도과기유한공사가 공동 개발했으며, 운영과 유지 관리는 기업 측이 맡고 있습니다.
아주 쉽게 말하면,
오여점은 사람이 읽기 어렵고 정리하기 힘든 자료를 더 알아보기 쉽고, 분석하기 쉬운 데이터로 바꾸어 주는 똑똑한 사이트입니다. 특히 문자 자료, 이미지 자료, 고문헌 자료를 다루는 연구자들에게 도움이 되는 도구입니다.

언제(When)


오여점은 처음부터 지금과 같은 종합 플랫폼이었던 것은 아닙니다. 공개 자료를 보면, 2021년경에는 고적(古籍) 자동 정리 플랫폼으로 소개되었고, 당시 주요 기능은 문자 인식, 자동 구두점 처리, 개체명 인식 등이었습니다. 즉, 표점이 없는 옛 문헌을 더 읽기 쉽게 정리해 주는 기능이 중심이었습니다.
이후 플랫폼은 점점 발전하여, 지금은 단순히 고문헌만 정리하는 것이 아니라 텍스트와 이미지 같은 다양한 자료를 구조화하고, 표·지식그래프·질의응답·통계 분석까지 지원하는 종합형 지능 데이터 플랫폼으로 확장되었습니다.
한 마디로 정리하면 오여점은 처음에는 ‘옛책을 정리해 주는 도구’에 가까웠지만, 지금은 ‘여러 종류의 자료를 정리하고 분석해 주는 더 큰 플랫폼’으로 자라난 것입니다.




어디서(Where)


오여점은 인터넷에서 접속해서 사용하는 온라인 플랫폼입니다. 사용자는 웹브라우저를 통해 사이트에 들어가 프로젝트를 만들고, 자료를 올리고, 정보를 추출하고, 분석 작업을 진행할 수 있습니다. 도움말 문서에는 대시보드, 내 프로젝트, 작업 생성, 표 설정, 데이터 추출 같은 실제 사용 흐름도 안내되어 있습니다.
오여점은 교실이나 도서관 안에 있는 물건이 아니라, 컴퓨터로 접속해서 사용하는 웹사이트형 연구 도구입니다. 인터넷만 되면 접속해서 사용할 수 있습니다.

무엇을(What)


원자료를 ‘지능 데이터’로 바꾸는 플랫폼

공개 소개에 따르면, 이 플랫폼은 사용자가 원하는 구조에 맞추어 텍스트, 이미지 등 다양한 자료에서 구조화된 정보를 추출하고, 그 결과를 표나 지식그래프의 형태로 자동 생성할 수 있습니다. 또한 이렇게 정리된 데이터를 기반으로 검색, 질의응답, 통계, 차트 작성, 네트워크 분석까지 할 수 있습니다.


예를 들어, 오여점은 다음과 같은 일을 할 수 있습니다.

  • 글 속에서 인명, 지명, 기관명, 사건명 같은 중요한 정보를 찾아냄
  • 텍스트 속 관계를 정리하여 누가 누구와 어떤 관련이 있는지 보여 줌
  • 정보들 사이의 연결을 지식그래프로 나타냄
  • 자료를 보기 쉬운 표 형태로 바꿈
  • 정리된 데이터를 바탕으로 검색, 질문, 통계 분석을 할 수 있게 함






어떻게(How)


Periegesis Hellados의 두드러진 특징은 크게 두 가지가 있습니다.

첫째, 파우사니아스의 공간 묘사가 근대의 ‘데카르트적 조감도(위에서 내려다보는)’가 아니고, 길을 따라 이동하는 ‘이동 경로’ 중심입니다.
둘째, 현재에 머무른 ‘공간’ 서술이 아니라 신화적 과거부터 현재까지, 다양한 인물(신, 영웅, 사람 등) 서사가 결합되어 있는 ‘장소’의 서술입니다.


이를 구현하기 위해서는 (간단히) 다음과 같은 단계를 거쳐야 합니다.

  1. 기초 자료인 Periegesis Hellados 문헌 텍스트를 확보한다.
  2. 문헌의 의미를 기계가 이해할 수 있도록 한다.
  3. 인물, 시간, 장소, 관계 등을 정확히 식별하고, 구조화한다.
  4. 구축된 데이터를 다양한 포맷으로 추출하고, 적절하게 시각화할 수 있도록 한다.
  5. 누구나 접근 가능하고, 재사용할 수 있도록 인프라를 구축한다.




구체적으로는 다음과 같습니다.

1단계

: 기초 자료인 Periegesis Hellados 문헌 텍스트를 확보한다.

기초 데이터 확보: 파우사니아스 10권 전집의 온라인 그리스어 및 영어 판본(Perseus Classical Library Scaife viewer)
→ 기계 판독이 가능한 TEI/XML 스키마.
→ 오픈 라이선스(CC-BY)로 제공되어 저작권 문제가 없음.

전문가들의 주석달기: Recogito 활용(코딩 지식이 없어도 쉽게 주석을 달 수 있는 플랫폼. 협업에 좋다.)

지리 사전 활용

  • Pleiades, DARE: 대표적인 글로벌 지리사전. 하지만 거시적인 단위만 제공함.
  • Recogito: 위 한계를 극복하기 위해 독자적인 로컬 서버를 구축하여 새로운 지리 정보를 추가함.
  • ToposText: 고대 그리스 전역의 유적지와, 그 장소를 언급하는 문헌 구절을 연결하는 데이터베이스.
  • Dipylon: 아테네 지역의 유적 데이터베이스.
  • Arachne: 그리스·로마 시대를 중심으로 한 유물 데이터베이스.




2단계

: 문헌의 의미를 기계가 이해할 수 있도록 한다.

Periegesis Hellados 텍스트를 전문가들이 직접 문맥을 파악하며 개체명 마킹.
→ “그 신전”은 어디인가?

식별한 객체를 적절한 지명 사전 URI와 연결.
→ 모호성을 해소하고 공신력을 갖춤.
→ “그 신전” = “올림피아에 있는 헤라 신전”

1차 대분류(그룹화 목적)와 2차 소분류(원어)를 통해 원어를 살린 태깅.

작가의 시공간적 궤적을 분리하는 ‘Paus’와 ‘Opsis’ 태그.

  • Paus: 파우사니아스가 서술할 당시 있던 물리적인 장소
  • Opsis: 파우사니아스가 서술할 때 있던 장소가 아닌, 머릿속으로 떠올려 묘사한 장소


<태그를 다는 과정>

태그 방법 1 built: 도시, 사원, 극장 등 대형 구조물 physical: 자연 경관
object: 조각상, 예술 작품, 기둥 등 공간상의 작은 요소 mythical: '하데스'와 같이 본질적으로 지도화 할 수 없는 공간 장소
태그 방법 2 파우사니아스의 원어: naos(사원), hieron(성소), bomos(제단), agalma(신성한 제물로 바쳐진 조각상), "xoanon"(투박하게 조각된 오래된 나무 조각상) 등
태그 방법 3 Paus: 파우사니아스가 서술할 당시 있던 물리적인 장소
Opsis: 파우사니아스가 서술할 때 있던 장소가 아닌, 머릿속으로 떠올려 묘사한 장소



3단계

인물, 시간, 장소, 관계 등을 정확히 식별하고, 구조화한다.

정확한 인물 데이터의 매핑.
고대 그리스어 텍스트 특성의 한계로, 인물의 철자 변형이나 모호한 경우가 있습니다.(예: 어느 가제티어에서는 'Dionysos', 다른 곳에서는 'Dionysus'로 표기되거나 동명이인인 경우)
이를 해결하기 위해:
1. Recogito 내에서는 ‘Person’이라고만 태깅
2. 고대 그리스어 이름 데이터를 일괄 추출 후 Excel을 사용해 영어, 라틴어 철자와 대조
3. OpenRefine를 활용, Wikidata 식별자와 매핑

정확한 시간 데이터의 매핑.
파우사니아스의 서술은 사건 및 인물 중심이므로, 현대의 연대 분류로 단순 치환하는 것이 어렵습니다.
이를 해결하기 위해:
사건 및 역사적 시기에 대한 기록이 풍부한 Wikidata를 활용, 사건과 연도 데이터를 연결시킴.

정확한 관계망 구축.
이 프로젝트는 단순히 그리스 유산을 목록화하고 정리하는 것에 그치는 게 아니라, 사물-기념물-인물 간 관계를 연결하는 것이 목적입니다.
이를 위해:
1. ‘주어 -> 동사 -> 목적어’ 구조의 일관된 관계식으로 변환
2. 화살표(방향성이 있는)로 연결되기에 ‘능동태 동사’를 사용

정확한 공간적 관계 보존.
파우사니아스가 서술한 공간 간의 관계를 최대한 정확하고 세밀하게 표현하기 위해 번역이 아닌 음차하여 태그를 사용했습니다.
(예시)
영어그리스어.png


4단계

구축된 데이터를 다양한 포맷으로 추출하고, 적절하게 시각화할 수 있도록 한다.

Recogito에서는 다양한 형식으로 데이터를 내보낼 수 있습니다. 이에 따라 여러 후속 연구에서의 활용성이 뛰어납니다.

Gephi는 관계망 분석 전용 소프트웨어입니다. 그래서 개체 간 관계를 파악하는 데에는 용이하지만, 지도 좌표에 맞게 배치하는 데에는 어려움이 있습니다. 이에 이 프로젝트의 연구진은 GeoLayout 플러그인을 활용하였고, Recogito에서 Gephi에 활용할 데이터를 추출할 때 위·경도 정보가 포함되지 않았기에 수동으로 좌표값을 입력하는 작업을 거쳐 Gephi에서도 좌표를 구현해내었습니다.

텍스트의 시계열 데이터 변환
파우사니아스의 서술 궤적을 GIS에서 ‘시간 애니메이션’으로 구현하고 싶었습니다.
하지만, 파우사니아스의 문헌에는 특정 날짜가 적혀있지 않았습니다. 이에 문헌 구조인 ‘권-장-절’을 날짜 포맷인 ‘시-분-초’로 매핑하였습니다.
예를 들어 ‘3권 5장 2절’은 ‘03시 05분 02초’가 됩니다. 따라서 파우사니아스가 실제로 그리스를 걸어다니며 묘사했던 경로(Paus)를 시각화할 수 있게 됩니다.


5단계

누구나 접근 가능하고, 재사용할 수 있도록 인프라를 구축한다.

Digital Periegesis 프로젝트는 FAIR 원칙에 따라 찾기 쉽고(Findable), 접근 가능하며(Accessible), 상호 운용이 가능하고(Interoperable), 재사용 가능한(Reusable) 데이터를 구축하였습니다.
그리고 외부 플랫폼 및 데이터베이스(Pleiades, ToposText, Wikidata, DAI 등)와 연결하여 고유 식별자(URI)를 부여하였습니다.
또한 다양한 포맷으로의 다운로드 환경을 제공하여 누구나 다양하게 연구할 수 있도록 했습니다.





왜(Why)


Digital Periegesis의 연구진은 관련 논문에서 이렇게 밝히고 있습니다.

“기원후 2세기 파우사니아스(Pausanias)가 저술한 『그리스 안내기』(Periegesis Hellados)는 그리스 본토를 아우르는 총 10권 분량의 방대한 여정을 담고 있다. 계몽주의 시대 이후 고대 그리스 문학이 재발견되면서, 그의 저작은 그리스 유적에 대한 안내서로서 독보적인 영향력을 발휘해 왔다. 특히 아테네, 코린토스, 올림피아와 같은 주요 유적지를 발굴하고 해석하는 과정에서 수많은 여행가와 고고학자들에게 결정적인 지침을 제공했다.


그러나 최근 이 저작을 하나의 '서사(Narrative)'로 주목하는 연구들은 공간이 텍스트 내에서 어떻게 구축되는지, 그리고 공간(Space)과 장소(Place)가 어떤 방식으로 개념화되고 상호 연관되는지에 주목하기 시작했다. 본 논문은 '디지털 페리에게시스(Digital Periegesis)' 프로젝트의 초기 성과를 개괄하며, 시맨틱 지리 주석(Semantic geo-annotation)을 활용해 서사 내부에 존재하는 공간의 형태와 해당 서사가 지닌 공간적 형식을 포착·분석한다.

특히 본고는 지리 파싱(Geo-parsing), 시공간 분석, 네트워크 분석, 그리고 연결된 개방 데이터(Linked Open Data, LOD)를 활용하여 전근대 문학 텍스트의 지리학을 재고한다. 이는 고대 문헌의 지리적 구조가 단순한 물리적 거리(Topographic proximity)보다는 관계 중심의 위상학적 연결(Topological connections)에 더 깊이 뿌리박고 있다는 점을 규명하려는 시도이다."


이 프로젝트는 본질적으로 ‘파우사니아스의 문학 유산 정보를 어떻게 가장 효과적으로 조직하고, 고고학적 현장과 연결할 것인가?’에 대한 답을 찾아내는 과정이었습니다.
문헌 상의 정보를 실제 지도 위에 구현하는 것을 넘어서서 그 안에 얽힌 복잡한 관계와 시공간을 읽어냈습니다. 또한 기계가 읽을 수 있는 데이터를 구현한 것뿐만 아니라 외부와도 연결되어 연구의 확장성을 갖추었습니다.




Wiki 문법 소개



전체적이고 자세한 설명은 한국학중앙연구원 박사과정 김지선의 위키문법을 참고하시면 좋습니다.