행위

OverseasDHResearchCases

red

김지선 (토론 | 기여) 사용자의 2022년 4월 22일 (금) 18:32 판 (목차)

메인 페이지로 가기


디지털 인문학과 데이터 프로세싱

: 해외 디지털 인문학 연구 사례 검토를 중심으로

Some Thoughts on Data Processing in Digital Humanities
: Focusing on Overseas Digital Humanities Research Cases Review



목차

Contents


London Lives Livingstone Online Derrida’s Margins Novel City Maps Six Degrees of Francis Bacon Enslaved Slave Voyages O Say Can You See



Case 01: London Lives

London Lives 정리 시 참고한 주 웹 자원[1]


London Lives 웹사이트 가기



Who, 누가[2]


영국 하트퍼드셔 대학(University of Hertfordshire)과 셰필드 대학(University of Sheffield) 소속 연구자들 중심으로 이루어진 연구팀

  1. 프로젝트 감독 및 저자(Director, Author) 및 Historical Background Pages 제작
    • 팀 히치콕 교수(Prof. Tim Hitchcock)
      • 1997년~2013년: 영국 잉글랜드 하트퍼드셔 대학교 사회과학, 예술 및 인문학 연구소(Social Sciences, Arts and Humanities Research Institute)◀ 프로젝트 당시 직위
      • 2013년~현재: 영국 서식스 대학교(University of Sussex) 디지털 역사학(Digital History) 교수
    • 로버트 슈메이커 교수(Prof. Robert Shoemaker)
      • 영국 셰필드 대학교역사학과(Department of History) 18세기 British History 교수◀ 프로젝트 당시 직위
      • 현재는 퇴직함.
  2. 프로젝트 매니저(Project Manager)
    • 샤론 하워드 박사(Dr. Sharon Howard) : 셰필드 대학교 디지털 인문학 연구소(The Digital Humanities Institute, University of Sheffield)
  3. 개발자(Developer)
    • 검색 엔진 구현 담당 기술 책임자
      • 제이미 맥로플린(Jamie McLaughlin) : 셰필드 대학교 디지털 인문학 연구소 소속
    • 자동 마크업 담당 기술 책임자
      • 에드 맥켄지(Ed MacKenzie) : 셰필드 대학교 디지털 인문학 연구소 소속
      • 캐서린 로저스(Katherine Rogers) : 셰필드 대학교 디지털 인문학 연구소 소속
  4. 데이터 개발자 팀 (a team of data developers)
    • 선임 데이터 개발자(Developer): 모든 태깅 절차를 담당
      • 필리파 하드먼 박사(Dr. Philippa Hardman) : 셰필드 대학교 디지털 인문학 연구소 소속
    • 데이터 개발자들(The other Data Developers)
      • Anna Bayman(안나 베이먼)
      • Eilidh Garrett(에일리드 개럿)
      • Carol Lewis-Roylance(캐롤 루이스-로일랜스)
      • Susan Parkinson(수잔 파킨슨)
      • Anna Simmons(안나 시몬스)
      • Gwen Smithson(그웬 스미스슨)
      • Nicola Wilcox(니콜라 윌콕스)
      • Catherine Wright(캐서린 라이트)
  5. 런던 연구원(The London researcher)
    • Mary Clayton(메리 클레이튼) : 런던 기록 보관소들(archives)에서 연구 보조


When, 언제


  • 2005년[3]: ESRC(경제 사회 연구 위원회, Economic and Social Research Council)의 펀딩을 받아 London Lives 프로젝트가 진행됨(grant RES-000-23-1217)[4]
  • 2010년 6월 28일: London Lives 웹 사이트 게시.[5][6]
  • 2010년 7월 5일: 하트퍼드셔 대학교에서 London Lives 프로젝트의 완성을 기념하는 프로젝트 컨퍼런스를 개최.[7][8]
  • 2010년 8월: London Lives 웹 사이트 제작을 위한 펀딩 지원이 종료.[9]
  • 2018년 3월: London Lives 버전 2.0 출시[10]


Where, 어디서


  • 영국 하트퍼드셔 대학과 셰필드 대학 합동 프로젝트
  1. University of Hertfordshire의 Higher Education Digitisation Service(고등 교육 디지털화 서비스)
    • 12개의 런던 기록보관소에서 4천만 단어 이상의 텍스트로 구성된 크고 다양한 원고와 일부 인쇄물이 하트퍼드셔 대학의 HEDS에 의해 디지털화되었고, 이후 DHI로 이전되었다.[11]
    • HEDS는 University of Hertfordshire에서 전자 도서관 프로그램(eLib)의 프로젝트 자금으로 설립되었다. HEDS는 영국 고등 교육계 내에서 디지털화된 서비스를 위하여 설립되었고, 자금 지원을 받고 있다. HEDS는 고등 교육계에서 가용성을 높이기 위해 대량의 학습, 교육 및 학술 자료를 전자적인 형태로의 변환하는 것을 지원한다.[12]
  2. University of Sheffield의 DHI(The Digital Humanities Institute)
    • HRI(Humanities Resource Institute) digital은 2016년 1월 17일에 DHI(The Digital Humanities Institute)로 이름을 변경하였다.[13]
    • 인문학연구소(HRI)의 HRI digital에서는, 이름, 장소 및 날짜를 식별하기 위해 자동화된 마크업과 수동 태깅을 결합하여 사용하였고, 검색 엔진과 웹 사이트를 개발하여 키워드와 문구뿐만 아니라 XML 태그 텍스트(XML tagged text)로 다각적인 검색을 용이하게 했습니다.[14]
    • DHI는 영국의 대표적인 디지털 인문학 센터 중 하나로 예술과 인문학을 위한 연구 및 개발 서비스를 제공하고 있다. 1994년에 설립되어 예술과 인문학의 연구에 있어서 기술과 연산(computation)의 혁신적인 이용을 지원하는 것을 목표로 하고 있다.[15]


What, 무엇을


  • London Lives는 교회 교구 기록, 과세 기록, 범죄 및 형사 사법에 관한 기록, 빈곤 및 빈민 구제에 관한 기록, 병원 및 길드 기록, 검시관 기록 등을 기반으로 1690년부터 1800년까지 영국 런던 평민들의 생애를 추적 가능하도록 함.
  • 기존 런던의 8개의 아카이브에 소장된 240,000개 이상의 원고 및 인쇄물과 다른 프로젝트에서 만든 15개의 데이터셋을 기반으로 335만 개 이상의 인물 정보를 구축함. 사용자는 동일 인물과 관련된 기록을 연결하고, 가장 잘 기록된 개인의 전기를 엮어나갈 수 있으며, London Lives 웹 사이트에 구글 계정을 등록하여 개인의 workspace[16]에서 해당 작업 가능함.


How, 어떻게


  1. 대상 자료 수집
    1. 자료원
      • 대상 자료 선정을 위한 기준은 주로 연구 의제에 의해 결정되었으나, 또한 해당 자료의 디지털화 가능성 및 동일 인물에 대한 정보를 포함할 가능성이 가장 높은지 등을 고려해 결정하였다.[17]
      • 주로 18세기 런던 평민들의 삶을 들여 보는데 교차해서 엮어낼 수 있는 기록물인 형사사법/구제/의료 기록등의 자료를 선정하되, 가능하면 포괄적인 아카이브 컬렉션을 포함하고자 함.[18]
      • 교구세 책과 같이 기록이 너무 방대하여 포함할 수 없는 경우에는 제외했으나, 가능하면 각 기관의 전체 아카이브를 디지털화했음.[19]
      • 다수의 교구나 길드와 같이 모든 관련된 아카이브의 기록들을 포함할 수 없는 경우에는 기록 보존성이 뛰어난 완전한 아카이브를 대표적인 예로 선택했다.[20]
      • 구체적인 문서 유형은 해당 사이트 참고.
      • 아카이브를 활용한 기관[21]: Old Bailey Sessions, Middlesex Sessions, Carpenters’ Hall, St Dionis Backchurch, St Clement Danes, Bridewell, St Thomas’s Hospital, St Botolph Aldgate
    2. 데이터셋
      • 외부에서 생성된 데이터 세트를 포함함으로써 프로젝트의 소관이 확장되어 가능했던 것보다 더 광범위한 자료를 포함하게 되었고, 해당 데이터 세트의 이름을 다른 소스와 연결할 수 있게 되었다.[22]
      • 구체적인 데이터 셋은 해당 사이트 참고
  2. 데이터의 분류
    1. 자료원 분류
      • 여러 아카이브로에서 수집한 문서는 그 성격에 따라 5개의 항목으로 나뉘어 분류되었으며, 각 문서마다 2~3개의 알파벳 코드를 부여하였다.[23]
        1. 교구 기록(Parish records)
        2. sessions 및 검시관 기록(Sessions and coroner’s records)
        3. 병원 및 길드 기록(Hospital and guild records)
        4. 범죄 및 형사 사법 관련 문서(Documents concerning crime and criminal justice)
        5. 빈곤과 빈민 구제에 관한 문서(Documents concerning poverty and poor relief)
    2. 데이터셋 분류
      • 타 프로젝트에서 구축한 데이터베이스의 경우, 그 성격에 따라 3개의 항목으로 범주화하였고 각 데이터셋에 2~3개의 알파벳 코드를 부여함.[24]
        1. 교구 기록(Parish records)
        2. 과세 기록(Records from taxation)
        3. 기타 소스(Other sources)
  3. 텍스트 및 이미지의 디지털화
    1. 텍스트의 디지털화
      • 12개의 런던 기록보관소에서 4천만 단어 이상의 텍스트로 구성된 크고 다양한 원고와 일부 인쇄물은 하트퍼드셔 대학의 HEDS에 의해 디지털화되었음.
      • HEDS의 감독 하에 ‘Double rekeying’ 과정이 이루어짐. 하나의 원문을 두 명의 입력자가 각각 전사한 뒤 → 컴퓨터로 두 전사본을 비교하여 차이를 식별한 후 → 사람이 수동으로 수정하는 과정임.
      • 명확하고 잘 구성된 원본 텍스트의 경우 더블 리킹 방법론은 99% 이상의 정확도를 가지나, 17~18세기의 자료는 필적을 해독하는 데 있어서 보존 상태가 불완전하거나 마이크로필름화 및 이미지 디지털화 과정에서 발생한 왜곡은 정확성을 떨어뜨릴 수 있다. 따라서 London Lives에서는 필요할 경우 함께 제공되는 원본 문서 이미지를 참고할 것을 권장한다.
    2. 이미지의 디지털화
      • 원본 원고의 마이크로필름으로부터 페이지 이미지를 스캔하여 400dpi의 고화질의 JPEG 파일을 만들어 제공하며, 인터넷 전송을 원활하게 하기 위해 저화질의 JPEG 파일도 추가로 제작됨.
  4. 텍스트 마크업
    • 인문학연구소(HRI)의 HRI digital에서는, 이름, 장소 및 날짜를 식별하기 위해 자동화된 마크업과 수동 태깅을 결합하여 사용하였고, 검색 엔진과 웹 사이트를 개발하여 키워드와 문구뿐만 아니라 XML 태그 텍스트(XML tagged text)로 다각적인 검색을 용이하게 했습니다.[25]
    • 디지털화된 텍스트는 키워드 검색 페이지에서 임의의 문자열을 검색할 수 있지만 구조화된 검색을 용이하게 하기 위해 XML로 마크업되거나 태깅되었다. London Lives 프로젝트는 특히 ‘성명’ 태깅에 중점을 두고 있으나, 직업, 장소 및 날짜도 마크업했다. 성명의 경우, 성과 이름이 모두 있는 경우에만 마크업 된다. 그러나 마크업은 포괄적이거나 완전히 정확하지 않으므로 이 태그된 정보에 대한 검색은 키워드 검색으로 보완해야 합니다.[26]
    • XML 데이터의 생성은 특정 종류의 시맨틱 마크업(예컨대 문서 구조의 마킹 보다도) 추가를 강조했습니다. 사람의 이름(<name>) 및 장소(<geo>), 날짜(<date>) 및 직업(<직업>). 이는 자동화된 자연어 처리와 데이터 개발자 그룹이 수동으로 수행했습니다. 마크업은 TEI와 같은 표준 스키마를 사용하지 않았습니다(일부 TEI와 유사한 요소를 통합). [27]
    • 마크업은 자동 및 수동 프로세스의 조합으로 수행되었는데, 자동 마크업은 Old Bailey Proceedings에서 파생된 사전, 이 프로젝트에서 수동으로 태그된 데이터 샘플, 그리고 성명, 직업, 장소 및 날짜를 ​​식별하기 위한 자연어 처리를 조합하여 사용했다. 성별의 경우, 성명 사전을 사용하여 성명에 성별을 추가했다. 상당수의 성명에는 이 방법으로 성별을 할당할 수 없으며, 이 경우 "unknows"라고 표시된다.[28]
    • 그런 다음 데이터 개발자 팀이 수동 검사를 수행하여 허위양성을 제거하고 자동 프로세스에서 누락된 일부 마크업을 추가했다. 이 과정은 시간이 많이 걸리고 이용 가능한 자금이 한정되어 있기 때문에, 이러한 수동 마크업 절차는 모든 문서에 동일한 수준으로 적용되지 않았다. 성명이 올바르게 태그되었는지 확인하는 데 가장 큰 노력을 기울였음.[29]
    • 관련하여 태그 지정 수준은 해당 사이트 참고할 것.
    • 정확한 검색을 위해, 사용자는 관심있는 용어 또는 용어에 대한 일반적인 키워드 검색으로 구조화된 검색을 보완할 것을 권장함. 이는 성명과 같은 수준으로 마크업 되지 않은 장소와 직업에 해당됨.[30]
  5. 검색 엔진 개발
    • 이 과정은 인문연구소 HRI digital에 의해 수행됨.
    • 모든 검색 및 통계 기능은 MySQL을 사용하여 구현됨.
    • 마크업된 텍스트는 처음에 Saxon(The XSLT and XQuery processor)을 사용하여 탭으로 구분된 데이터 파일을 생성하기 위해 처리됨.
    • 그런 다음 이러한 파일을 MySQL로 가져와 다양한 검색 기능을 사용하도록 인덱싱하고 수정했음.
    • 또한 Double Metaphone의 수정된 버전을 사용하여 “Person Search Page”를 통해 사용할 수 있는 유연한 검색 형식을 만듦. Surname 검색의 경우, 각 이름의 첫 글자는 double mataphone 검색처럼 들리는 음성 알고리즘의 작동에서 제외됨. 이 문자 중 하나가 s인 성의 마지막 두 글자도 음성 알고리즘 작동에서 제외됨. Fornames의 경우 일반적인 이름 변형의 조회 테이블이 생성되어 검색어와 비슷한 이름으로도 검색을 확장함.
    • 검색 방법: 키워드 검색, 사람 이름 검색, reference 번호 검색(manuscript 페이지에 기재된 식별자), set search(런던 라이브 사용자가 만든 모든 셋들을 검색 가능)
  6. 웹사이트 디자인
    • HRI에서 웹 사이트의 대화형 기능을 설계하고 구현함. 웹 사이트의 시각적인 부분과 전체적인 느낌은 Mark Hadley(일렉트로닉 뮤직 및 사운드 아티스트/바이올리니스트)가 디자인함.[31]
  7. 데이터 공유
    • 프로젝트에 의해 생성된 XML 파일은 University of Sheffield data repository(ORDA)에서 크리에이티브 커먼즈 저작자 표시 비상업 (CC-BY-NC) 라이센스에 따라 다운로드 할 수 있음.
    • 업로더: 프로젝트 매니저 Sharon Howard
    • 업로드 날짜: 30.03.2017, 00:20
    • The data can be shared openly
    • XML 파일은 약 2007-2009년 사이에 생성 및 처리됨. [32]


Why, 왜


  • London Lives 프로젝트의 주목적은 18세기 기관, 행정 필사본 출처(manuscript sources)를 기반으로 full-text 디지털 리소스를 만드는 것으로, 사람들을 찾고 그들의 생애와 경험을 추적하는 것을 가능케하기 위해 기관 및 관료적(institutional and bureaucratic) 맥락을 넘어 이러한 출처(sources)에 명명된 수천 명의 비 엘리트 인물들을 우선적으로 처리하였다.[33]
  • 비 엘리트의 삶을 연구하는 역사학자들은 이용할 수 있는 풍부한 source를 가지고 있으나, 이러한 소스는 기관에서 생산되고 그러한 맥락에서 분석되는 경향이 있으며, 따라서 사용자보다 제도적 고려 사항을 우선시하는 경향이 있다. LondonLives는 연구자들이 다양한 출처에서 특정인에 대한 모든 관련 문서를 신속하게 찾을 수 있도록 함으로써 연구의 초점을 개인으로 전환하는 것을 가능하게 한다.[34]
  • London Lives 프로젝트를 통해 당대 런던의 평민들이 일상생활에서 다양한 정부 및 자선 단체와 어떻게 상호 작용했는지(정부 서비스 및 자선 단체의 사용자가 야기한 압력이 이러한 기관의 개발 과정을 형성) 처음으로 재구성할 수 있게 되었으며, 개별 런던 시민이 자신의 목적을 달성하기 위해 이들 기관에 어떻게 참여하고 다루었는지 살펴봄으로써 말단에 있던 수혜자들이 기관들의 발전에 어떻게 기여했는지를 보여준다. 더 나아가 현대 대도시에서 사회 관행의 진화에 있어 평민들의 역할을 살펴볼 수 있게 해준다.[35][36]




Case 02: Livingstone Online

Livingstone Online 정리 시 참고한 주 웹 자원[37]


Livingstone Online 웹사이트 가기



Who, 누가[38]


  • Livingstone Online은 2004년부터 2021년까지 문학, 역사학, 도서관학, 컴퓨터 프로그래밍, 영상 과학, 법학, 데이터 관리 및 프로그램 관리 등과 같은 다양한 분야에 종사하는 약 60여 명의 연구진들 및 약 51개의 기관(도서관/대학/박물관/센터)이 협력하여 진행한 프로젝트이다.[39]
  • Livingstone Online은 이 프로젝트를 가능케 한 아카이브, 학자, 과학자, 사서, 큐레이터, 컴퓨터 프로그래머 및 기타 전문가 간의 국제적 협력을 단계별로 문서화하여 제공하고 있다.[40]


When, 언제


  • 본 프로젝트는 3단계(2005-09, 2010-12, 2013-현재)의 개발 단계와 3단계의 Livingstone Spectral Imaging Project(2009-10, 2010-12, 2013-현재)로 작업이 수행되었다.[41] 2010~2011년에 수행되었던 파일럿 프로젝트 Livingstone's Letter from Bambarre - A Multispectral Critical Edition과 이후 수행된 Livingstone's 1871 Field Diary - A Multispectral Critical Edition(2010-13), Livingstone's 1870 Field Diary - A Multispectral Critical Edition(2013-17), LEAP: The Livingstone Online Enrichment and Access Project(2013-17) 등 4개의 프로젝트 결과물을 통합한 프로젝트이다.[42]
  1. Livingstone's Letter from Bambarre - A Multispectral Critical Edition 프로젝트[43]는 David Livingstone이 1871년 2월 5일 그의 친구이자 미래의 편집자(future editor)인 Horace Waller에게 보낸 미발표 편지를 스펙트럼 이미징(spectrum imaging)으로 디지털 이미지로 캡쳐하여 리빙스톤이 작성한 내용을 보다 명확하게 파악하고자 한 프로젝트이다. Livingstone's Letter from Bambarre 프로젝트는 이후 진행된 Livingstone's 1871 Field Diary - A Multispectral Critical Edition[44] 프로젝트의 토대를 마련하였다.
  2. Livingstone's 1871 Field Diary 프로젝트는 David Livingstone의 1871년 현장 일기의 전문을 복원한 프로젝트이다. Livingstone은 자신의 현장 일기에 영국의 탐험가이자 기자인 Henry Morton Stanley(1841~1904)와의 만남을 연대순으로 기록하였으며, 중앙아프리카에서 목격한 끔찍한 노예 무역 학살에 대한 직접적인 인상을 적었다. 리빙스턴은 의류 염료를 섞은 잉크를 사용하여 The Standard 신문의 복사본과 기타 스크랩들 위에 일기를 작성하였는데, 연구팀은 스펙트럼 이미징 프로세스를 통해 육안으로 거의 읽기 힘든 일기의 내용까지 모두 복원하였다. Livingstone's 1871 Field Diary 프로젝트는 2012년 DH어워즈 "Best professional resources for learning about or doing DH work" 부문에서 1위(1st Runner Up)를 차지하였다.
  3. 2013~2017년에 진행된 Livingstone's 1870 Field Diary - A Multispectral Critical Edition[45] 프로젝트 또한 리빙스턴 사후 Horace Waller이 편집 및 출판한 현장 일기를 스펙트럼 이미징 프로세스를 통해 복원한 프로젝트로, 2016년 DH 어워즈“Best DH Data Visualization” 부문에서 1위(1st Runner Up)를 차지하였다.
  4. 2013년~2017년 진행된 LEAP: The Livingstone Online Enrichment and Access[46] 프로젝트는 2005~2012년까지 진행된 Livingstone Online 프로젝트 및 2010~2012년에 진행된 Livingstone Spectral Imaging Project에서 생성된 모든 이미지 및 전사 데이터와 메타데이터를 공동의 표준으로 통합하였으며, 새로운 디지털 자료를 추가하는 등 Livingstone Online을 재정비하는데 큰 기여를 했다. 그 결과 Livingstone Online은 2017년 DH 어워즈 “Best Use of DH For Public Engagement”에 노미네이션 되었다.


What, 무엇을


  • Livingstone Online은 빅토리아 시대의 유명한 탐험가이자 선교사 그리고 노예 폐지론자인 David Livingstone(1813~1873)[47]이 작성한 원고, 이미지 자료, 소장 유물 등을 대상으로 한 고해상도 원고 이미지와 필사본(15,000개의 이미지 및 780개의 필사본)을 제공한다.[48]


How, 어떻게


  • 실제 디지털화된 콘텐츠의 대부분이 1, 2 섹션에 걸쳐 있다.
  1. In His Own Words : 원고 이미지, 필사본, 비평 에세이가 가장 많이 실려있다.[49]
    • Browse by Digital Catalogue Record: 고해상도 이미지와 Livingstone 원본 원고의 자세한 필사본에 대한 직접 액세스(다운로드 액세스 포함)를 제공한다. 1,100개 이상의 원본 원고 페이지의 디지털 이미지와 문서의 물리적 모양과 텍스트의 특징을 자세히 캡처하는 인코딩된 전사가 포함됨. 원고의 필사본은 비교 분석을 용이하게 하기 위해 출판된 책의 텍스트(약 700페이지)와 함께 제공한다.
      • 조건에 따라 원하는 자료를 필터링 가능하며, 기본적으로 이미지,이미지 메타데이터, 전사본, 전사본 메타데이터를 제공한다.
      • 또한, 전체 기록에 대한 이미지 파일, 전사본의 PDF 파일, 전사본의 TEI 파일, MODS(Metadata Object Description Schema, 메타데이터 개체 설명 스키마) XML 문서 다운이 가능하다.
        • TEI 전사 파일의 경우, TEI P5 인코딩 지침에 따라 XML로 모든 전사를 제작. 792개의 TEI 전체 파일 다운이 가능하다. 또한, 코딩 매뉴얼, 전사 템플릿, ODD 및 RNG 스키마를 포함하는 전체 TEI 전사 자료 다운도 가능하다.[50]
        • MODS는 버전3에 따라 만든 3123개의 xml 파일을 제공한다.[51]
    • Browse by Repository: 소장 기관별로 Livingstone 원고 탐색 가능하게 하였다.[52]
    • Browse by Timeline: 리빙스톤 관련 기록물들을 연대순으로 시간축에 배치하였다.[53]
    • Browse by Location: 리빙스톤이 원고를 기록한 장소를 맵핑하였다. 정확한 장소를 확인할 수 있는 곳만 맵핑하여 디지털 카탈로그의 3000개 항목에 약 150개의 위치만 할당하였다고 한다.[54]
    • Browse by Address: 수신인 기준 검색도 제공함.
  2. Spectral Imaging: 이미징 기술을 통해 액세스할 수 있게 된 Livingstone의 작품을 선별하여 호스팅하였다.[55]
  3. Life and Times 섹션: Livingstone Online 팀은 Livingstone이 살고 출판한 다양한 맥락과 그의 유산의 복잡성을 탐구하는 중요한 에세이 제공.[56]
  4. Resources: 추가 교육 및 학습 자료를 제공 하는 리소스 섹션이다.[57]


Why, 왜


  • 영국을 상징하는 대표적 인물 가운데 한 명인 리빙스톤의 기록을 통해 당대의 역사적·문화적 맥락을 복원하고, 그로부터 역사인물로서 리빙스톤의 위상을 ​​재평가하고자 하였다.[58]
  • Livingstone Online은 2004년부터 아프리카 역사, 대영제국, 19세기 다른 문화 간 만남(intercultural encounters) 및 디지털 인문학 연구를 위한 학술 자원을 제공하고자 하였다.[59]
  • Livingstone Online은 시각적으로 풍부한 사이트 설계를 통해 Livingstone의 아이디어와 19세기 글로벌 역사의 주요 측면에 대한 연구와 토론을 장려한다. 이 사이트는 리빙스턴의 유산과 맥락에 대한 중요한 연구를 게재하고 그의 아이디어가 오랜 시간 동안 유포되었던 다양한 방식을 탐구 가능케 한다.[60]




Case 03: Derrida’s Margins

Derrida’s Margins 정리 시 참고한 주 웹 자원[61]


Derrida's Margins 웹사이트 가기



Who, 누가


프린스턴 대학교 French and Italian(프랑스어 및 이탈리아어 학과) 조교수를 중심으로 프린스턴 대학교 및 CDH(Center for Digital Humanities at Princeton) 소속 연구자들로 이루어진 연구팀에서 프로젝트를 진행하였다.[62]


When, 언제


2016년[63]부터 프로젝트가 진행되었으며 현재까지도 업데이트 중이다.[64]


What, 무엇을[65]


  • 알제리 출신 프랑스 철학자 자크 데리다(Jacques Derrida, 1930-2004)의 개인 서재에 있던 약 13,800권의 책과 기타 자료를 대상으로 하였다.
  • 데리다가 소장했던 도서 및 자료는 2015년 프린스턴 대학교 도서관의 파이어스톤 도서관(Firestone Library)에서 인수했고, 현재 프린스턴 도서관 Rare Book Division, Department of Special Collections에서 담당하고 있다.[66]
  • 프린스턴 대학 파이어스톤 도서관(Firestone Library) Rare Book Division(희귀 도서 부서)는 2015년 데리다의 작업실(Studio, 수집 책 출판시기: 1686~2010)과 본채(House, 수집 책 출판시기: 1793~2013년)에 있는 책들을 분류 및 정리하였다. 자크 데리다 사망 후 마거리트 데리다가 추가한 물품도 포함되어 있다.[67]
    • 본채(House): 스튜디오 외부에 있는 본채에 보관한 책 675 박스로, Jacques와 그의 아내 Marguerite가 청하지 않은 선물로 받은 대부분의 책들과 경우에 따라서는 두 아들 Jean과 Pierre의 책, 가족의 여가 독서 및 스튜디오에 보관되어 있는 책들처럼 Derrida의 일상 업무의 핵심으로 여겨지지 않는 책들이 포함된다.[68]
    • 작업실(Studio): 2001년에 지어 2004년까지 사용한 작업실에 있는 책들로, 데리다가 사망한 이후에 추가된 책들도 이 컬렉션에 포함된다. 작업실 선반에 꽂혀있거나, 가구 위에 놓여있던 책들을 구역별로(벽1,2,3,4, 계단 왼쪽 회전 책장, 침대 옆 테이블 등) 나누어 분류함 https://findingaids.princeton.edu/catalog/RBD1-1_c18902


How, 어떻게[69]


  1. Derrida’s Library
    • 『De la grammatologie』에서 참조한 Derrida의 개인 사본을 탐색할 수 있게 함. 책의 간단한 서지 정보, 이미지[70], 『De la grammatologie』에서 참조한 내용 및 참조 유형에 대해 제공한다.
  2. Reference List
    • 데리다가 『De la grammatologie』에서 참고한 문헌을 Reference Type[71]을 분류하며. 참고한 문헌의 몇 페이지 내용을 『De la grammatologie』 몇 페이지에서 어떤 내용으로 인용했는지 제공한다.
  3. Interventions
    • 데리다의 소장 도서 가운데 『De la grammatologie』에서 참조한 도서를 1. 책의 저자 2. 책의 주제 3. 출판된 책의 언어 4. 원본 언어 5. 출판 장소 6. 데리다가 남긴 주석의 언어 7. 데리다가 남긴 주석 유형 8. 주석을 쓴 사람 9. 잉크 10. 출판연도 11. 에디션 연도 12. 인쇄 연도 로 나누어 정리했으며, 특히 7. 주석 유형의 경우, 페이지에 적힌 Derrida의 흔적 하나하나를 데이터로 만들어 유형화했다.
      • 11개의 유형: 1. verbal annotaion, 2. line 3. marginal mark: 책의 여백에 남은 흔적 4. underlining: 밑줄 5. bracket(s): 괄호 6. circling: 동그라미 7. correction: 교정 흔적 8. arrow: 화살표 모양 9. punctuation mark: 마침표나 물음표, 느낌표 등의 구두점 10. flyleaf note: 백지에 남긴 주석 11. nonverbal annotation: 비언어적 주석
    • 실제 데리다의 흔적이 남은 페이지 이미지를 제공하며, 각 흔적마다 어떤 주석 유형에 해당하는지 표시해 놓음.
  4. Visualization,
    • 『De la grammatologie』의 챕터 기준 인용서 시각화: 챕터별로 인용한 책들을 파란색 원으로 시각화하여 각 챕터마다 인용서를 얼마나 많이 참고했는지 직관적으로 파악 가능하다. 각각의 원에 커서를 올리면 인용서의 제목 및 『De la grammatologie』 몇 페이지에서 어떤 내용으로 인용서의 몇 페이지를 참조했는지 정보가 제공된다.
    • 『De la grammatologie』의 인용서 저자 별 시각화: 데리다가 어떤 사상가의 영향을 가장 많이 받았는지 직관적으로 파악 가능하다.
  5. 데이터 공유
    • 주석 데이터, 주석이 삽입된 페이지 데이터, 데리다의 소장 도서 데이터, 참고문헌 데이터 등 네 가지 CSV, JSON 파일 형식의 데이터 셋 다운 가능하다.


Why, 왜


자크 데리다의 서재에 꽂힌 책들에는 그가 책을 읽으며 직접 육필로 써내려간 주석과 밑줄, 인용구, 참고자료 표기 등이 그대로 담겨있다. 이러한 흔적들은 데리다라는 철학자의 고민, 생각 등을 살펴볼 수 있는 소중한 자료이다. 본 연구팀은 데리다가 "해체" 철학의 기초가 될 새로운 스타일의 비판적 읽기를 처음으로 분명하게 했던 데리다의 대표적인 저서인 1967년 『De la grammatologie』(Of Grammatology)의 주석 및 인용서를 데이터로 편찬하여 철학의 발전(the development of this philosophy)을 연구하고자 했다.[72]




Case 04: Novel City Maps

Novel City Maps 정리 시 참고한 주 웹 자원[73]


Novel City Maps 웹사이트 가기



Who, 누가


독일 포츠담 응용과학대학 ‘Urban Complexity Lab’ 소속의 얀 에릭 스탠지(Jan Erik Stange)[74]가 2015년에 수행한 디지털 인문학 연구의 결과물이다. 스탠지는 문학에서의 허구 및 사실 공간의 구성을 디지털 환경에서 시각적으로 표현하는 새로운 방법을 탐구하고자 하였고, 그에 따라 연구를 진행하는 가운데 나온 결과물의 일부가 본 사례이다.[75] 현재 웹상에 데모버전이 공개되어 있으며, 스탠지는 같은 ‘Urban Complexity Lab’ 소속 연구원인 Marian Dörk와 함께 워크숍에서 본 사례에 대한 논문을 발표하기도 하였다.[76]


When, 언제


  • 2015년에 수행한 디지털 인문학 연구


What, 무엇을


  • 독일 소설 가운데 각기 다른 시대의 베를린을 배경으로 한 인기 소설을 선정하였다.[77] 구체적으로 ①Alfred Döblin, 『Berlin Alexanderplatz』(1929) ②Hans Fallada , 『Alone in Berlin』(1947) ③Sven Regener, 『Berlin Blues』(2001)
  • 얀 에릭 스탠지는 사회·경제·정치적인 면에서 급진적으로 발전해 온 도시가 베를린이기에, 공간 분석에 적합한 대상이라 판단하였다고 한다.[78]


How, 어떻게[79]


  • 세 소설에 등장한 베를린 공간(실재+가상의 공간)을 개별 데이터로 만들고, 소설 내 언급 위치와 소설 구절을 함께 정리하였다.
  • Narrative View와 Map View 두 가지 형식의 지도에 소설 공간 데이터를 맵핑하였다.
    1. Narrative View
      • 내러티브 뷰는 전체 소설을 문단 별로 쪼개어 소설 속에 등장한 공간을 중심으로 소설 내 등장 위치 및 빈도를 시각화한 것이다.
      • 내러티브 뷰는 각 소설에서 언급된 모든 장소를 보여주고, 단락에서 함께 언급된 장소 사이의 연결을 보여줌. 소설에서 장소가 언급된 구절은 흰색 원으로 표시된다. 원 위로 마우스를 가져가면 실제 해당 장소가 언급된 소설 속 구절을 읽을 수 있다.
      • x축: 같은 장소에 대한 언급은 연결되어 하나의 가로 라인을 형성함. 원의 가로 위치는 해당 장소가 언급된 구절이 소설에 등장한 위치를 나타낸다.
      • y축: 세로 위에 있을수록 소설에서 언급된 빈도가 높은 장소로, 같은 단락에서 언급된 장소들의 경우 세로선으로 연결된다.
      • 실재 공간과 픽션 공간이 모두 맵핑되었다.
      • 사용자는 물리적으로 떨어져 있는 공간들(맵 뷰 모드에서는)이 내러티브 뷰를 통해 실제 소설 전개에서 어떻게 연계되는지 파악할 수 있다.
    2. Map View
      • 실재 공간만 맵핑되었다.
      • 맵 뷰는 공간 데이터를 실제 베를린 지도 위에 맵핑한 지도로, 소설에서 많이 언급된 지역의 경우 더 밝게 나타나므로 소설이 다루고 있는 공간적 배경을 직관적으로 파악 가능하다.
      • 해당 공간에 마우스를 가져가면 실제 해당 장소가 언급된 소설 속 구절을 읽을 수 있다.
  • 본 연구자가 발견한 문제점
    • 『Alone in Berlin』을 예로 들자면, Nordbahnhof, wilhelmsstraße, Anhalter Bahnhof, Schlachtensee 등과 같이 실재하는 곳은 Map View에 맵핑이 되지 않았으며, Map View에 맵핑된 장소 가운데 Rollerstraße, Christburger straße, Münzstraße, Sperlingsgasse 등은 Narrative View에 맵핑되지 않았다.
    • 데이터의 엄밀성이 떨어지고 연구자가 편찬 데이터를 공개하지 않았기에 사용자가 Narrative View와 Map view를 비교하여 공간 데이터를 하나씩 확인할 필요가 있다.


Why, 왜


  • 본 프로젝트는 작가, 시대, 서사에 따라 소설 속 도시에 대한 인상이 어떻게 달라지는지 살펴보고자 하였으며, 문학 연구자 뿐만 아니라, 일반 독자들도 '공간'을 중심으로 소설을 새로운 관점으로 탐색하고 읽을 수 있게 하고자 하였다.[80]




Case 05: Six Degrees of Francis Bacon

Novel City Maps 정리 시 참고한 주 웹 자원[81]


Six Degrees of Francis Bacon 웹사이트 가기



Who, 누가


Carnegie Mellon University & Georgetown University 소속 연구자


When, 언제


2013년[82]~2015년[83]


How, 어떻게


  • 전 세계 학자들과 학생들은 사이트에 참여하여 협력을 통해 인물/관계/그룹을 추가하고, 수정하며, 비평할 수 있다.[84]
  • 아날로그 출판물과 달리 Six Degrees는 항상 추가·수정될 수 있다는 점에서 확장 가능하며, 많은 학자들의 작업을 종합한다는 점에서 협력 가능하며, 네트워크에 대한 새로운 작업이 이전에 연구된 관계와 즉각적으로 연결된다는 점에서 상호 운용 가능하다.[85]
  • 현재(2022년 4/9일 18시 기준) 15,870명의 인물 개인을 식별하고 약 171,558개의 관계 데이터를 가지고 있다.
  • 데이터 다운로드: 계정 가입 후 "DOWNLOAD" 섹션에서 people, relationships, relationship type, groups, groups assignments 등에 대한 데이터(csv 파일 형식) 다운 가능.
  • 데이터 기여
    • 계정 가입 후 CONTRIBUTE 모드를 활성화해 Node 생성, Link 생성, Group 할당이 가능하며, Link 생성 시 “확실성(certainty)” 수치를 매길 수 있다.
    • 기여 제출물은 SDFB 큐레이터의 검증 후 사이트에 반영되며, 검증 전에는 승인되지 않은 기여(unapproved contribution)로 표시된다.


Why, 왜


Bacon, Shakespeare, Isaac Newton 등과 같은 인물 간의 개인적인 관계를 추적하기 위해 1500-1700년[86] 영국의 초기 현대 소셜 네트워크를 재창조하는 획기적인 디지털 인문학 프로젝트이다.[87]




Case 06: Enslaved


Enslaved 웹사이트 가기



Who, 누가


Enslaved는 Matrix: Center for Digital Humanities & Social Sciences at Michigan State University(MSU), MSU 역사학과, 메릴랜드 대학의 예술 및 인문대학(the College of Arts and Humanities), Andrew W. Mellon 재단 그리고 여러 교육/연구/공공전시 기관의 학자들과의 협업[88]으로 진행되고 있다.[89]


When, 언제


Enslaved는 2011년부터 2017년까지 진행된 〈Slave Biographies: The Atlantic Database Network〉 디지털 인문학 프로젝트[90]를 근간으로 하며, 여러 연구 기관에 소속된 연구자들의 협업으로 2017년부터 현재까지 지속적으로 진행되고 있다.


What, 무엇을


전 세계에 흩어져 있는 15세기 초반부터 19세기 후반에 이르기까지 북미와 남미, 아프리카, 서유럽의 노예 제도에 걸쳐 있던 사람·사건·장소 및 출처에 대한 수천 개의 기록


How, 어떻게


  1. 디지털 학술지 플랫폼 구축
    • dataset 수집 및 검토를 위한 Journal of Slavery and Data Preservation (ISSN 2691-297X)[91] 디지털 학술지 플랫폼을 구축.
    • 개별 프로젝트 dataset 다운 및 데이터 기고자에 대한 Ontology, Metadata, Controlled Vocabularies, Linked Open Data 등을 제공한다.[92]
  2. 사이트 구축
    • EXPLORE
      • 노예무역에 관련된 인물(노예, 노예상 및 여타 참여자)사건·장소·sources를 다양한 조건을 통해 상세 검색이 가능하며, 관련된 인물·사건·장소·sources를 제공한다. 검색 결과를 RDF/XML, Turtle, RDF/JSON 포맷의 데이터로 다운 가능하다.
    • Visualization : 각각의 프로젝트에 대한 간단한 시각화 제공
    • stories
      • 노예 무역 관련 노예, 노예 소유자, 노예 상인 등을 대상으로 한 75개 이상의 개별 전기를 제공한다.
    • Learn
      • Enslaved 데이터베이스를 활용한 교육 샘플 자료 및 튜토리얼 제공한다.[93]
  3. 데이터 공유
    • 현재 Enslaved.org 내에서 사용 가능한 Linked Data 프로젝트 리스트 제공.[94]


Why, 왜


〈Enslaved〉는 전 세계에 흩어져 있는 15세기 초반부터 19세기 후반에 이르기까지 북미와 남미, 아프리카, 서유럽의 노예 제도에 걸쳐 있던 사람·사건·장소 및 출처에 대한 수천 개의 기록을 대상으로 한 Linked Open Data(LOD) 플랫폼 구축 프로젝트로서,[95] 수십만 명에 달하는 노예무역 관련 인물 정보를 포괄적인 데이터로 구축해 단일 노예의 생애를 탐색할 수 있게끔 하는 것이 주된 목적이다.





  1. https://www.londonlives.org/static/Project.jsp#toc15
  2. London Lives Who 챕터 정리 시 참고한 자료는 다음과 같습니다.
  3. https://reviews.history.ac.uk/review/1967
  4. https://figshare.shef.ac.uk/articles/dataset/London_Lives_XML_Data/4797829
  5. https://www.dhi.ac.uk/projects/london-lives/
  6. https://www.sheffield.ac.uk/news/nr/1679-1.174024
  7. https://www.dhi.ac.uk/projects/london-lives/
  8. https://backdoorbroadcasting.net/2010/07/a-one-day-unconference-to-mark-the-completion-of-the-london-lives-website/
  9. https://www.londonlives.org/static/Project.jsp “Advertising Policy”
  10. https://www.londonlives.org/static/WhatsNew.jsp
  11. https://www.dhi.ac.uk/projects/london-lives/
  12. https://www.researchgate.net/publication/250060823_The_Higher_Education_Digitisation_Service_HEDS_Access_in_the_Future_Preserving_the_Past
  13. https://talkinghumanities.blogs.sas.ac.uk/2017/02/09/whats-in-a-name-change/
  14. https://www.dhi.ac.uk/projects/london-lives/
  15. https://www.dhi.ac.uk/about/
  16. https://www.londonlives.org/search.jsp?form=workspace
  17. https://www.londonlives.org/static/Project.jsp “Rationale for the Project and Choice of Sources”
  18. https://www.londonlives.org/static/Project.jsp “Rationale for the Project and Choice of Sources”
  19. https://www.londonlives.org/static/Project.jsp “Rationale for the Project and Choice of Sources”
  20. https://www.londonlives.org/static/Project.jsp “Rationale for the Project and Choice of Sources”
  21. https://www.londonlives.org/static/Background.jsp
  22. https://www.londonlives.org/static/Project.jsp “Rationale for the Project and Choice of Sources”
  23. 구체적인 자료원 참고: https://www.londonlives.org/static/Documents.jsp
  24. 구체적인 데이터셋 참고: https://www.londonlives.org/static/Datasets.jsp
  25. https://www.dhi.ac.uk/projects/london-lives/
  26. https://www.londonlives.org/static/Project.jsp “Markup of Text”
  27. https://figshare.com/articles/dataset/London_Lives_XML_Data/4797829 에서 다운 받은 LL_XML_notes.docx
  28. https://www.londonlives.org/static/Project.jsp “Markup of Text”
  29. https://www.londonlives.org/static/Project.jsp “Markup of Text”
  30. https://www.londonlives.org/static/Project.jsp “Markup of Text”
  31. https://www.londonlives.org/static/Project.jsp#toc11 “Website Design”
  32. 자세한 사항은 London_Lives_XML_Data에서 "LL_XML_notes.docx" 다운 후 살펴볼 수 있음.
  33. https://figshare.com/articles/dataset/London_Lives_XML_Data/4797829 에서 다운 받은 LL_XML_notes.docx
  34. https://www.londonlives.org/static/Project.jsp
  35. https://www.dhi.ac.uk/projects/london-lives/
  36. https://www.londonlives.org/static/Project.jsp
  37. *https://livingstoneonline.org/
    *https://worldhistorycommons.org/livingstone-online
  38. Livingstone Online 참여 직원 및 협력기관에 대한 자세한 정보는 다음의 웹 자원에서 참고할 수 있다.
  39. 협력기관 리스트: https://livingstoneonline.org/behind-the-scenes/collaborating-institutions
  40. https://livingstoneonline.org/about-this-site/livingstone-online-introduction
  41. https://livingstoneonline.org/behind-the-scenes/the-livingstone-online-code
  42. https://livingstoneonline.org/behind-the-scenes/project-teams
  43. https://livingstoneonline.org/spectral-imaging/livingstones-letter-bambarre
  44. https://livingstoneonline.org/spectral-imaging/livingstones-1871-field-diary
  45. https://livingstoneonline.org/spectral-imaging/livingstones-1870-field-diary
  46. https://livingstoneonline.org/about-this-site/leap-2013-2017-project-history-part-i
  47. https://livingstoneonline.org/life-and-times/livingstone-s-life-expeditions
  48. https://livingstoneonline.org/about-this-site/livingstone-online-introduction
  49. https://worldhistorycommons.org/livingstone-online
  50. https://livingstoneonline.org/behind-the-scenes/practices-standards-and-arrangements
  51. https://livingstoneonline.org/behind-the-scenes/practices-standards-and-arrangements
  52. https://livingstoneonline.org/in-his-own-words/repository
  53. https://livingstoneonline.org/in-his-own-words/timeline
  54. https://livingstoneonline.org/in-his-own-words/location
  55. https://worldhistorycommons.org/livingstone-online
  56. https://worldhistorycommons.org/livingstone-online
  57. https://worldhistorycommons.org/livingstone-online
  58. https://livingstoneonline.org/about-this-site/livingstone-online-introduction
  59. https://livingstoneonline.org/about-this-site/livingstone-online-introduction
  60. https://livingstoneonline.org/about-this-site/livingstone-online-introduction
  61. *https://derridas-margins.princeton.edu/
    *https://cdh.princeton.edu/projects/derridas-margins/
    *https://library.princeton.edu/news/2015-03-31/princeton-university-library-acquires-jacques-derridas-personal-library
  62. https://derridas-margins.princeton.edu/credits/
  63. https://zenodo.org/record/3359144#.Yj7SZk3P1hF
  64. https://derridas-margins.princeton.edu/credits/
  65. Derrida’s Margins Who 챕터 정리 시 참고한 주 웹 자원은 다음과 같습니다.
  66. *https://findingaids.princeton.edu/catalog/RBD1-1_c18904
    *https://library.princeton.edu/special-collections/find/all/derrida
  67. https://findingaids.princeton.edu/catalog/RBD1-1#description
  68. https://findingaids.princeton.edu/catalog/RBD1-1_c18904
  69. Derrida’s Margins How 챕터 정리 시 참고한 주 웹 자원: *https://derridas-margins.princeton.edu/
  70. 이미지는 저작권 제한으로 인해 각 책의 외부 이미지(Front cover, Inside front cover, Back cover, Inside back cover, Spine view, Bottom edge view 등)와 De la grammatologie의 참조에 해당하는 주석이 달린 페이지만 제공
  71. 직접 인용 quotation, 간접 인용 citation, 각주, Epigraph 요약/소개 등
  72. *https://cdh.princeton.edu/projects/derridas-margins/
    *https://derridas-margins.princeton.edu/
  73. *https://uclab.fh-potsdam.de/NCM/
    *https://uclab.fh-potsdam.de/projects/novel-city-maps/
  74. https://uclab.fh-potsdam.de/people/jan-erik-stange/
  75. https://uclab.fh-potsdam.de/NCM/ “Background”
  76. Jan-Erik Stange and Marian Dörk, “Visualizing the Spatiality in Fictional Narratives”, VIS4DH: 1st Workshop on Visualization for the Digital Humanities at IEEE VIS, 2016. (논문 URL: https://uclab.fh-potsdam.de/wp/wp-content/uploads/vis4dh2016.pdf)
  77. https://uclab.fh-potsdam.de/wp/wp-content/uploads/vis4dh2016.pdf
  78. https://uclab.fh-potsdam.de/NCM/ “Background”
  79. Novel City Maps How 챕터 정리 시 참고한 주 웹 자원: https://uclab.fh-potsdam.de/NCM/
  80. https://uclab.fh-potsdam.de/projects/novel-city-maps/
  81. http://sixdegreesoffrancisbacon.com/
  82. *https://www.cmu.edu/news/stories/archives/2013/june/june12_francisbacon.html
    *http://dh2013.unl.edu/abstracts/ab-417.html
    *https://news.yahoo.com/six-degrees-francis-bacon-links-early-modern-ideas-193548393.html
  83. 해당 사이트에 따르면 Six Degrees of Francis Bacon은 2015년 10월에 출시된 것으로 추정된다.
  84. http://sixdegreesoffrancisbacon.com/about
  85. http://sixdegreesoffrancisbacon.com/about
  86. https://6dfb.tumblr.com/
  87. https://www.cmu.edu/news/stories/archives/2015/october/francis-bacon-launch.html
  88. https://enslaved.org/about/
  89. 프로젝트 참여 팀원 목록은 “Enslaved.org Team”에서 확인 가능하다.
  90. Slave Biographies 프로젝트는 전 세계에 흩어져 있는 노예 dataset을 하나로 모으기 위한 파트너십 및 인프라, 데이터 모델을 개발하는 작업을 했다. - https://enslaved.org/projectHistory/
  91. 사이트: https://jsdp.enslaved.org/
  92. https://docs.enslaved.org/
  93. https://enslaved.org/forEducators/
  94. https://enslaved.org/data/
  95. https://enslaved.org/projectHistory/