Digital Curation in the Digital Humanities-1. Defining digital curation in the digital humanities context

hiblue
Lyndsey (토론 | 기여) 사용자의 2018년 7월 8일 (일) 13:24 판 (Digital humanities data curation)

이동: 둘러보기, 검색

Introduction

'디지털 큐세이션은 살아남은.현재.미래의 디지털 기술을 통해 연구를 가능하게 하는 born-digital와 디지털화 된 유산자료.데이터.발행물의 수집품들을 보존과 촉진, 장기적 접근 지원하는 일과 관련이 있다.' ("Digital curation involves the preservation, promotion, and providing long-term access to born-digital and digitzed collections of heritage material, data, and publications supporting research with surviving (albeit considered obsolete), current, and emerging digital technologies.")

디지털 아키비스트(digital archivist)는 보존에 집중하며 디지털 인문학자(digital humanist)는 새로운 해석, 이론적 맥락, 지식을 만드는 것에 집중한다. 그리고 사회적 큐레이션도 있으며 이 것이 지역 사회(즉 시민, 국민)의 협력과 피드백을 통해 수집품에 의미 부여를 하고 공개 담론을 풍요롭게 한다.

디지털 인문학은 인문학과 기술 사이에 이루어지는 뿐만 아니고 기록학, 도서관.정보학, 컴퓨터공학 등까지 포함한다 (Flanders and Munoz). 디지털 인문학의 역할은 1) 학자와 아키비스트, 사서, 기술자와의 협력을 도와주는 학제간 체제을 마련하는 것, 2) 디지털 인문학에 필요한 자료를 장기적으로 보존관 접근할 수 있게 하는 디지털 큐레이션의 중요성을 촉진 하는 것이다.

언급된 선행 연구

Foundational definitions for curation

'Curation'이란 어떻게 정의되어 왔었을까?

  • Oxford English Dictionary
    • 후견(guardianship)
    • 박물관 또는 미술관, 도서관의 주임(officer in charge of a museum, gallery of art, library)
    • 지키는 사람, 관리자(a keeper, custodian)
  • Museum Curation Community
    • 역사적 가치가 있는 유물의 관리
    • Archivist가 Curator와 달리 주로 고문헌을 관리한다
  • Lord & Macdonald
    • Curation: 데이터의 발견 및 재사용을 위해 데이터를 생산부터 그리고 현재의 목적에 맞게 관리하고 사용 촉진하는 것
    • Archiving: Curation에 일부이며 데이터의 올바른 선택.보관.접속 그리고 그의 안정관 진정성을 비롯한 논리적.물리적 완전성을 오래동안 유지되도록 하는 것
    • Preservation: Archiving의 일부이며 기술이 바꾸더라도 데이터를 접속하여 이해할 수 있도록 관리하는 것
  • Glossary of Archival and Records Terminology
    • 수집품 및 전시를 감독하는 자
    • 박물관의 주임
    • 고문헌들을 평가, 수집, 정리, 묘사, 보존, 접속을 하게 하는 자


언급된 선행 연구

Digital curation

'Curation'은 14세기부터 사용된 단어이며 처음에 '힐링'의 맥락, 나중에 '개인사정 후견'의 맥락에서 사용되었다. 1960, 1970년대부터는 견본(specimen)의 체계적 관리를 말하였다. 최근 몇 10년동안 'curation'이란 말은 박물과 주임, 자료를 재사용 목적을 위해 지속적 접근에 대한 관심 가지는 사람 등으로부터 현재 접속과 재사용을 위해 데이터 보존하는 것과 시.국민들과의 협력적 curation방법까지 말한다. 'Digital curation'은 기관간(cross-institutional), 학문간(cross-disciplinary) 개념으로 2001년부터 소개되었다.

'Digital curation'은...

  • Tibbo : 디지털 기술을 활용하는 curation 활동
  • Beagrie : 디지털 연구 데이터와 다른 디지털 자료들을 그들의 생활 주기 또는 오래동안 현재 및 미래의 사용자들을 위해 유지하기 위한 노력
  • Yakel : Digital curation은 digital preservation, data curation, electronic records management, digital asset management 포함한 'umbrella'개념이다
  • Lee & Tibbo : 진정성이 있는 디지털 데이터 및 다른 디지털 자원들의 재현 및 재사용을 위한 책임 의식
    • 신뢰할 수 있고 내구성이 있는 디지털저장소 개발
    • 견실한 메타데이터 생산 원칙
    • 파일유형 및 데이더 엔코딩 할 때 공개 표준(open standards)을 사용
    • 정보 관리 능력 촉진
  • Digital Curation Centre
    • 장기 연구 가치를 유지하여 디지털 진부화의 위험을 완화시키기 위해 연구 데이터를 적극적으로 관리하는 것
    • 추후 연구로 인한 장기적 가치를 향상시키기 위해 연구 데이터를 생산할 때 이중적 노력을 줄이기

신뢰할 수 있는 디지털저장소? Trusted repositories?

  1. 보존 원칙, 내용물 묘사 표준(즉 메타데이터), 올바른 물리적 인프라가 필요
  2. 규칙관 표준을 따를 수 있는 소프트웨어와 하드웨어 체계 사용
  • Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH)

언급된 선행 연구

Digital preservation

'Digital preservation'은 디지털 자료들을 필요할 동안 지속적인 접근을 보장하기 위해 해야 할 활동들이다. 몇년 사이에 디지털 정보를 잃을 수 있으니 데이터 생산부터 관리를 적극적으로 해야 된다. 미래에 데이터를 찾고 읽을 수 있도록 표준 및 체계를 활용해야 한다. Moore에 의 하면 'digital preservation'은 '미래와의 소통이다.' 이를 위해 'temporal interoperability'가 중요하며 이 것이 소위 말한 과거 또는 현재의 체계들은 새로운 유형과 데이터 모델, 언어, 소통 규약, 하드웨어를 사용할 미래의 체계와 상호 운용의 가능성을 말한다. 이 상호 운용은 기술적인 것이 뿐만 아니고 구상주의적, 사회적 상호 운용도 포함한다. 이 가능성을 보장하기 위해 open standards, open source이 중요한 역할을 할 것이다.

언급된 선행 연구

Lifecycle of digital contents

  1. conceptualize(계획)
  2. create(생산, 메다테이터 포함)
  3. access and use(접근과 사용)
  4. appraise and select(평가와 선택)
  5. dispose(없앰, 없애는 방법 기록)
  6. ingest(신뢰할만한 저장소로 옮김)
  7. preservation action(보존)
  8. reappraise(다시 평가)
  9. store(안전하게 저장)
  10. access and reuse(점속 및 재사용)
  11. transform(변화시킴 - 새 디지털 개체로)

언급된 선행 연구

Levels of curation

2-level

  1. High-level
    1. 주석과 주해하는 일
  2. Low-level
    1. 물리적 매체를 보존

3-level

  1. Scholarly processing
    1. annotations, meaning addition, scholarship, teaching
  2. Administrative / intellectual control
    1. metadata curation, provenance, preservation actions, copyright, administration
  3. IT / digital file management
    1. migration, backup, upgrades, checksum reporting

E-Science 발행의 맥락에서

  1. Level 1 : 원 데이터(raw data) --> 이차적 결과물(secondary results, 즉 책, 학회지) --> 아카이브, 도서관, 인터넷, 정부로 접속
  2. Level 2 : 원 데이터와 이차적 데이터 아카이빙과 보존 (메타데이터, 하이퍼링크, 주석이 중요)
  3. Level 3 : 이 데이터와 아카이브들을 지속적으로 접속할 수 있도록 하는 일

디지털 인문학의 맥락에서

  • social curation, SNS, 국.시민의 의견 및 협력을 통해 맥락화, 재맥락화 (recontextualization)
  • mashups, 데이터 시각화까지
  • 발행 과정의 변화

Lee (2012) - 8 levels for digital curation

  • 문맥정보가 너무 적거나 너무 많으면 안 된다. 균형 잘 잡아야 된다.

각각의 representation level로 나누면 digital curation을 훨씬 체계적으로 접근할 수 있다.

언급된 선행 연구

Digital humanities data curation

  • 디지털 인문학 데이터 큐레이션은 구체적인 인문학적, 역사학적 질문을 중심으로 이루어진다. 따라서 이 데이터가 분리된 경우가 많다.
  • 특정한 연구 목적에 따라 데이터를 생산하기 때문에 데이터 큐레이션 할 때 그 데이터만 수집하고 보존하는 것 뿐만 아니고 그 데이터의 생산 방법에 대한 정보까지 기록해야 한다.

데이터 큐레이션은 다음 행위를 포함한다

  • description
  • annotation
  • collection/aggregation
  • storage
  • migration

The 5 models of content curation (Bhargava)

  • Aggregation(제일 relevant한 정보 큐레이션)
  • Distillation(더 단순한 유형으로 정보 큐레이션)
  • Elevation(범위 넓은 유행이나 통찰을 확인하기 위한 큐레이션)
  • Mashup(새로운 관점을 만들기 위해 특별한 융합)
  • Chronology(시간적으로 역사적 정보를 정리하는 것)

Owens에 의하면 데이터를 '만들어진 것' 즉 유물로서, 관객을 위해 만든 텍스트로서, 그리고 컴퓨터가 처리할 수 있는 정보로서 인식이 가능하다. 데이터가 증거가 될 수 있다.

연구 수집품 유형 (Flanders and Munoz)

  • scholarly editions
  • text corpora
  • marked-up digital texts
  • thematic research collections
  • research data
  • archival finding aids

데이터 관리(Flanders and Munoz)

  1. interpretive layering(마크업을 등을 통해 해설하기)
  2. data capture and preparation(기술적 요소, 데이터 기록, 스키마, 데이터 질 관리 등)
  3. capturing scholarly agency(학술적 논의, editorial voice)
  • XML, SGML, Text Encoding Initiative (TEI), Encoded Archival Description (EAD), Encoded Archival Context - Corporate bodies, Persons and Families (EAC-CPF), Describing Archives: A Content Standard (DACS), ArchiveGrid


언급된 선행 연구

Using linked open data in digital curation

관련한 데이터를 발견하고 데이터 사이의 관계를 찾기 위해 도서관들이 여러 출처의 자원을 같이 보여주기 시작하였다.

  • Viewshare, Google Maps, Archive Grid, Registry of Open Access Repositories, Directory of Open Access Repositories

Linked open data --> 데에터와 데이터베이스 찾기에 도움이 된다. 그리고 여러 data set, collection, text coropora 간에 연구하려면 이러나 linked open data 가 필수적이다. 다른 장점은 역사적 데이터(지명, 사건, 주제) 찾기, 이중적이나 변화해온 인명.지명을 찾기, 더 넓거나 좁은 범위의 관련어 검색등에 도움이 된다.

  • 예시 : Europeana, Digital Public Library of America, BIBFRAME


언급된 선행 연구

Conclusion

토론 질문

  • 우리가 하는 연구에서는 data curation 단계들을 어떻게 구별해 왔는가? 어떤 단계가 제일 미흡했나?
  • 우리는 digital curation 어떻게 정의할 것인가?
  • 규칙 또는 방법에 대한 기록은 강조가 됐는데 우리가 이면에서 어떠한 규칙들은 언제 수행했나? 우리의 방법 기록을 누가, 어떻게, 어디서 정리하고 있는가?