창덕궁 학술자료 인용

DH 교육용 위키
이동: 둘러보기, 검색

과제 개요

주제

  • 「한양도성 타임머신 데이터 아카이브」의 창덕궁 관련 학술자료 연계 구현

기획방향

  • 웹자원 연계 : 연구자는 물론 일반 이용자들도 쉽게 이용할 수 있도록 웹자원 중심 연계
  • 1차대상 : 근거자료가 분명하면서 가장 방대한 양을 수록한 <조선왕조실록>을 대상으로 하며, 기타 학술자료는 샘플로 제시
  • 분류방식 : 창덕궁과 부속건물에 대한 조선왕조실록 기사의 세부 분류로 이용자의 편의성 향상
  • 아이콘 : 궁궐 건축의 경우 <동궐도>의 이미지를 반영

FrameWork

결과 및 개선사항

결과물

  • Node Description : 5785개
Class groupName count
Actor 왕실인물 4
Architecture 궁궐건축-경복궁 1
Architecture 궁궐건축-덕수궁 2
Architecture 궁궐건축-창경궁 2
Architecture 궁궐건축-창덕궁 23
Heritage 국보 2
Heritage 보물 10
Heritage 사적 4
Heritage 세계유산 2
Concept 6
Event 2
Index 원문색인 33
Index 웹자원색인 15
Index 참고문헌색인 39
Record 사진그림 43
Record 1
Text 원문 5616
Bibliography 논문 80
  • Contextual Relations : 5942개
relation count Description
bibliogrphy 39 참고문헌 목록은 ~이다
onlineReference 15 웹자원 목록은 ~이다
textReference 33 문헌상의 근거 텍스트는 ~이다
isReferencedFrom 99 문헌자료 ~를 참고하다
isShownAt 5691 웹 자원 ~에 보인다
mentions 10 ~에 언급되다
isRelatedTo 7 ~와 관계가 있다
creator 1 창작자는 ~이다
depicts 2 ~를 묘사하다
happenedAt 1 장소 ~에서 일어나다
hasPart 33 부분 ~이 있다
isLocatedIn 11 ~에 위치하다

문제점 및 개선사항

조선왕조실록 이용 : 조선왕조실록은 매우 훌륭한 데이터베이스이지만 이번 과제를 위한 이용과정에서 몇가지 보완해야 할 점이 발견되었다. 연구자에게는 학술자료로 인용시 세밀한 검증이 요구된다.
  • 검색자료의 다운로드 : 운영기관의 적극적인 민원대응 필요
    • 최대 검색자료의 양이 5,000건을 넘을 경우, 1번에 최대 5,000건의 자료를 다운로드 받을 수 있다.
    • 그러나 5,001건부터의 자료는 다운로드 되지 않아 프로그램의 수정을 요청하였다. 비교적 간단한 민원사항이지만 약 1주일이 경과한 후에 수정되었다.
    • 학술자료로서 뿐만 아니라 조선왕조실록이 폭넓게 활용되기 위해서는 좀 더 적극적인 대응이 필요할 것 같다.
  • 문맥의 연관성 : 연관검색의 필요성
    • 현재는 단순한 텍스트 구분방식으로 서비스되고 있기에 연관검색이 전혀 이루어지지 않고 있다.
    • 창경궁을 검색하면 창경원은 검색결과에 반영되지 않는다.
    • 따라서 궁궐의 부속 건물에 대한 검색은 모두 해당 건물의 이름으로 직접 검색해야 한다.
    • 규장각 처럼 동일명칭이 있을 경우에도 전혀 구분되지 않는다.
 시맨틱 데이터베이스 구축 : 조선왕조실록은 오랜 기간 구축된 사료로서 막대한 양의 자료를 수록하고 있다. 같은 날이라도 여러 사건이 기록되어 있으며, 사건은 다르지만 발생 장소는 같을 수 있기에 시맨틱 데이터베이스 구축시 몇가지 주의점이 요구된다.
  • ID : 중복 ID의 회피방법 개선
    • 현재 정의된 <고문헌의 ID 규칙>은 날짜를 기준으로 하며 윤달까지 구분할 수 있게 되었다.
    • 하지만 날짜로 구분하는 방식은 다른 기사라도 사건의 발생일이 같으면 ID가 중복된다.
    • 또한 같은 기사 내에서도 궁궐건축이 여러개 등장할 경우 ID가 중복된다.
    • 1차적으로는 ID 중복을 회피하기 위해서는 국사편찬위원회에서 제공하는 <기사 ID>의 중복검사를 해야 한다.
    • 2차적으로는 같은 날짜에 발생한 다른 기사는 ID에 별도의 구분자를 추가해야 한다.
    • 당 과제에서는 ID가 중복될 경우 세자리 수("-000")를 추가하였다. 예시) 성종실록:성종16.12.18-201
    • 다만 성종 16년 12월 18일 <201번째 기사>라는 의미가 아니기에 보다 효과적인 개선이 필요하다.
  • label : 현재 80자로 제한된 크기를 256자로 수정 필요
    • 참고문헌의 정보를 시카고 방식으로 웹에 표현하기 위해서는 글자수 확대 필요
    • 저자가 여러 사람이고 학술지에 발표된 논문의 경우 80자를 넘는 경우가 있음(한동수의 <일제강점기 이후 창덕궁 후원 연구사>는 총 131글자>
  • Index sub Class : <원문색인> 추가 필요
    • 현재는 <참고문헌색인>과 <웹자원색인>의 두가지 구분으로만 되어 있다.
    • 조선왕조실록의 기사를 연결하기 위해서는 추가로 <원문색인> sub class를 필요로 한다.
    • 같은 주제에 대한 기사의 양이 많기에 핵심노드와 바로 연결하면 시각적인 효과의 장점이 사라진다.
  • 학술자료의 시각화 : 대량의 지식자원을 시각화하는 방법 필요
    • 같은 주제라도 단행본의 수량은 논문, 신문기사, 조선왕조실록 등에 비해 적고 네트워크 그래프에서도 목록 화면을 추가하면 비교적 용이하게 원하는 결과를 찾을 수 있다.
    • 그러나 신문기사, 조선왕조실록의 경우 같은 주제에 대한 기사가 많게는 수천 건에 이른다.
    • 네트워크 그래프에서 단일 주제에 대한 연관자원이 수십 건이 넘을 경우 자동으로 목록 페이지를 실행하는 것도 좋을 것 같다.

시맨틱 네트워크