20180221 회의록

khw
103 (토론 | 기여) 사용자의 2018년 2월 25일 (일) 12:45 판 (김사현)

이동: 둘러보기, 검색
← Previous 회의록
20180219 회의록 20180221 회의록


업무 분배

서소리

  1. Virtuoso 라이센스 구매 대상 알아보기
  2. 서원/향교 데이터 정리
    • 서원 목록, 향교 목록, 인물 목록 ...... 각각 대략적인 수치/현황 필요할듯.

김사현

  1. 한국문화정보원 전통문화 데이터 정제 및 RDB 적재
    • "1인 1주제" 선정해보라고 하셨으니, 데이터 적재할 일정 알려주기.
  2. 교수님과 연락 담당 - 차주 회의 날짜 확정하기 (차주 목요일이 삼일절이라 휴일임.)
    • 2월 28일 수요일 오후 3시 103호 미팅.
    • 회의전에 미리 조사한 자료 교수님께 전달하기.

이혜영

  1. Virtuoso 라이센스 구매 (소리 서포트)
  2. 한국의 묘제 데이터 정리
    • 전체 묘소 건수, 인물 목록 ....
    • 능/원/묘 중 누락된 것이 있거나, 개별 묘소 또는 인물과 관련된 문화재 등 확장 가능성 있는지 검토 필요

김현규

  1. 서원/향교 데이터 정리 (소리 서포트)

강혜원

  1. 한국의 전통사찰 데이터 정리
  2. 웹자원 relation 데이터 정리
  3. gephi 분석 중 발견된 degree=0 노드들 중 실제로 링크 데이터 있는 것 -> LST 파일 대상으로 추적해서 추가


서원 데이터 정리

  • 서원 전체 건수: 652건
  • 구글드라이브>Encyves Data>Data_서원향교>서원_통합.xlsx ... 'link_검토' 시트에서 작업
  • 'link_검토' 시트에서, 관계(link) 컬럼에 주향 or 배향 정보 입력하기
  • 서원연합회
  • 참고를 위해, 민백 인물 표제어 기준으로 매칭한 정보를 추가해놓았음(컬럼: 민백매칭, 생년, 몰년)
  • 담당은 '담당표' 시트에서 확인

Virtuoso

  • 각자 개인 PC에 로컬 설치 및 msSQL와 연동 방안 : commercial release 확보 후 테스트 가능

기존 수집 데이터 정제 및 활용

  1. 서원 : 주향배향인물 정리
  2. 사찰
  3. 묘제

문화정보원 전통문화데이터 정제

  1. 전체 데이터 정제 후 RDB 탑재.
    • 찾기 : (\r|\n)([^0-9])
      바꾸기 : \2
    • 백과사전의 항목이 되기 힘든 것들은 제외 : ex) 우리말사전(opendic.korea...?) / e영상역사관(ehistory.go.kr) 등
  2. 전체 데이터 약 500만건 중 의미 있을 정보 4000건 우선 확보.
  3. 1인 1주제씩 기관/ heading / 라벨 / url / discription 추출(정리)
    • 고전번역원 해제정보