"20180221 회의록"의 두 판 사이의 차이

khw
이동: 둘러보기, 검색
(문화정보원 전통문화데이터 정제)
(문화정보원 전통문화데이터 정제)
1번째 줄: 1번째 줄:
 
==Virtuso==
 
==Virtuso==
 
*개인 PC에 로컬 설치 및 msSQL와 연동 방안 : commercial release 확보 후 테스트 가능
 
*개인 PC에 로컬 설치 및 msSQL와 연동 방안 : commercial release 확보 후 테스트 가능
 +
==기존 수집 데이터 정제 및 활용==
 +
#'''서원''' : 주향배향인물 정리
 +
#'''사찰'''
 +
#'''묘제'''
 +
 
==문화정보원 전통문화데이터 정제==
 
==문화정보원 전통문화데이터 정제==
 
#전체 데이터 정제 후 RDB 탑재.
 
#전체 데이터 정제 후 RDB 탑재.

2018년 2월 21일 (수) 17:52 판

Virtuso

  • 개인 PC에 로컬 설치 및 msSQL와 연동 방안 : commercial release 확보 후 테스트 가능

기존 수집 데이터 정제 및 활용

  1. 서원 : 주향배향인물 정리
  2. 사찰
  3. 묘제

문화정보원 전통문화데이터 정제

  1. 전체 데이터 정제 후 RDB 탑재.
    • 찾기 : (\r|\n)([^0-9])
      바꾸기 : \2
    • 백과사전의 항목이 되기 힘든 것들은 제외 : ex) 우리말사전(opendic.korea...?) / e영상역사관(ehistory.go.kr) 등
  2. 전체 데이터 약 500만건 중 의미 있을 정보 4000건 우선 확보.
  3. 1인 1주제씩 기관/ heading / 라벨 / url / discription 추출(정리)
    • 고전번역원 해제정보