"20180125 회의록"의 두 판 사이의 차이

khw
이동: 둘러보기, 검색
(추후 고려할 사항)
 
(같은 사용자의 중간 판 하나는 보이지 않습니다)
4번째 줄: 4번째 줄:
 
|이전=[[20180123 회의록]]
 
|이전=[[20180123 회의록]]
 
|현재=[[20180125 회의록]]
 
|현재=[[20180125 회의록]]
|다음=
+
|다음=[[20180131 회의록]]
 
}}
 
}}
  
14번째 줄: 14번째 줄:
 
#웹자원을 별도 노드로 독립시켜서 관계 부여
 
#웹자원을 별도 노드로 독립시켜서 관계 부여
 
#노드에 경도/위도 속성 추가
 
#노드에 경도/위도 속성 추가
#'''Gephi를 활용해서 우리 현재의 데이터를 이해하기!!''' - <font color="crimson">PCN 미팅시 프리젠테이션</font>
+
#'''Gephi를 활용해서 우리 현재의 데이터를 이해하기!!''' - <span style="background:#FFFF00">PCN 미팅시 프리젠테이션</span>
 
#*클러스터 - 서로에 대해 relation을 갖고 있는 집합
 
#*클러스터 - 서로에 대해 relation을 갖고 있는 집합
 
#*전체 데이터가 몇개의 클러스터를 형성했는지
 
#*전체 데이터가 몇개의 클러스터를 형성했는지
22번째 줄: 22번째 줄:
 
#*노드 수 별로 클러스터 분포가 어떠한지
 
#*노드 수 별로 클러스터 분포가 어떠한지
 
#*GPS 데이터 가지는 노드를 지도 위에서 표현하기
 
#*GPS 데이터 가지는 노드를 지도 위에서 표현하기
#Virtuoso Conductor에 기존 데이터 삭제하고 정제된 새로운 데이터 업로드 - 1/31 미팅 이후에 작업
+
#Virtuoso Conductor에 기존 데이터 삭제하고 정제된 새로운 데이터 업로드 - <span style="background:#FFFF00">1/31 미팅 이후에 작업</span>
  
 
===온톨로지 정의===
 
===온톨로지 정의===

2018년 2월 5일 (월) 14:03 기준 최신판

← Previous 회의록 Next →
20180123 회의록 20180125 회의록 20180131 회의록


회의내용

  • 1/31 (수) 오후 1시 - 데이터 검토
  • 1/31 (수) 오후 4시 - PCN 미팅

TO DO

  1. 웹자원을 별도 노드로 독립시켜서 관계 부여
  2. 노드에 경도/위도 속성 추가
  3. Gephi를 활용해서 우리 현재의 데이터를 이해하기!! - PCN 미팅시 프리젠테이션
    • 클러스터 - 서로에 대해 relation을 갖고 있는 집합
    • 전체 데이터가 몇개의 클러스터를 형성했는지
    • 최대 클러스터는 무엇인지
    • 최대 클러스터의 중심노드는 무엇인지
    • 가장 큰 클러스터 속에는 몇개의 노드가 있는지
    • 노드 수 별로 클러스터 분포가 어떠한지
    • GPS 데이터 가지는 노드를 지도 위에서 표현하기
  4. Virtuoso Conductor에 기존 데이터 삭제하고 정제된 새로운 데이터 업로드 - 1/31 미팅 이후에 작업

온톨로지 정의

  1. http://dh.aks.ac.kr/ontologies/ekc#term
    • class, datatype property, object property
  2. http://dh.aks.ac.kr/iri/ekc#term
    • individual의 id
  3. 속성으로 기술되었던 url 데이터를 별도의 노드로 취급하고, 다른 노드와 관계를 설정하기로 함.
    • class: Web Resource / Encyves 기사냐 민백 기사냐 등의 세부 정보는 속성 데이터로 기록할 것.
    • relation
      • 현재 거의 모든 데이터는 edm:isShownAt
      • edm:isMentionedIn - 예: "최해산"에 대한 기사는 없고, "최무선" 기사로 연결되어 해당 기사 내에서 최해산이 언급된 경우.
      • edm:isShownBy - e-book 등의 멀티미디어 콘텐츠

앞으로의 데이터 활용

  1. Triplestore - Virtuoso
    • 데이터의 reuse와 공유
  2. Graph Database - Neo4j
    • 실제 데이터 확인, 관계 추적
  3. Gephi
    • 검색을 통한 전체 데이터 browsing/분석

추후 고려할 사항

  1. GPS 데이터 처리 방안 결정 필요!!
    • "~의 위치"와 같은 별도 노드 발생시키지 않음.
    • KML url을 id로 삼고 dcterms:spatial로 연결????
  2. 서원 데이터 작업 방안(범위 및 내용) 계획 수립한 후 추진할 것.
  3. 민백 최신 데이터 확보할 것.