"20180125 회의록"의 두 판 사이의 차이
khw
(→다음주까지) |
(→회의내용) |
||
| 8번째 줄: | 8번째 줄: | ||
=='''회의내용'''== | =='''회의내용'''== | ||
| + | *1/31 (수) 오후 1시 - 데이터 검토 | ||
| + | *1/31 (수) 오후 4시 - PCN 미팅 | ||
===TO DO=== | ===TO DO=== | ||
#웹자원을 별도 노드로 독립시켜서 관계 부여 | #웹자원을 별도 노드로 독립시켜서 관계 부여 | ||
#노드에 경도/위도 속성 추가 | #노드에 경도/위도 속성 추가 | ||
| − | |||
#'''Gephi를 활용해서 우리 현재의 데이터를 이해하기!!''' - <font color="crimson">PCN 미팅시 프리젠테이션</font> | #'''Gephi를 활용해서 우리 현재의 데이터를 이해하기!!''' - <font color="crimson">PCN 미팅시 프리젠테이션</font> | ||
#*클러스터 - 서로에 대해 relation을 갖고 있는 집합 | #*클러스터 - 서로에 대해 relation을 갖고 있는 집합 | ||
2018년 1월 25일 (목) 16:45 판
| ← Previous | 회의록 | |
| 20180123 회의록 | 20180125 회의록 | |
회의내용
- 1/31 (수) 오후 1시 - 데이터 검토
- 1/31 (수) 오후 4시 - PCN 미팅
TO DO
- 웹자원을 별도 노드로 독립시켜서 관계 부여
- 노드에 경도/위도 속성 추가
- Gephi를 활용해서 우리 현재의 데이터를 이해하기!! - PCN 미팅시 프리젠테이션
- 클러스터 - 서로에 대해 relation을 갖고 있는 집합
- 전체 데이터가 몇개의 클러스터를 형성했는지
- 최대 클러스터는 무엇인지
- 최대 클러스터의 중심노드는 무엇인지
- 가장 큰 클러스터 속에는 몇개의 노드가 있는지
- 노드 수 별로 클러스터 분포가 어떠한지
- GPS 데이터 가지는 노드를 지도 위에서 표현하기
- Virtuoso Conductor에 기존 데이터 삭제하고 정제된 새로운 데이터 업로드 - 1/31 미팅 이후에 작업
온톨로지 정의
- http://dh.aks.ac.kr/ontologies/ekc#term
- class, datatype property, object property
- http://dh.aks.ac.kr/iri/ekc#term
- individual의 id
- 속성으로 기술되었던 url 데이터를 별도의 노드로 취급하고, 다른 노드와 관계를 설정하기로 함.
- class: Web Resource / Encyves 기사냐 민백 기사냐 등의 세부 정보는 속성 데이터로 기록할 것.
- relation
- 현재 거의 모든 데이터는 edm:isShownAt
- edm:isMentionedIn - 예: "최해산"에 대한 기사는 없고, "최무선" 기사로 연결되어 해당 기사 내에서 최해산이 언급된 경우.
- edm:isShownBy - e-book 등의 멀티미디어 콘텐츠
앞으로의 데이터 활용
- Triplestore - Virtuoso
- 데이터의 reuse와 공유
- Graph Database - Neo4j
- 실제 데이터 확인, 관계 추적
- Gephi
- 검색을 통한 전체 데이터 browsing/분석
추후 고려할 사항
- GPS 데이터 처리 방안 결정 필요!!
- "~의 위치"와 같은 별도 노드 발생시키지 않음.
- KML url을 id로 삼고 dcterms:spatial로 연결????