"20180111 회의록"의 두 판 사이의 차이

khw
이동: 둘러보기, 검색
(할일)
22번째 줄: 22번째 줄:
  
 
===할일===
 
===할일===
 +
*'''node_id 기준으로 수정할 것!! (linklist 포함)'''
 +
 
*node_id가 동일하면서 클래스가 다른 경우  -  unique 노드 최종 결정하는 데 필요
 
*node_id가 동일하면서 클래스가 다른 경우  -  unique 노드 최종 결정하는 데 필요
 
<pre>
 
<pre>
35번째 줄: 37번째 줄:
 
</pre>
 
</pre>
 
*다른 개체로 판명되면 괄호로 병기해서 구분할 것.
 
*다른 개체로 판명되면 괄호로 병기해서 구분할 것.
 
*'''node_id 기준으로 linklist 수정할 것!!'''
 
  
 
===추후 노드 확대 전략===
 
===추후 노드 확대 전략===

2018년 1월 11일 (목) 16:14 판

← Previous 전통문화 융복합 자원 시맨틱 데이터 개발 연구
20180109 회의록 20180111 회의록


회의내용

  1. node_url 에 입력된 데이터가 하나의 새로운 정보 노드가 될 수 있음.
    • 민족기록화 "~관련기사" 역시 개별 민족기록화와 관련된 웹자원으로 간주 가능.
    • 특히 youtube 동영상과 같은 멀티미디어 자원도 포함.
  2. node_url 모두 추출해서 별도의 노드化
    • A – Encyves 기사
    • B1 – writing
    • B2 – outlink 된 웹자원 자체가 새로운 노드가 됨.
    • C2 – Encyves 기사 또는 outlink 된 웹자원 / 부분적이거나 유사하거나. --> 새로운 노드를 발생시키면서 관계를 정의할 필요가 있음.
    • C3 - source가 타겟이 됨. 즉 url이 하나의 노드가 되어 새로운 링크 발생.
  3. 총 node의 건수는 node_id를 기준으로
    • id는 다른데 label이 같은 것들 = name 1 / name 2 / alias 등으로 표시 가능

할일

  • node_id 기준으로 수정할 것!! (linklist 포함)
  • node_id가 동일하면서 클래스가 다른 경우 - unique 노드 최종 결정하는 데 필요
create view nodeclass as
select node_id, class, count(*) as num
from nodelist
group by node_id, class
  • node_id가 동일하지만, 실제적으로 다른 개체일 수 있는 사례를 찾아낼 것.
select node_id, count(*) as cls from nodeclass group by node_id
order by cls desc
  • 다른 개체로 판명되면 괄호로 병기해서 구분할 것.

추후 노드 확대 전략

  1. IRI - 웹 상의 자원뿐만 아니라, RDF의 주어와 목적어가 될 수 있는 모든 노드, 심지어 실재하지 않는 추상적인 개념까지 포함해서 표현할 수 있음.
  2. Conceptual Node: 지식을 서술하는 용어로서의 노드 VS Web Resource: 웹 자원
  3. 웹 자원 전체가 하나의 class를 이룸.
    • Encyves 기사(A)는 웹 자원 클래스의 subclass
    • outlink 중 민백 기사
    • 기타 여러 웹자원 + 한국문화정보원에서 PCN에 제공한 12만건의 데이터
    • Encyves 기사에 기록된 참고문헌 (웹 자원과는 다른 개념의 문헌자료)

추후 논의할 사항