"시맨틱 스토리 데이터"의 두 판 사이의 차이
DH 교육용 위키
(→① 스토리 주제 선정) |
|||
48번째 줄: | 48번째 줄: | ||
===① 스토리 주제 선정=== | ===① 스토리 주제 선정=== | ||
* 표현하고자 하는 이야기의 주제를 선정. | * 표현하고자 하는 이야기의 주제를 선정. | ||
− | * | + | * 복잡하고 긴 이야기를 구상하는 경우, 각각의 작은 주제가 있는 여러개의 에피소드를 먼저 만들고, 에피소드의 전개 순서를 정함으로써 긴 스토리가 엮어지게 한다. |
===② 에피소드 데이터 큐레이션=== | ===② 에피소드 데이터 큐레이션=== |
2024년 4월 25일 (목) 19:37 판
김현 한국학중앙연구원 인문정보학 교수 |
목차
시맨틱 스토리 데이터의 개념
- ‘시맨틱 스토리 데이터(Semantic Story Data, 줄임말: 스토리 데이터)’의 개념은 스토리텔링의 맥락, 특히 컴퓨터의 도움을 받는 스토리텔링 환경에서 사용되는 특수한 형태의 시맨틱 데이터를 의미한다. 이것은 사실적 데이터와 주관적 서사 요소가 혼합된 형태로, 사실적·객관적 데이터를 주제와 극적 요소가 있는 이야기 서사로 발전시키는 중간재 역할을 한다. 특히 인공지능과 협업을 통해 실제 사실을 바탕으로 하면서도 독자가 공감하고 매력적으로 느낄 수 있는 이야기를 창조할 수 있는 기재이다.
시맨틱 스토리 데이터의 성격
① 사실 데이터에 근거한 이야기
- ‘시맨틱 스토리 데이터’는 본질적으로 사실을 반영한 시맨틱 데이터(시맨틱 사실 데이터, Semantic Factual Data)에서 유래한다.
※ 시맨틱 사실 데이터(Semantic Factual Data): 연구와 조사를 통해 얻은 사실 정보를 기계가 처리할 수 있는 형식으로 정리하는 구조화된 데이터. 이 사실 데이터는 인물, 사건, 장소, 사물 등 구체적이고 객관적인 내용을 포함한다.
② 주관적 요소 선택
- 그러나 '시맨틱 스토리 데이터'가 순수한 사실 데이터와 다른 점은 ‘사실 데이터에서 특정 요소를 주관적으로 선택한 결과물’이라는 점이다. 이는 사실을 설명하는 모든 데이터 중에서 특정 요소가 특히 매력적이거나 내가 이야기하고 싶은 내러티브와 관련이 있기 때문에 선택된다는 것을 의미한다.
③ 유연성과 확장성
- 스토리 데이터는 미리 만들어진 시맨틱 데이터 가운데 특정 요소를 선택한다는 것 이외에 어떠한 어떤 형식적 제약도 부가하지 않는다. 그렇기 때문에 데이터의 가감이 용이하고 스토리의 확장과 변경이 자유롭다
시맨틱 스토리 데이터의 활용
① 극적 내러티브 전개
- 주관적 선택에 의해 구성된 '시맨틱 스토리 데이터'는 내가 이야기하려 하는 내러티브의 주제와 뼈대를 구성하는 역할을 한다. 이는 내러티브를 발전시킬 중심 사건과 중심 인물을 결정하는 것이며, 그것을 이야기로 전개시키는 데 필요한 주변 요소를 선택하는 것이다. 이러한 요소의 선택은 주관적인 관심과 흥미를 반영하기 때문에 선택된 요소의 연결은 극적이거나 주제적이거나 감성적인 이야기로 전개될 수 있다.
② 복합적이고 다면적인 스토리 생성
- 시맨틱 스토리 데이터를 구성할 때 배경 설정, 부가적 사건, 부캐릭터 등 어떤 부가적 데이터를 통합하느냐에 따라 이야기 서사는 여러가지 방향으로 확장될 수 있다. 이를 통해 다양한 주제나 수용자에게 적응할 수 있는 복합적이고 다면적인 스토리를 생성할 수 있다.
③ 인공지능(AI)과 협업하는 스토리텔링
- 시맨틱 스토리 데이터는 LLM(Largre Language Model, 거대 언어 모델) 타입 인공지능과의 협업을 통해 다양한 형태의 이야기 서사(내러티브, Narrative)로 변환될 수 있다.
※ 시맨틱 스토리 데이터는 인간이 선택한 이야기 요소와 함께 그 요소들 사이의 사실적 관계에 대한 정보를 포함하고 있기 때문에 자동적으로 이야기 서사로의 전환이 가능하다. 또한 선택된 요소의 조합에서 의도되는 주제와 극적 성격을 인공지능이 발견하고 표현하게 함으로써 이야기로서의 매력을 갖는 서사를 생성할 수 있다.
시맨틱 스토리 데이터 + 인공지능의 디지털 스토리텔링 프로세스=
① 스토리 주제 선정
- 표현하고자 하는 이야기의 주제를 선정.
- 복잡하고 긴 이야기를 구상하는 경우, 각각의 작은 주제가 있는 여러개의 에피소드를 먼저 만들고, 에피소드의 전개 순서를 정함으로써 긴 스토리가 엮어지게 한다.
② 에피소드 데이터 큐레이션
- 각각의 에피소드가 이야기로 엮어지기 위해서 필요한 문맥 요소(Contextual Element)를 발굴하여 에피소드 데이터 세트 구성.
- 문맥 요소는 기구축된 시맨틱 데이터 중에서 선택하되, 시맨틱 데이터가 아직 만들어지지 않았을 때에는 시맨틱 데이터 제작을 병행.
③ 에피소드 내러티브 검증
- 에피소드 데이터 세트가 구성되면, 이 데이터를 LLM(Large Language Model) 타입의 인공지능에게 제공하여 자연어 내러티브를 생성하게 하고,
- 그 결과에 대해 품질을 평가하여 큐레이터가 의도한 내러티브가 생성될 수 있도록 에피소드 데이터 세터의 구성을 변경하거나 새로운 문맥 데이터 추가.
- 목표 수준의 우수한 인공지능 내러티브가 산출될 때까지 이 과정을 반복적으로 수행.
④ 모범 내러티브 텍스트 작성
- 인공지능과 큐레이터의 협업에 의해 최종적으로 정리된 에피소드 데이터 세트를 기준으로 정확하고 사실적인 서사문을 큐레이터가 직접 작성하여 제시함으로써, 이용자들이 이를 해당 데이터에 대한 모범적 서사로 참조할 수 있게 한다.