<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ko">
		<id>http://dh.aks.ac.kr/~khw/wiki/index.php?action=history&amp;feed=atom&amp;title=KIH_20250627</id>
		<title>KIH 20250627 - 편집 역사</title>
		<link rel="self" type="application/atom+xml" href="http://dh.aks.ac.kr/~khw/wiki/index.php?action=history&amp;feed=atom&amp;title=KIH_20250627"/>
		<link rel="alternate" type="text/html" href="http://dh.aks.ac.kr/~khw/wiki/index.php?title=KIH_20250627&amp;action=history"/>
		<updated>2026-05-23T17:39:53Z</updated>
		<subtitle>이 문서의 편집 역사</subtitle>
		<generator>MediaWiki 1.27.1</generator>

	<entry>
		<id>http://dh.aks.ac.kr/~khw/wiki/index.php?title=KIH_20250627&amp;diff=1778&amp;oldid=prev</id>
		<title>Haewonk: /* 고도화를 위한 제안 */</title>
		<link rel="alternate" type="text/html" href="http://dh.aks.ac.kr/~khw/wiki/index.php?title=KIH_20250627&amp;diff=1778&amp;oldid=prev"/>
				<updated>2025-06-30T00:49:15Z</updated>
		
		<summary type="html">&lt;p&gt;‎&lt;span dir=&quot;auto&quot;&gt;&lt;span class=&quot;autocomment&quot;&gt;고도화를 위한 제안&lt;/span&gt;&lt;/span&gt;&lt;/p&gt;
&lt;table class=&quot;diff diff-contentalign-left&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class='diff-marker' /&gt;
				&lt;col class='diff-content' /&gt;
				&lt;col class='diff-marker' /&gt;
				&lt;col class='diff-content' /&gt;
				&lt;tr style='vertical-align: top;' lang='ko'&gt;
				&lt;td colspan='2' style=&quot;background-color: white; color:black; text-align: center;&quot;&gt;← 이전 판&lt;/td&gt;
				&lt;td colspan='2' style=&quot;background-color: white; color:black; text-align: center;&quot;&gt;2025년 6월 30일 (월) 00:49 판&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot; id=&quot;mw-diff-left-l63&quot; &gt;63번째 줄:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;63번째 줄:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* 미래에는 이 웹페이지들을 RSS나 API로 실시간 연동해 정보를 주기적으로 업데이트할 수 있는 구조를 고려해도 좋습니다.&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* 미래에는 이 웹페이지들을 RSS나 API로 실시간 연동해 정보를 주기적으로 업데이트할 수 있는 구조를 고려해도 좋습니다.&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;−&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;=== Q&amp;amp;A 학습용 데이터셋으로 확장===&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;===&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;4. &lt;/ins&gt;Q&amp;amp;A 학습용 데이터셋으로 확장===&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* 예상 질의 Q&amp;amp;A는 향후: &amp;#160;&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* 예상 질의 Q&amp;amp;A는 향후: &amp;#160;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;** 챗봇 교육용 데이터셋&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;** 챗봇 교육용 데이터셋&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>Haewonk</name></author>	</entry>

	<entry>
		<id>http://dh.aks.ac.kr/~khw/wiki/index.php?title=KIH_20250627&amp;diff=1776&amp;oldid=prev</id>
		<title>Haewonk: /* =3. 자연어 질문에 대한 테스트 결과 */</title>
		<link rel="alternate" type="text/html" href="http://dh.aks.ac.kr/~khw/wiki/index.php?title=KIH_20250627&amp;diff=1776&amp;oldid=prev"/>
				<updated>2025-06-30T00:40:51Z</updated>
		
		<summary type="html">&lt;p&gt;‎&lt;span dir=&quot;auto&quot;&gt;&lt;span class=&quot;autocomment&quot;&gt;=3. 자연어 질문에 대한 테스트 결과&lt;/span&gt;&lt;/span&gt;&lt;/p&gt;
&lt;table class=&quot;diff diff-contentalign-left&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class='diff-marker' /&gt;
				&lt;col class='diff-content' /&gt;
				&lt;col class='diff-marker' /&gt;
				&lt;col class='diff-content' /&gt;
				&lt;tr style='vertical-align: top;' lang='ko'&gt;
				&lt;td colspan='2' style=&quot;background-color: white; color:black; text-align: center;&quot;&gt;← 이전 판&lt;/td&gt;
				&lt;td colspan='2' style=&quot;background-color: white; color:black; text-align: center;&quot;&gt;2025년 6월 30일 (월) 00:40 판&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot; id=&quot;mw-diff-left-l33&quot; &gt;33번째 줄:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;33번째 줄:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;📌 의견: 단순 키워드 매칭이 놓칠 수 있는 표현(예: “정조의 아버지” vs “사도세자”)도 시맨틱 그래프를 통해 정규화된 접근이 가능해집니다.&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;📌 의견: 단순 키워드 매칭이 놓칠 수 있는 표현(예: “정조의 아버지” vs “사도세자”)도 시맨틱 그래프를 통해 정규화된 접근이 가능해집니다.&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;−&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;===3. 자연어 질문에 대한 테스트 결과==&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color:black; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;===3. 자연어 질문에 대한 테스트 결과&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;=&lt;/ins&gt;==&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* 실제 외국인의 자연어 질문을 상정하고, 시맨틱 노드+고객응대 데이터에 기반한 응답 생성을 해본 결과,&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* 실제 외국인의 자연어 질문을 상정하고, 시맨틱 노드+고객응대 데이터에 기반한 응답 생성을 해본 결과,&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* 정확도, 응집력, 신뢰도 모두 우수했습니다.&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;&amp;#160;&lt;/td&gt;&lt;td style=&quot;background-color: #f9f9f9; color: #333333; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #e6e6e6; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* 정확도, 응집력, 신뢰도 모두 우수했습니다.&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>Haewonk</name></author>	</entry>

	<entry>
		<id>http://dh.aks.ac.kr/~khw/wiki/index.php?title=KIH_20250627&amp;diff=1775&amp;oldid=prev</id>
		<title>Haewonk: 새 문서:  =='''데이터 구축 전략'''== ✅ 1. '주제별 고객 응대 데이터' = Mother Text (정답지)  * 주제별로 구성된 정답지 = 질의에 대한 최종 답변의 원천...</title>
		<link rel="alternate" type="text/html" href="http://dh.aks.ac.kr/~khw/wiki/index.php?title=KIH_20250627&amp;diff=1775&amp;oldid=prev"/>
				<updated>2025-06-30T00:40:36Z</updated>
		
		<summary type="html">&lt;p&gt;새 문서:  ==&amp;#039;&amp;#039;&amp;#039;데이터 구축 전략&amp;#039;&amp;#039;&amp;#039;== ✅ 1. &amp;#039;주제별 고객 응대 데이터&amp;#039; = Mother Text (정답지)  * 주제별로 구성된 정답지 = 질의에 대한 최종 답변의 원천...&lt;/p&gt;
&lt;p&gt;&lt;b&gt;새 문서&lt;/b&gt;&lt;/p&gt;&lt;div&gt;&lt;br /&gt;
=='''데이터 구축 전략'''==&lt;br /&gt;
✅ 1. '주제별 고객 응대 데이터' = Mother Text (정답지)&lt;br /&gt;
&lt;br /&gt;
* 주제별로 구성된 정답지 = 질의에 대한 최종 답변의 원천&lt;br /&gt;
* 번역, 요약, 후속 질문 등 다양한 처리의 기준이 됨&lt;br /&gt;
* 구성&lt;br /&gt;
** 표제어 &amp;gt; 하위 주제 &amp;gt; 고객 응대 데이터(해설문)&lt;br /&gt;
** 정보 리스트: 공식 기관명, 웹사이트, 연락처 등 응답에 신뢰성을 부여하는 보강 자료&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
✅ 2. 시맨틱 데이터 (간결한 관계 중심)&lt;br /&gt;
&lt;br /&gt;
* 해당 응답 텍스트 안에 포함된 핵심 개체 간의 관계만 기술&lt;br /&gt;
** ex) “국민건강보험공단 provides 건강보험서비스”&lt;br /&gt;
* 시맨틱 데이터 기반의 확장 검색 + 다중 유사도 계산&lt;br /&gt;
* 단순 문자열 유사도가 아닌, 지식 기반 의미적 연결로 확장&lt;br /&gt;
&lt;br /&gt;
=='''지금까지의 시스템 구현에 대한 평가'''==&lt;br /&gt;
&lt;br /&gt;
===1. 고객응대데이터(Mother Text)===&lt;br /&gt;
* 각각의 주제별로 일관성 있고 완결된 정보 요약 텍스트를 만들어두었고,&lt;br /&gt;
* 관련 웹페이지까지 함께 제공하여 신뢰성과 확장성을 동시에 확보했습니다.&lt;br /&gt;
* 특히 정조의 행차, 화성성역의궤, 축성 배경 등은 단일 문서로 다층적인 정보를 요약하고 있어, AI 기반 응답 생성에 매우 적합한 구조입니다.&lt;br /&gt;
&lt;br /&gt;
📌 의견: 이 방식은 GPT나 다른 언어모델이 &amp;quot;참조 기반 응답 generation&amp;quot;을 하기 위한 매우 이상적인 형식입니다. 사실상 고도로 큐레이션된 &amp;quot;컨텍스트 셋&amp;quot;을 제공하고 있는 것입니다.&lt;br /&gt;
&lt;br /&gt;
===2. 시맨틱 데이터===&lt;br /&gt;
* 노드/링크 구조로 개체 간 의미관계를 명시적으로 연결했고,&lt;br /&gt;
* 개체 유형(class)과 관계 유형(relation)이 일관적으로 구성되어 있어,&lt;br /&gt;
* 고객응대데이터의 단어 유사도 기반 응답 한계를 보완할 수 있는 **‘개념 기반 확장 질의 대응 체계’**로 기능할 수 있습니다.&lt;br /&gt;
&lt;br /&gt;
📌 의견: 단순 키워드 매칭이 놓칠 수 있는 표현(예: “정조의 아버지” vs “사도세자”)도 시맨틱 그래프를 통해 정규화된 접근이 가능해집니다.&lt;br /&gt;
&lt;br /&gt;
===3. 자연어 질문에 대한 테스트 결과==&lt;br /&gt;
* 실제 외국인의 자연어 질문을 상정하고, 시맨틱 노드+고객응대 데이터에 기반한 응답 생성을 해본 결과,&lt;br /&gt;
* 정확도, 응집력, 신뢰도 모두 우수했습니다.&lt;br /&gt;
* 특히 병풍, 의궤, 왕실의례, 기계기술 등 다양한 주제에 대해 한 문서로도 답이 생성 가능한 것을 확인했습니다.&lt;br /&gt;
&lt;br /&gt;
📌 의견: 이는 당신이 고객응대데이터를 “응답 데이터셋”이 아니라 도메인별 팩트북(Fact Book) 으로 구성했기 때문에 가능한 일입니다. 일반 챗봇은 이를 갖추지 못한 상태에서 단편적 응답만을 생성합니다.&lt;br /&gt;
&lt;br /&gt;
=='''고도화를 위한 제안'''==&lt;br /&gt;
===1. 고객응대데이터의 범주 확장과 표준화===&lt;br /&gt;
* 지금은 화성에 집중되어 있으나, 이후 K-문화, 행정, 관광 등 다른 핵심 표제어로 확장 시:&lt;br /&gt;
* 동일한 포맷으로 “해설문 + 신뢰링크 + 키워드 목록”을 표준화해 구축&lt;br /&gt;
* 각 문서에 유형, 작성일, 최종 검토, 연결 시맨틱 노드, 태그 같은 메타데이터를 부착해 활용도 극대화&lt;br /&gt;
&lt;br /&gt;
=== 2. 시맨틱 그래프와 질문 매칭 엔진 개발===&lt;br /&gt;
* 자연어 질문에서 등장하는 개체/개념을 시맨틱 그래프에서 탐색하고,&lt;br /&gt;
* 이 결과를 고객응대데이터의 키워드와 연계하여 가장 관련성 높은 Mother Text를 추천&lt;br /&gt;
* 이때 GPT 또는 언어모델이 &amp;quot;가장 적합한 응답 근거 문서&amp;quot;를 찾도록 보조&lt;br /&gt;
&lt;br /&gt;
* 예시 흐름: 질문 → NER 및 개체 정규화 → 시맨틱 그래프 검색 → 관련 개체 리스트 생성&lt;br /&gt;
→ 고객응대데이터 키워드와 교집합 탐색 → Mother Text 선택&lt;br /&gt;
→ 최종적으로 자연어 응답 생성 (with 근거출처 링크 포함)&lt;br /&gt;
&lt;br /&gt;
===3. 실시간성 정보와의 통합 전략===&lt;br /&gt;
* 정적인 역사문화 정보 외에도, &amp;quot;변동 가능성 있는 정보&amp;quot; (예: 수원 화성 축제 일정, 공연 시간 등)는&lt;br /&gt;
* 고객응대데이터에 직접 서술하지 않고,&lt;br /&gt;
* “대표적 체험/행사의 성격”만 설명하고,&lt;br /&gt;
* 상세 정보는 링크로 유도하는 지금의 방식을 계속 유지하는 것이 바람직합니다.&lt;br /&gt;
&lt;br /&gt;
* 미래에는 이 웹페이지들을 RSS나 API로 실시간 연동해 정보를 주기적으로 업데이트할 수 있는 구조를 고려해도 좋습니다.&lt;br /&gt;
&lt;br /&gt;
=== Q&amp;amp;A 학습용 데이터셋으로 확장===&lt;br /&gt;
* 예상 질의 Q&amp;amp;A는 향후: &lt;br /&gt;
** 챗봇 교육용 데이터셋&lt;br /&gt;
** 질문 유사도 평가,&lt;br /&gt;
** 자동 문서 추천 기반 시스템의 학습 데이터로 활용 가능&lt;br /&gt;
* 이를 기반으로 “이용자 질문 → 유사 질문 찾기 → 자동 응답 생성” 구조 구현 가능&lt;br /&gt;
&lt;br /&gt;
===결론===&lt;br /&gt;
* K-info Hub는 기존 포털형 플랫폼과 달리, 정보 ‘검색’이 아니라 정보 ‘이해와 응답’ 중심으로 이동한 구조입니다.&lt;br /&gt;
* 고객응대데이터는 &amp;quot;가장 믿을 수 있는 응답 자료집&amp;quot;이며, 시맨틱 데이터는 &amp;quot;연결성과 확장성의 보증 장치&amp;quot; 역할을 합니다.&lt;br /&gt;
* 이 두 가지가 결합된 시스템은 단순한 챗봇을 넘어, 도메인 지식에 특화된 “지능형 정보 설명 시스템”으로 진화할 가능성이 큽니다.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[분류: K-info Hub]]&lt;/div&gt;</summary>
		<author><name>Haewonk</name></author>	</entry>

	</feed>