행위

"김연지CNU24/중국어음운론과제"의 두 판 사이의 차이

CNUDH

((1) 데이터 구성 방식)
((4) 결과 해석)
 
(같은 사용자의 중간 판 2개는 보이지 않습니다)
18번째 줄: 18번째 줄:
  
 
(2) 엣지 파일 구성
 
(2) 엣지 파일 구성
 +
 
엣지 파일은 2성으로 실현 가능한 성모와 운모의 결합 조합을 나타낸다.  
 
엣지 파일은 2성으로 실현 가능한 성모와 운모의 결합 조합을 나타낸다.  
 
엣지의 속성으로는 Source(성모), Target(운모), Type(Undirected), Id, Label(병음+성조 표기), pinyin, example_char(예시 한자)를 포함하였다.
 
엣지의 속성으로는 Source(성모), Target(운모), Type(Undirected), Id, Label(병음+성조 표기), pinyin, example_char(예시 한자)를 포함하였다.
36번째 줄: 37번째 줄:
  
 
===== '''(3) 분석 내용''' =====
 
===== '''(3) 분석 내용''' =====
 +
(1) 전체 네트워크 구조
 +
 +
생성된 네트워크는 성모 노드와 운모 노드로 구성된 이분 그래프(bipartite graph) 구조를 보인다. 성모 노드는 운모 노드와만 연결되고, 운모 노드는 성모 노드와만 연결되는 특성을 가진다. 네트워크의 평균 연결도(Average Degree)는 12.316으로, 각 노드가 평균 12개 이상의 노드와 연결되어 있음을 알 수 있다.
 +
 +
(2) 성모별 결합 양상
 +
 +
설첨중음(d, t, n, l)과 설근음(g, k, h)은 결합 가능한 운모의 수가 많아 네트워크의 중심부에 위치하는 경향을 보인다. 반면 설면음(j, q, x)은 i계열과 ü계열 운모하고만 결합하고, 설근음(g, k, h)은 u계열 운모와 주로 결합하는 상보적 분포를 이룬다.
 +
영성모의 경우, i계열 운모 앞에서는 y를 매개로, u계열 운모 앞에서는 w를 매개로 표기되는 특수한 결합 양상을 보인다.
 +
 +
(3) 운모별 결합 양상
 +
 +
사호(四呼)에 따른 운모의 결합 양상을 살펴보면, 개구호 운모(a, o, e, ai, ao 등)는 대부분의 성모와 결합 가능하여 높은 연결도를 보인다. 제치호 운모(i계열)는 설면음, 설첨중음, 순음과 주로 결합하며 설근음 및 설첨후음과는 결합하지 않는다. 합구호 운모(u계열)는 설근음, 설첨중음과 결합하나 설면음과는 결합하지 않는다. 촬구호 운모(ü계열)는 설면음(j, q, x)과 설첨중음(n, l)하고만 결합하는 가장 제한적인 분포를 보인다.
 +
 
===== '''(4) 결과 해석''' =====
 
===== '''(4) 결과 해석''' =====
 +
네트워크 시각화 분석을 통해 중국어 2성 음절의 성모·운모 결합이 무작위적이지 않고 사호 체계를 중심으로 체계적인 제약을 가짐을 확인하였다. 특히 설면음과 설근음의 상보적 분포, 촬구호 운모의 제한적 결합 양상 등은 중국어 음운 체계의 구조적 특성을 잘 보여준다.
 +
 +
시각화 과정에서 노드 속성 누락, 라벨 표시 오류, 레이아웃 설정 문제 등 여러 기술적 어려움이 있었으나, 이를 해결하는 과정에서 Gephi 도구의 작동 방식과 데이터 구조에 대한 이해를 높일 수 있었다.
 +
 +
네트워크 분석 방법은 다량의 음운 결합 데이터를 직관적으로 파악하고 패턴을 발견하는 데 유효한 방법론임을 확인하였으며, 향후 다른 성조의 음절 데이터와 비교 분석한다면 성조별 결합 양상의 차이를 보다 체계적으로 파악을 할 수 있을거 같다.

2026년 6월 20일 (토) 20:03 기준 최신판

김연지의 과제



1. 네트워크 시각화

Gephi 최종.png



2. 분석 보고서

(1) 데이터 구성 방식

(1) 노드 파일 구성

노드 파일은 중국어 성모와 운모를 각가의 노드로 설정하여 구성하였다. 노드의 속성으로는 Id, Label, node_type, articulator(조음위치), articulartor_type(조음방법), four_hu(사호), final_category(운모 분류)를 포함하였다. 성모는 총 22개로, 영성모를 포함하였으며 조음이치와 조음방법에 따라 분류하였다. 운모는 총 36개로, 단운모, 복운모, 비운모로 분류하고 사호 정보를 함께 기재하였다. 이를 통해 전체 노드는 58개로 구성하였다.

(2) 엣지 파일 구성

엣지 파일은 2성으로 실현 가능한 성모와 운모의 결합 조합을 나타낸다. 엣지의 속성으로는 Source(성모), Target(운모), Type(Undirected), Id, Label(병음+성조 표기), pinyin, example_char(예시 한자)를 포함하였다. Source(성모), Target(운모), Type(Undirected), Id, Label(병음+성조 표기), pinyin, example_char(예시 한자)를 포함하였다.

(2) 네트워크 시각화 과정

(1) 데이터 입력

Gephi를 사용하여 데이터를 입력하였다. 입력 순서는 노드 파일을 먼저 입력한 후 엣지 파일을 임포트하는 방식으로 진행하였다. 노드 파일을 먼저 입력하지 않으면 엣지 파일 임포트 시 노드 속성이 제대로 반영되지 않는 문제가 발생할 수 있으므로 순서를 지키는 것이 중요하다고 생각했다. 입력 시 Graph Type은 Undirected로 설정하였으며, 임포트 완료 후 Nodes 58개, Edges 351개의 Undirected Graph가 생성되었다.

(2) 시각화 과정에서 발생한 문제 및 해결

시각화 과정에서 여러 가지 어려움이 발생하였다. 첫째, 노드 파일 임포트 시 node_type 속성이 제대로 반영되지 않는 문제가 발생하였다. 이로 인해 Appearance 패널의 Partition 항목에서 node_type이 표시되지 않아 성모와 운모의 색상 구분이 불가능하였다. Data Laboratory를 통해 확인한 결과, 노드 테이블에 node_type 컬럼이 누락되어 있었으며, 노드 파일을 재임포트하여 해결하였다. 둘째, 노드 라벨 표시 문제가 발생하였다. 하단 툴바의 T 버튼을 활성화하고 Node Labels 탭에서 Show를 체크하였음에도 라벨이 표시되지 않는 현상이 있었다. 이는 라벨이 Id 기준으로 표시되고 있어 F_a, I_zh 등의 형태로 출력되고 있었기 때문으로, 폰트 크기를 조정하여 가독성을 개선하였다. 셋째, ForceAtlas2 레이아웃 적용 시 노드들이 퍼지지 않고 오히려 한 곳으로 뭉치는 현상이 발생하였다. Scaling 값을 10.0으로 높이고 Prevent Overlap 옵션을 활성화하여 노드들이 적절히 분산되도록 조정하였다.

(3) 분석 내용

(1) 전체 네트워크 구조

생성된 네트워크는 성모 노드와 운모 노드로 구성된 이분 그래프(bipartite graph) 구조를 보인다. 성모 노드는 운모 노드와만 연결되고, 운모 노드는 성모 노드와만 연결되는 특성을 가진다. 네트워크의 평균 연결도(Average Degree)는 12.316으로, 각 노드가 평균 12개 이상의 노드와 연결되어 있음을 알 수 있다.

(2) 성모별 결합 양상

설첨중음(d, t, n, l)과 설근음(g, k, h)은 결합 가능한 운모의 수가 많아 네트워크의 중심부에 위치하는 경향을 보인다. 반면 설면음(j, q, x)은 i계열과 ü계열 운모하고만 결합하고, 설근음(g, k, h)은 u계열 운모와 주로 결합하는 상보적 분포를 이룬다. 영성모의 경우, i계열 운모 앞에서는 y를 매개로, u계열 운모 앞에서는 w를 매개로 표기되는 특수한 결합 양상을 보인다.

(3) 운모별 결합 양상

사호(四呼)에 따른 운모의 결합 양상을 살펴보면, 개구호 운모(a, o, e, ai, ao 등)는 대부분의 성모와 결합 가능하여 높은 연결도를 보인다. 제치호 운모(i계열)는 설면음, 설첨중음, 순음과 주로 결합하며 설근음 및 설첨후음과는 결합하지 않는다. 합구호 운모(u계열)는 설근음, 설첨중음과 결합하나 설면음과는 결합하지 않는다. 촬구호 운모(ü계열)는 설면음(j, q, x)과 설첨중음(n, l)하고만 결합하는 가장 제한적인 분포를 보인다.

(4) 결과 해석

네트워크 시각화 분석을 통해 중국어 2성 음절의 성모·운모 결합이 무작위적이지 않고 사호 체계를 중심으로 체계적인 제약을 가짐을 확인하였다. 특히 설면음과 설근음의 상보적 분포, 촬구호 운모의 제한적 결합 양상 등은 중국어 음운 체계의 구조적 특성을 잘 보여준다.

시각화 과정에서 노드 속성 누락, 라벨 표시 오류, 레이아웃 설정 문제 등 여러 기술적 어려움이 있었으나, 이를 해결하는 과정에서 Gephi 도구의 작동 방식과 데이터 구조에 대한 이해를 높일 수 있었다.

네트워크 분석 방법은 다량의 음운 결합 데이터를 직관적으로 파악하고 패턴을 발견하는 데 유효한 방법론임을 확인하였으며, 향후 다른 성조의 음절 데이터와 비교 분석한다면 성조별 결합 양상의 차이를 보다 체계적으로 파악을 할 수 있을거 같다.