"2019 겨울방학 스터디 2주차"의 두 판 사이의 차이

seonae's wiki
이동: 둘러보기, 검색
(김바로선생님 특강)
 
9번째 줄: 9번째 줄:
  
 
==김바로선생님 특강==
 
==김바로선생님 특강==
 +
===준비하기===
 +
*[https://cran.seoul.go.kr/ GNU R]
 +
*[https://www.rstudio.com/products/rstudio/download/ RStudio]
 +
*[https://gephi.org/users/download/ gephi]
 +
*[https://www.teamviewer.com/ko/ Teamviewer]
 +
 +
*참고하기 : [https://www.youtube.com/channel/UC8yvEjmB4qcNr5G4g0FRdEA 유투브 채널 koreaDH]
 +
 +
===디지털 인문학===
 +
설계 – 구축 – 분석 –  해석 – 시각화
 +
ontology - xml, rdb - GIS, linguistic analysis, network analysis -  - 3D, video, image
  
 
===네트워크 분석===
 
===네트워크 분석===
 +
*중요한 개념 : NODE & LINK
 +
* degree centrality  - hub 가장 많은 링크를 갖고 있는 노드.
 +
* betweeness centrality – linker 두 집단을 연결하는 데 꼭 필요한 노드.
 +
* closeness centrality – center 한 노드에서 네트워크의 끝노드까지의 영향력이 가장 큰 것.
 +
 +
 +
*네트워크 표현방법
 +
**1)source target weight (edge)
 +
**이때 source와 target은 속성이 같아야 하는데, 속성이 다르면 계산이 복잡해지기 때문. but 속성이 다르더라도 2-mode등을 이용한 처리를 할 수는 있음.
 +
**2) 인접행렬 : 표로 표현. but 잘 안씀.
 +
**3) 그래프
 +
 +
 +
*네트워크 분석 프로그램
 +
**UCINET : 네트워크 분석프로그램의 조상격. 1세대
 +
**PAJEK, GEPHI : 요즘 많이쓰는 분석툴. UI가 좋음.
  
 
===텍스트 분석===
 
===텍스트 분석===
 +
*1) 형태소 분석 : 긴 텍스트를 형태소 단위로 분절하여 분석. 형태소 분석기 필요.
 +
**형태소분석기 :꼬꼬마 분석기(kkma), KoNLp(R)/KoNLpy(python) 등 다양.
 +
*2) 감정 분석 : 긴 텍스트를 분절한 뒤 어휘가 갖는 감정을 분석. 감정사전 필요.
 +
*3) 공기어 분석 : 텍스트 상에서 같이 출현하는 어휘들을 분석. (+군집분석)
 +
 +
=> 빈도 수 자체보다 전체 텍스트에서 차지하는 정도가 중요하므로 비율로 환산.
 +
=> 언어분석은 언어가 갖는 규칙을 명확히 이해하여 사전을 충실하게 구축하면 질좋은 산출물을 도출할 수 있음.
 +
=> 이 산출물에 대해 '''어떻게 해석하느냐'''가 중요한 것.

2019년 1월 11일 (금) 22:21 기준 최신판

스터디 홈


김바로선생님 특강

준비하기

디지털 인문학

설계 – 구축 – 분석 –  해석 – 시각화
ontology - xml, rdb - GIS, linguistic analysis, network analysis -  - 3D, video, image

네트워크 분석

  • 중요한 개념 : NODE & LINK
  • degree centrality - hub 가장 많은 링크를 갖고 있는 노드.
  • betweeness centrality – linker 두 집단을 연결하는 데 꼭 필요한 노드.
  • closeness centrality – center 한 노드에서 네트워크의 끝노드까지의 영향력이 가장 큰 것.


  • 네트워크 표현방법
    • 1)source target weight (edge)
    • 이때 source와 target은 속성이 같아야 하는데, 속성이 다르면 계산이 복잡해지기 때문. but 속성이 다르더라도 2-mode등을 이용한 처리를 할 수는 있음.
    • 2) 인접행렬 : 표로 표현. but 잘 안씀.
    • 3) 그래프


  • 네트워크 분석 프로그램
    • UCINET : 네트워크 분석프로그램의 조상격. 1세대
    • PAJEK, GEPHI : 요즘 많이쓰는 분석툴. UI가 좋음.

텍스트 분석

  • 1) 형태소 분석 : 긴 텍스트를 형태소 단위로 분절하여 분석. 형태소 분석기 필요.
    • 형태소분석기 :꼬꼬마 분석기(kkma), KoNLp(R)/KoNLpy(python) 등 다양.
  • 2) 감정 분석 : 긴 텍스트를 분절한 뒤 어휘가 갖는 감정을 분석. 감정사전 필요.
  • 3) 공기어 분석 : 텍스트 상에서 같이 출현하는 어휘들을 분석. (+군집분석)
=> 빈도 수 자체보다 전체 텍스트에서 차지하는 정도가 중요하므로 비율로 환산.
=> 언어분석은 언어가 갖는 규칙을 명확히 이해하여 사전을 충실하게 구축하면 질좋은 산출물을 도출할 수 있음. 
=> 이 산출물에 대해 어떻게 해석하느냐가 중요한 것.