행위

구름의 이름을 알려주는 인공지능 구축

red

    • 연구목적: 구름의 종류와 형태는 다양하다. 그런 구름들의 이름을 알려주는 기술이 있으면 좋겠다고 생각해 본 적이 있다.

몇 년 전 야생화를 구별해주는 어플이 생겼다는 소식을 들은 적 있다. 어플의 사진기에 야생화를 인식시키면 굉장히 높은 정확도로 야생화의 이름을 알려준다고 한다. 한 번도 사용해보지는 않았지만, 아마 이 ‘티쳐블 머신러닝’의 이미지 러닝 기능과 유사한 인공지능 기술을 사용하지 않았을까 생각한다. 그 야생화 어플처럼 구름의 이름을 알려주는 기술이 있으면 좋겠다는 생각에 구름 사진으로 과제를 수행하게 되었다. 구름의 이름을 알아야 구름을 제대로 감상할 수 있는 것은 아니지만, 구름의 이름을 척척 알려주는 어플같은 게 있다면 일상 속 소소한 호기심을 해결하고 넘어갈 수 있지 않을까.

    • 연구대상 : 다양한 구름들(고적운, 고층운, 권운, 권적운, 권층운, 난층운, 적란운, 적운, 층운, 층적운, 비행운)
    • 실험 결과: 학습에 사용된 구름의 이미지는 총 481개로, 고적운 59개, 고층운 37개, 권운 61개, 권적운 67개, 권층운 53개, 난층운26개, 적란운 70개, 적운 24개, 층운 19개, 층적운 50개, 비행운 15개이다.

각각 학습시킨 구름의 이미지 수가 균일하지 않은 것은 인터넷에서 찾을 수 있는 구름의 이미지 데이터가 균일하지 않은 탓인데, 이는 사람들의 선호에 따른 문제라고 예상된다. 적란운이나 적운과 같은 사람들이 좋아하는 맑은 날씨의, 흔히 뭉게구름이라고 불리는 구름은 자료가 많았던 반면에, 사람들이 선호하지 않는 흐리거나 비 오는 날씨의 먹구름(난층운)의 경우 상대적으로 인터넷에 자료가 많지 않았다. (양떼구름이나 새털구름이라고 불리는 권층운, 권적운, 고적운도 이미지 수가 많았다.) 그러나 학습 이미지의 수는 최소 50장으로 맞추려고 했고 그 결과 50장을 겨우 채우거나 50장을 가분히 넘어가거나 혹은 50장에 못 미치는 자료의 숫자를 보이고 있다.

    • 결과 해석:

결과적으로 고민해 볼 수 있는 문제는, 찾은 자료가 정확한지? 구름 사진의 경우, 애니메이션 캐릭터나 동물, 사람, 문자 이미지와는 다르게 학습시키는 사용자조차도 결과값의 정확성을 확신하기가 어려웠다. 재미있는 점은 자료를 찾는 과정에서 많은 구름사진을 접했고 그것을 각각의 폴더에 정리하는 과정에서 나 또한 티쳐블 머신과 비슷한 학습을 경험했다는 것이다. 그 결과 티쳐블 머신이 계산한 값과, 내가 추측?한 결과 값이 유사함을 알 수 있었다. 구름만 있는 사진이 아닌 ‘구름과 건물’, ‘구름과 태양’, ‘구름과 바다’, ‘구름과 사람’ 등의 자료가 정확도를 떨어트리는 것 같음. 그러나 정확도가 떨어진 다는 예상과 다르게 학습시키는 과정에서도 학습결과를 확인하는 과정에서도 비슷한 수준으로 방해되는 이미지가 섞여들어 갔고 그 결과 정확도를 떨어트리는 요소들이 정확도에 크게 영향을 주지는 못 한 것 같다고 판단된다.

      • 결과이미지: 구름결과1 구름결과2 구름결과3 구름결과4 구름결과5 구름결과6 구름결과7