AI 기반 악성코드 탐지

<대용량 악성/정상코드 분석과 AI 기반의 악성코드 탐지 알고리즘 개발을 통한 탐지 정확도 향상>

 

사례


남북한 연구기관에 근무하는 K씨는 ‘2018년 북한 경제동향 예측보고서’라는 제목의 이메일을 동료에게 수신하였다. 메일에는 대외비 보고서를 발송하니 보안에 유의해달라는 내용이 써 있었고, 문서와 실행파일(exe)파일이 첨부되어있었다. 다운로드 후, 파일을 실행한 K씨의 모니터에는 악성코드로 인해 랜섬웨어에 감염되었음을 알리는 내용과 복구 비용을 입금하라는 메시지가 떴다. 뒤이어 PC에 저장된 문서, 이미지 등 파일 확장자가 JCOWWKRDU로 변하기 시작하였다. 알고보니, 해커가 동료의 사용자 정보를 탈취하여 악성코드가 포함된 메일을 발송하였고, K씨의 PC는 Magniber 랜섬웨어에 감염된 것이다.

피해확산 방지를 위해 신속하고 정확한 악성코드 탐지 알고리즘 개발이 요구된다.

 

문제


주어진 1만개의 학습데이터를 활용하여 AI기반의 악성코드 탐지 알고리즘을 개발하고, 새롭게 주어지는 데이터셋의 악성/정상여부를 탐지하십시오.

 

참가신청


AI기반 악성코드 탐지 트랙은 대학(원)생 부문과 참여 제한없이 모두 참여할 수 있는 일반 부문으로 나누어 진행합니다. 참가신청서 작성 후, 소속 증명이 가능한 서류와 함께 rnd_dataset@kisa.or.kr 로 발송해 주시면 신청이 완료됩니다.

  • 본 트랙은 팀 대표자의 소속확인(학계, 산업계 등)이 가능한 자에 한해 신청 가능합니다.
  • 대학(원)생 부문, 일반부문(제한없음) 중 선택하여 참가 할 수 있습니다(중복참여 불가)
  • 제출서류 검토 후, 대표자의 메일주소로, 데이터셋 다운 링크가 발송됩니다.

 

데이터셋(KISA-challenge 2018-Malware) 설명


  • 구축 : 한국인터넷진흥원, 안랩, 이스트시큐리티, 하우리, 세인트시큐리티 공동구축
  • 가공 : 악성코드의 기능 · 행위 분석 및 분류결과 기반으로 구성

※ 악성코드는 32비트 윈도우즈 환경에서만 실행 가능합니다.
※ 데이터셋은 반드시 VMWare 등을 이용하여 가상화된 PC환경에서만 다운로드 해야 합니다.

 

  • (학습데이터) KISA-challenge2018-Malware_1st
    정상/악성코드 혼합 1만개 + 정답지(정상/악성코드 Label)

※ 탐지 알고리즘 개발에 참고할 수 있는 총 1만 개의 파일과 Class Label을  제공합니다.

  • (예선데이터/일반부문(참여제한없음) 제출용) KISA-challenge2018-Malware_2nd_01
    정상/악성코드 혼합 1만개
  • (예선데이터/대학(원)생 부문 제출용) KISA-challenge2018-Malware_2nd_02
    정상/악성코드 혼합 1만개

※ 개발한 알고리즘을 활용하여 예선 데이터셋의 탐지결과를 제출합니다.
※ 대학(원)생 부문 참가자는 권역별 오프라인 예선 참가 시, 현장에서 예선 데이터셋을 제공받습니다.
※ 일반부문(제한없음) 참가자는 온라인을 통해 예선 데이터셋을 제공받습니다.

  • (본선데이터/1차 제출용) KISA-challenge2018-Malware-3rd
    정상/악성코드 혼합 1만개
  • (본선데이터/2차 제출용) KISA-challenge2018-Malware-4th
    정상/악성코드 혼합 1만개

※ 제공받은 데이터셋의 탐지 정확도를 측정하고, 알고리즘을 개선해 볼 수 있습니다.
※ 본선참가자는 3rd, 4th 본선 데이터셋 탐지결과를 모두 제출해야 합니다.

 

제출 결과물


  • 결과파일 : 탐지결과를 파일명 ID와 정상/악성을 분류하여 CSV파일형태로 작성
    ※ ID : MD5값, Class :정상코드 0, 악성코드 1
  • 알고리즘 설명문서 : 데이터분석·분류 과정 및 결과, 알고리즘 구성 방법, 수도코드, 실험과정, 예상결과, 보완점 등을 포함하여 작성
  • 발표자료 : 알고리즘 설명문서 요약, 본선데이터 분류방법, 탐지 결과 등을 포함하여 15분 분량으로 작성
    ※ 본선 진출자에 한해 대회 둘째 날(12/1예정) 제출

 

문의처


AI기반 악성코드 탐지 트랙 담당자

정소영 선임연구원  <061-820-1254>, rnd_dataset@kisa.or.kr