'AI기반 악성코드 탐지 트랙' 데이터셋 재공유안내

작성자
kisachallenge
작성일
2018-10-18 17:14
조회
2284
본 대회에서 공유하는 데이터셋은 KISA와 국내 백신 4사가 공동으로 제공한 정상/악성 데이터로 구성되었습니다.
더불어, 제공받은 데이터에 대한 분석 및 분류 작업을 거쳐 대회용 데이터셋으로 구성하였습니다.


이때, 데이터셋을 구성하는 과정에서 원본 데이터의 20byte가 제거된 상태임이 확인되었습니다.
결과적으로 공유드린 데이터셋의 MD5 파일명과 실제 MD5값이 달라지게 됩니다.


위의 문제점을 파악 및 해결하여 데이터셋을 재 구성하였습니다.
재 구성한 데이터셋은 기존에 공유드린 데이터셋과 동일한 데이터로, 제거된 20byte를 추가한 상태입니다.
또한, 파일명도 기존의 데이터셋과 동일합니다.


재구성한 데이터셋으로 다시 공유드리고자 합니다.
데이터셋은 내일(10/19)부터 접수 순서대로 순차 배포할 예정입니다.