• 경기 상위 12%
(주)샌즈랩
  • 2.8
  • IT/웹/통신

기타

사이버보안에 최적화된 AI 학습용 데이터셋 구축

2022.12.12
김기홍 샌즈랩 대표 “사이버보안에 최적화된 AI 학습용 데이터셋 구축

“국내 환경에 최적화된 데이터셋 구축해 국내 활용 및 해외에 수출까지"



2021 인공지능 정보보호 컨퍼런스 'AIS 2021' 온라인이 지난 9월 16일 데일리시큐 주최로 900여 명이 참석한 가운데 성황리 개최됐다. 사전등록자는 1,400여 명이다.

이 자리에서 샌즈랩 김기홍 대표는 ‘침해사고 대응과 악성코드 탐지를 위한 양질의 AI 학습용 데이터셋을 만들기 위한 노력’을 주제로 강연을 진행했다.

사이버 보안 분야에서 인공지능 기술을 가장 선도적으로 많이 도입을 시도하고 있는 분야가 바로 침해사고탐지 및 악성코드탐지 분야다. 그는 침해사고분야와 악성코드탐지 분야에서 가장 많이 사용되는 인공지능 기술과 이 기술들에 활용되는 양질의 데이터셋을 만들기 위해 어떤 노력을 샌즈랩에서 하고 있는지 공유하는 시간을 가졌다.

김기홍 대표는 “데이터셋은 인공지능 개발에 필수적 요소이며 학습데이터를 기반으로 하고 있다. 많은 데이터가 있을수록 정확도와 성능이 상승하고 특징정보(Feature)가 다양할수록 차원도 상승한다”며 “하지만 무조건 많다고 좋은 것은 아니다. 풍부한 데이터셋을 기반으로 개발 자유도를 확보하는 것이 무엇보다 중요하다”고 설명했다.

이어 “침해사고 분야 데이터셋 생성은 단순 시뮬레이션 환경이 아닌 실환경 대상 공격 원천 데이터 구성을 목표로 하고 있다”며 “unb.ca는 데이터가 14만건이지만 샌즈랩 침해사고 데이터셋은 1억 건, 어플리케이션은 약 150여 건 이상, 라벨링은 정상/비정상 실제 공격 방법 그리고 Raw 데이터를 제공하는 것을 목표로 하고 있다”고 전했다.

샌즈랩은 이렇게 구축된 침해사고 데이터셋을 국가기관 지능형 네트워크 위협 분석 모델, 통신사 대량 디바이스 위협 대응 모델 등 다양한 분야에 활용될 수 있도록 준비하겠다고 밝혔다.

김기홍 대표는 “국내 사이버 보안 인공지능 연구는 아직 해외 데이터셋 의존성이 높고 실제 국내 이벤트, 공격탐지에 취약하다. 이를 개선하기 위해 국내 환경에 최적화된 데이터셋을 구축해 국내 활용은 물론 해외에 수출까지 하는 것을 목표로 하고 있다”고 강조했다.

이어 강연을 진행한 샌즈랩 신대균 팀장은 악성코드 분야 데이터셋 구축을 설명하며 “인공지능 프로젝트 실패 요인의 가장 큰 원인은 학습 데이터 확보 문제”라며 “인공지능 연구를 계획했다면 양질의 데이터셋의 준비가 가장 중요하지만 대부분의 연구 사례가 해외 데이터셋을 사용하거나 각각의 수단으로 악성코드를 수집하고 메타데이터를 생성하는 방식으로 진행되고 있다”고 설명했다.

샌즈랩은 양질의 데이터셋을 위해 우선 윈도우, 리눅스, 안드로이드, IOS 등의 실행형 파일 타입, 문서형, 압축파일, 스크립트 타입의 원시데이터를 준비하고 있다.

또 명확한 기준에 의한 악성 유형 분류를 통해 국제적으로 악성 유형 호환이 가능한 데이터셋을 제공하려고 한다.

그리고 데이터셋에서 제공되는 메타데이터의 항목은 전체적으로 약 250종의 메타데이터 항목으로 구성하고 마지막으로 다양한 피처셋으로 학습 데이터셋 구성이 가능하도록 준비하고 있다.

더불어 악성코드에 기능 OP Code 셋을 MITRE ATT&CK의 T-ID에 매칭하는 샌즈랩 자체 기술을 적용하고 공격 기법 별 탐지 정보를 학습해 신종 악성코드 탐지에 활용할 수 있는 메타데이터를 제공한다는 계획이다.

보다 상세한 내용은 아래 영상을 통해 확인할 수 있으며 샌즈랩 강연자료는 데일리시큐 자료실에서 다운로드 가능하다.



출처 : 데일리시큐(https://www.dailysecu.com)




기업리뷰를 써야 하는 이유

  1. 1. 리뷰 하나로 열람권 획득 리뷰 하나만 써도 모든 기업 리뷰를 승인된 날로부터 1년간 볼 수 있습니다.
    잡플래닛은 당신이 가장 만족스러운 직장을 고를 수 있도록 도와줍니다. 몇분만 투자하세요!
  2. 2. 매일 수백개의 기업에 대한 새로운 리뷰 지금 이순간에도 수백명의 회원들이 기업리뷰를 남기고 있습니다. 그리고 당신의 친구, 직장 동료, 경쟁자들은 벌써 이런 정보를 보고 있을지도 모릅니다. 뒤쳐지지 마세요!
  3. 3. 운영팀도 모르는 익명성 리뷰를 검토하는 운영팀조차도 작성자가 누구인지 모릅니다. 모든 개인 정보는 암호화되며 어디에도 노출되지 않습니다. 심지어 작성자가 드러날 것만 같은 리뷰는 거절된답니다. 걱정마세요!

<리뷰 작성 Tips>

  1. 1. 기업이 가지는 ‘일자리로서의 매력’ 혹은 ‘아쉬운 점‘에 대하여 작성해주세요. 특정인을 지목하여 묘사하기 보다는 기업의 특성과 관련된 정보를 이야기해주세요. • 입사 후 어떤 업무를 하나요? • 휴가 사용은 어떻게 하나요? • 어떤 복지가 제공 되나요?
  2. 2. 본인이 경험한 사실을 작성해주세요. 간접 정보, 허위사실 또는 소문(확인되지 않은 정보, 루머 또는 다른 출처에서 인용 또는 보고된 다른 사람의 의견/경험)은 차단될 수 있습니다.
  3. 3. ‘이유‘를 함께 이야기해주세요. ‘회사가 좋다, 안 좋다’ 뿐만 아니라 그 회사가 왜 좋은지를 포함한 정보입니다. 회사를 다니면서 느꼈던 점들과 그렇게 느꼈던 이유와 근거를 이야기해 주세요.
  4. 4. ‘균형’을 맞춰주세요. 회사에 대한 긍정적 평가와 부정적 평가 모두가 구직자들에게 도움이 됩니다. 조금 더 객관적인 시각으로 장점과 단점의 균형을 권장합니다.
  • "어디로 갈지 결정해야 할 마지막 순간에 잡플래닛의 기업리뷰가 큰 도움이 되었다. 덕분에 나에게 잘 맞는 회사를 선택할 수 있었다."
  • 당신의 리뷰로 더 나은 삶을 살게 될 미래의 직장인
  • "선배에게 물어봐도 말 안해주는 이야기들. 하지만 결정을 위해 알아야만 하는 것들. 잡플래닛이 유일한 솔루션이었다."
  • 당신이 1분을 투자하고 구해낸 미래의 직장인
  • "복지제도가 있다 없다 하는 것보다 중요한건, 정말 혜택을 볼 수 있는건가 하는 거 잖아요. 그런데 그런정보는 구하기가 어려웠으니까요."
  • 당신의 리뷰로 현실을 알게 된 미래의 후배
  • "일년만 더 빨리 오픈하지! 그랬으면 이곳에 취업해서 6개월이나 허비하지 않아도 되었을텐데.. 뭐 그래도 이제는 도움 좀 받겠어요."
  • 당신이 쓴 리뷰로 재취업의 방향을 결정하려는 미래의 취업준비생

수준이 다른 잡플래닛의 연봉정보

  1. 1. 직급/직종 별로 보는 정확한 연봉 후회하지 않으려면 직급에 따라, 그 속 에서도 직종에 따라 달라지는 연 봉정보를 알아야 합니다. 회사 평균 연봉 같은 숫자에 당하지 마세요.
  2. 2. 날마다 새로워지는, 가장 현실적인 연봉 잡플래닛에서는 하루 수백건의 연봉 정보가 추가됩니다. 눈 뜨면 달라지 는 상황 속에서 언제까지 구체적 이 지도 않은 작년 연봉정보를 기준으 로 인생을 결정할 순 없으니까요.
  3. 3. 친구도 안가르쳐 주는 정보 멀지 않은 미래에 연봉을 좀더 구체적으로 볼 수 있는 기능이 적용 됩니 다. 누군가는 기본급에, 누군가는 상 여금에 더 큰 비중을 두니까요. 친구에게도 물어보기 어려운 정보를 기다리며, 잠깐만 투자하세요.

정보 등록 정책

  1. 연봉정보의 신뢰성을 높이기 위해, 작성된 모든 정보는 잡플래닛의 자체적인 검토 과정을 거쳐 등록됩니다.
  2. 등록이 거부되는 이유 1. 존재하지 않거나 명확하지 않은 기업명 2. 기존에 입력된 연봉 정보와 비교했을 때, 지나치게 큰 차이가 나는 금액 3. 직급/직종을 고려했을때 상식을 벗어난 신뢰하기 어려운 금액

이것만 기억하세요.

  1. 1. 인턴에서 이직까지. 잡플래닛의 원스톱 정보 제공 서비스 노력하면 찾을 수 있는 공채 족보뿐 만 아니라, 선배한테 매달려야 알려주는 인턴 합격수기부터 그 어디에 도 없는 경력직들의 이직 면접 팁까 지. 당신의 모든 '지원'이 합격으로 끝나는 방법이 잡플래닛에 있습니다.
  2. 2. 잠깐! 기업 리뷰도 보고 싶으신가요? 면접후기를 제출하면 합격을 부르는 수만개의 꿀팁이 열립니다. 기업 리뷰도 보고 싶으시다면 기업 리뷰를 제출해주세요. 열려라 참깨! 의 비밀은 '기브 앤 테이크' 입니다.

<면접 작성 Tips>

  1. 1. 실제 면접에 참여한 경험을 작성해주세요! 면접을 앞둔 구직자가 면접을 준비할 때 필요한 정보를 입력해주세요. • 면접을 위한 준비는 무엇인가요? • (면접질문) • 면접은 어떤 방식인가요?
  2. 2. 본인이 경험한 사실을 작성해주세요. 간접 정보, 허위사실 또는 소문(확인되지 않은 정보, 루머 또는 다른 출처에서 인용 또는 보고된 다른 사람의 의견/경험)은 차단될 수 있습니다.
  3. 3. ‘이유‘를 함께 이야기해주세요. ‘면접 분위기가 좋다, 안 좋다’ 뿐만 아니라 그 회사가 왜 좋은지를 포함한 정보입니다. 면접을 보면서 느꼈던 점들과 그렇게 느꼈던 이유와 근거를 이야기해 주세요.
  4. 4. 면접 ‘과정’에 관련된 정보를 이야기해주세요. 특정인을 지목하여 묘사하기 보다는 안내과정, 질답과정, 발표과정 등에 대하여 작성해주세요.
  • "예상질문을 준비했지만, 실제 면접에서는 전혀 다른 질문으로 몇번의 고비를 마셨습니다. 하지만,잡플래닛에서 먼저 합격한 선배들의 노하우를 보고 면접을 봤더니 바로 합격통보!소원성취!"
  • 당신이 알려준 면접 노하우를 보고 취업 성공한 미래의 후배
  • "외국계 기업의 영어 면접을 포기하고 있었습니다. 하지만 실제 면접 후기를 들어보니 영어에 까다롭지 않다고 하더군요. 그래서 자신있게 지원을 했고, 현재 이곳에서 일하고 있습니다."
  • 실제 면접과정을 알고 도전해, 이직을 성공한 직장

정보 등록 정책

  1. 면접후기의 신뢰성을 높이고 고의적 기업 평점 조작을 방지하기 위해, 작성된 모든 정보는 잡플래닛의 자체적인 검토 과정을 거쳐 등록됩니다.
  2. 등록이 거부되는 이유 1. 존재하지 않거나 명확하지 않은 기업명 2. 기업 기밀에 해당하는 내용 3. 욕설, 비속어, 은어 및 공격적인 언어 4. 부서, 직급 등 개인을 특정 지을 수 있는 정보나 폄훼, 비방성 표현 5. 기업을 이해하는데 도움이 안되는 상관 없는 내용

기업리뷰가 제출되었으며, 리뷰심사가 통과 시
노출됩니다.
지금부터 모든 기업리뷰를 제한 없이 볼 수 있습니다.
단, 리뷰심사에서 승인 거절 시 다시 제한이 됩니다.

신고하기

close