본 프로젝트는 정보보호 투자 및 비용 데이터를 자동으로 추출하는 오픈소스 프로젝트입니다.
이 프로젝트는 다음과 같은 기능을 제공합니다:
- 공시된 재무정보에서 정보보호 공시관련 데이터를 추출하는 키워드 기반 텍스트 추출 도구 (Python 기반)
- 사이버 보안 및 IT 관련 키워드 데이터셋 (CC BY-SA 4.0 오픈소스)
- 정보보호 공시(ISDS) 및 컴플라이언스 관련 데이터를 보다 효율적으로 추출
- 본 도구의 사용결과에 대해서는 반드시 검토가 필요하며, 정확성을 보증하지 않습니다. 최종 공시내역은 공시를 수행한 회사의 책임입니다.
- 공시 수행결과에 대한 검증이 필요하시면 인터넷진흥원 웹사이트에서 사전 검증을 요청하세요!(문의:https://www.linkedin.com/in/jupyoseo/).
- 대한민국의 정보보호 공시(ISDS, Information Security Disclosure System) 규제에 따라 상장기업은 매년 정보보호 투자 및 비용을 공시해야 합니다.
- 본 도구는 공시된 재무정보에서 정보보호 관련 키워드를 자동 추출하여 컴플라이언스 준수를 지원를 좀 더 효과적으로 수행하고, 공유된 키워드를 통해 더 많은 조직의 담당자들이 집단 지성을 통해 업무를 수행함으로써 공시 과정에서의 혼란을 조금이라도 줄이고, 공시 결과의 정확성이 전반적으로 향상되는 것을 목적으로 제작하였습니다.
- 본 저장소의 키워드(/keyword/keyword.csv) 파일에서 새로운 키워드를 추가해 주세요!
- 아래 키워드 파일의 구조를 참고하시어, 새로운 정보보호 및 IT관련 키워드를 적절한 카테고리로 추가하고 Pull Request 를 제출하시면 됩니다.
- 스크립트(/src/keyword_extract.py)는 기본적인 처리를 하기 위해서 작성되어 매우 단순하고 향상될 여지가 많이 있습니다만, 이 프로젝트의 주 목적은 아닙니다.
- 키워드 파일은 간단한 CSV 파일이며 키워드, 구분자, 세부 구분자로 구성됩니다.
- IT(정보기술)의 경우에는 Hardware, Software 로 간단하게만 구분했습니다.
- IS(정보보호)의 경우에는 정보보안과 관련이 있는 범주 5개로 나누어져 있습니다:
- 세부 구분자는 현재 공시 목적으로는 활용되지 않으나, 이는 향후 공시제도가 변경되거나 고도화될 경우 또는 다른 목적으로 구분될 경우에도 대비하기 위한 목적입니다.
- 키워드 파일을 개선하고 항목을 추가하며 그 결과물을 많은 사람들이 공유하는 것이 이 프로젝트의 주 목적입니다.
- 키워드 추출기(/src)는 GPL(GNU General Public License, GNU 일반 공중 사용 허가서) v3 라이선스로 제공됩니다.
- 자세한 라이선스에 대한 사항은 별도의 LICENSE 파일과 아래 링크의 GPL 전문을 참고하세요.
- GPL v3 라이선스 전문: https://www.gnu.org/licenses/gpl-3.0.html
- 키워드 파일(/keyword)은 크리에이티브 커먼즈 CC BY-SA 4.0 (저작자표시-동일조건변경허락 4.0)을 따릅니다. 자세한 내용은 관련 링크를 참고하세요.
- https://creativecommons.org/licenses/by-sa/4.0/deed.ko
- 키워드 데이터는 누구나 공유 및 수정할 수 있지만, 수정된 버전도 동일한 CC BY-SA 4.0 라이선스로 공개해야 합니다.
- 정보보호공시 사전점검 컨설팅 또는 자동화 솔루션에 관심이 있으신가요?
- https://www.linkedin.com/in/jupyoseo/ 제 링크드인으로 문의해 주세요!