AI 저작권법
개인적인 연구가 아니라 공개를 목적으로 한 프로젝트에서는 데이터의 저작권과 라이센스를 중요하게 다뤄야한다.
학계에서도 데이터 저작권, 라이센스가 제대로 지켜졌는지 평가하고 있다. https://2021.aclweb.org/ethics/Ethics-review-questions/
저작권 보호 수준
창작성이 인정받는 수준에서는 저작권이 보호된다.
- 판례는 창작성이 인정되지 않아 저작권 보호가 되지 않기 때문에 판례 검색 서비스는 자유롭게 판례 데이터를 사용해도 무방하다.
- 댓글은 창작성 여부에 따라 저작권이 적용된다. 일상적이고 관용적인 문구는 보호가 안된다.
저작권 사용 절차
창작성이 인정돼 저작권이 자연 발생한 데이터에 대해서는 저작자와 협의를 해야 한다.
- 저작재산권 독점적/비독점적 이용허락에 대한 협의
- 저작재산권 전부/일부 양도
라이센스
저작권 이용에 대한 절차가 매우 귀찮다. 그래서 라이센스를 통해 이용허락 규약을 설정하여 라이센스에 따라서 저작권을 사용하면 된다. ref: http://cckorea.org/xe/ccl e.g., CCL, 공공누리
- 나무위키: CC BY-NC-SA, 비영리목적으로 사용 가능. 데이터 출처 명시
- KorQuAD: CC BY-ND, 저작자 표시 / 변경 금지
뉴스 데이터
- 언론사: 한국언론진흥재단에서 대부분의 언론사 저작권을 위탁 관리
- 저작자(한국언론진흥재단, 언론사)와 협의. 조중동은 직접, 그 외는 한국언론진흥재단에 문의.
- 아주 아주 드물게 CCL이 적용된 뉴스 기사가 존재함(위키트리)
- 뉴스 데이터를 0원에 구매했더라도 구매 이용 약관을 따라라.
- 신문 제목은 저작권의 보호를 받지 못한다고 한국저작권위원회에서 명시됨.
공정이용(Fair-use)
교육, 재판, 전시 등의 목적으로는 저작권자의 허락을 받지 않고 사용 가능하다.
https://www.copyright.or.kr/education/educlass/learning/what-the-copyright/definition/index06.do
저작권법와 AI 사이의 회색지대
- GPT-3가 생성한 데이터는 저작권법으로 어떻게 다뤄야하는가?
- 뉴스기사 요약 모델이 생성한 뉴스기사의 저작권은 어떻게 다뤄야하는가?
Leave a comment