Headlines

[Amnesty] 생성형 AI 학습에 불법 데이터 수집 우려

image_print

국제앰네스티(Amnesty International)는 5월 28일, 기술 기업들이 사생활 보호권 등 인권 기준을 위반하여 인공지능(AI) 모델 개발을 위해 불법적인 웹 스크래핑을 통해 대량의 온라인 데이터를 수집했다고 발표했다.

이에 따라 앰네스티는 이러한 데이터 수집 시스템의 금지를 촉구하고, 각국 정부가 개입해 이러한 관행을 규제할 것을 촉구했다.

구글, 메타, 오픈AI와 같은 기업들이 구축한 대규모 데이터 수집 및 처리 시스템과 관련된 위험을 기록한 보고서에서 앰네스티는 독립형 생성형 AI 시스템이 불법적인 웹 스크래핑을 통해 사용자의 온라인 데이터를 대량으로 추출하여 생성형 AI 모델을 학습시키기 때문에 설계 및 배포 자체가 불법이라고 지적했다.

국제앰네스티 알고리즘 책임성 연구소(Algorithmic Accountability Lab) 소장인 리키타 바네르지(Likhita Banerji)는 이러한 데이터 스크래핑 시스템이 전 세계 수십억 개의 공개 온라인 게시물에서 웹 사용자의 명시적인 동의 없이 정보를 추출하여 기본 인권 조약과 디지털 시대의 사생활 보호에 관한 결의안에 명시된 사생활 보호권을 침해하고 있다고 지적했다.

또한, 이러한 생성형 AI 시스템이 인종이나 성별에 대한 편견과 차별을 조장하고 있는데, 이는 웹에서 추출한 학습 데이터에 내재된 현실 세계의 편견과 문화적 고정관념을 반영하는 것이라고 덧붙였다.

이와 함께 국제앰네스티는 생성형 AI 모델의 급속한 발전이 심각한 환경적 결과를 초래한다고 지적했다.

첫째, 생성형 AI 개발에는 AI 서버를 수용할 데이터 센터 구축이 필수적이며, 이는 건설 및 운영 과정에서 막대한 양의 수자원을 소비한다. 이는 많은 지역에서 물 부족 현상이 심화되고 있는 상황에서 더욱 심각한 문제가 되고 있다. 또한, 데이터 센터는 수은이나 납과 같은 유해 물질을 포함하는 전자 폐기물을 발생시키고 있다.

둘째, AI 관련 인프라는 핵심 광물과 희귀 원소에 크게 의존하고 있는데, 이러한 자원들은 지속 불가능한 방식으로 채굴되는 경우가 많다.

이에 따라 국제앰네스티는 기술 기업들에게 독립형 생성형 AI 모델 학습을 위해 불법적으로 대량의 데이터를 수집하는 관행을 중단할 것을 촉구했으며, 각국 정부에는 AI 도구 설계 및 사업 결정과 관련된 인권 침해에 대해 기업에게 책임을 물을 것을 촉구했다.

그동안 인공지능(AI) 개발과 관련된 문제점들에 대해 지속적으로 논쟁이 이어져 왔다. 주요 우려 사항으로는 감시 기술과 관련하여 AI 오용, 동의 없는 데이터 추출, 데이터 유출, 개인에 대한 추론형 프로파일링, 그리고 특히 아동과 같은 취약 계층의 행동에 영향을 미칠 수 있는 합성 미디어 생성 등이 있다.

*Source : www.jurist.org

image_print