3.13 Google Cloud의 얼굴 인식 기술 접근 방식: AI 원칙과 검토 프로세스 적용 사례
Google Cloud의 얼굴 인식 기술 접근 방식: AI 원칙과 검토 프로세스 적용 사례
이 영상은 Google Cloud가 얼굴 인식 기술에 대한 접근 방식을 결정하는 데 있어 AI 원칙과 검토 프로세스를 어떻게 적용했는지에 대한 사례 연구를 제시합니다.
검토 결과 및 제품 출시:
2019년, Google Cloud는 미디어 및 엔터테인먼트 고객을 대상으로 전문 라이선스 미디어 콘텐츠에서 유명인을 태깅할 수 있는 엄격하게 범위가 지정된 API인 Celebrity Recognition을 출시했습니다. 비싼 태깅 프로세스 없이 비디오 콘텐츠를 검색하는 것은 어렵고 시간이 많이 소요되는 작업이었으며, 콘텐츠 제작자가 콘텐츠를 구성하고 개인화된 경험을 제공하는 데 어려움을 겪었습니다. Celebrity Recognition API는 사전 학습된 AI 모델로, 라이선스 이미지 기반으로 전 세계 수천 명의 인기 배우 및 운동선수를 인식할 수 있으며, Google Cloud의 첫 번째 엔터프라이즈 얼굴 인식 제품입니다.
개발 과정 및 윤리적 고려:
얼굴 인식은 잠재적인 불공정한 편향에 대한 주요 우려 사항으로 확인되었습니다. 2016년 초, 클라우드 리더십은 고객의 최우선 요청에도 불구하고 얼굴 인식을 Cloud Vision API 제품에 포함하지 않기로 결정했습니다. 이를 더 자세히 탐색하기 위해 초기 단계의 AI 원칙 검토 프로세스를 통해 얼굴 인식을 검토했습니다. 이러한 검토를 통해 연구, 사회적 맥락 및 기술의 과제에 대해 비판적으로 생각할 수 있는 공개 포럼과 시간을 가질 수 있었습니다. 얼굴 관련 기술이 사람들과 사회 전반에 얼마나 유용한지 확인했으며 (예: 얼굴 인증을 통한 제품 안전 및 보안 강화, 아동 인신매매 방지에 얼굴 인식을 사용하는 비영리 단체 등 사회적으로 유익한 사용 사례), 이러한 기술이 신중하고 책임감 있게 개발되어야 함을 강조했습니다.
Google은 얼굴 인식 기술의 오용에 대한 널리 논의되는 우려 사항 (공정성 유지, 국제적으로 용인되는 규범을 위반하는 감시에 사용 금지, 적절한 수준의 투명성 및 제어를 통한 개인 정보 보호)을 공유했습니다. 오용 가능성을 줄이고 AI 원칙에 부합하는 엔터프라이즈 사용 사례에 기술을 제공하기 위해 Google은 유명인 인식이라는 엄격하게 범위가 지정된 얼굴 인식 애플리케이션을 추진하기로 결정했습니다.
출시 준비 및 외부 전문가 협력:
Celebrity Recognition API 출시 준비를 위해 자체 내부 검토 프로세스와 함께 외부 전문가 및 시민권 지도자의 도움을 구했습니다. Google은 자체 경험이 영향을 받는 사람들의 경험과 반드시 일치하지 않을 수 있음을 인식하고, 이러한 경험과 우려 사항을 검토에 통합하는 데 도움을 요청했습니다. 제품의 의도된 사용을 고려할 때 사회에서 흑인 및 소수 민족 배우의 체계적인 과소 대표성이 평가의 핵심 요소였습니다. 잠재적인 영향을 더 자세히 파악하기 위해 인권 영향 평가를 수행하기 위해 외부 인권 컨설팅 회사인 BSR (Business for Social Responsibility)과 협력했습니다. BSR과의 협력은 API의 기능 및 정책을 수립하고 제품 개발 수명 주기 전반에 걸쳐 인권 고려 사항을 통합하는 데 중요한 역할을 했습니다. 또한 솔루션에 추가적인 감독이 필요한 부분을 밝히고 일반 목적의 얼굴 인식 API를 제공하지 않기로 한 이전 결정을 검증했습니다. BSR의 전체 보고서는 공개적으로 제공됩니다.
안전 장치 및 서비스 약관:
BSR의 권장 사항에 따라 Google은 다음과 같은 여러 안전 장치를 구현했습니다.
- 허용 목록에 있는 자격을 갖춘 고객에게만 Celebrity Recognition API 제공.
- "유명인" 데이터베이스는 신중하게 정의되고 미리 정의된 목록으로 제한됨.
- 유명인이 목록에서 자신을 제거할 수 있는 옵트 아웃 정책 구현.
- API에 확장된 서비스 약관 적용.
이러한 조치는 잠재적인 피해를 방지 및 완화하고 인권 위험을 줄이기 위한 견고한 기반을 Google에 제공합니다.
공정성 분석:
Celebrity Recognition API에 대한 Google의 검토의 또 다른 핵심 단계는 일련의 공정성 분석이었습니다. 근본적으로 이러한 공정성 테스트는 재현율 (Recall) 및 정밀도 (Precision) 측면에서 API의 성능을 평가하는 것을 목표로 했습니다. 즉, 개별 피부색 및 성별 그룹뿐만 아니라 이러한 그룹의 조합 (예: 피부색이 어두운 여성 또는 피부색이 밝은 남성)에 대해서도 API의 성능을 평가했습니다. 세 번의 개별 공정성 테스트에서 학습 데이터 세트와 피부색 기반 벤치마크 중 하나 간에 오류가 발생했습니다. 이러한 오류로 인해 Google은 근본 원인을 더 깊이 조사하기로 결정했습니다.
첫 번째로 확인한 것은 데이터 세트의 피부색 레이블이 정확한지 여부였습니다. 중간 및 어두운 피부색을 가진 사람들의 레이블이 완전히 정확하지 않다는 것을 발견했습니다. Joy Buolamwini와 Timnit Gebru의 획기적인 "Gender Shades" 연구에서 사용된 Fitzpatrick 피부색 척도에 따라 피부색 레이블을 다시 지정했습니다. 이 연구는 피부색과 성별에 따라 자동화된 얼굴 분석 알고리즘 및 데이터 세트에 존재하는 편향을 평가했습니다. 피부색 레이블을 다시 지정하여 오류율이 감소했지만 추가적인 불일치를 발견했습니다. 소수의 배우가 평가 데이터 세트에서 총 누락된 식별의 상당 부분을 차지했으며, 특히 피부색이 어두운 남성의 경우 그러했습니다. 오류율의 대부분이 소수의 배우에게 영향을 미친다는 것을 알고 오류가 가장 많은 배우를 조사한 결과 거의 100%의 오탐지율을 보였습니다.
Celebrity Recognition API의 축소된 범위 덕분에 테스트 세트와 갤러리를 하나씩 검토하여 문제의 원인을 파악할 수 있었습니다. 세 명의 흑인 배우의 경우 유명인 갤러리에는 성인 이미지가 있었지만 학습 세트에는 훨씬 젊은 시절의 이미지가 있었습니다. 모델은 수년 전에 연기했던 젊은 캐릭터로 성인 배우를 인식할 수 없었습니다. 이 경우 학습 데이터 세트를 확장하여 다양한 시점과 연령대의 유명인 이미지를 포함함으로써 문제를 해결할 수 있었습니다. 이를 통해 오류율 간의 불일치가 제거되었습니다.
이 경험을 통해 솔루션의 전반적인 맥락, 즉 미디어의 표현 문제에 주목하는 것의 중요성을 깨달았습니다. 이러한 맥락을 이해하고 솔루션의 범위를 엄격하게 지정하고 공정성을 위해 API를 철저히 테스트하고 개선한 후에야 API 출시를 편안하게 진행할 수 있었습니다. 이는 AI의 책임감 있는 개발이 AI의 성공적인 통합으로 이어지는 이유에 대한 예입니다.
2020년 중반, 다른 기술 회사들이 기술에 대한 광범위한 우려로 인해 얼굴 인식 사업을 제한하거나 철수한다는 소식을 환영했습니다. 궁극적으로 Google의 AI 거버넌스 프로세스를 통해 AI 원칙에 부합하는 제품을 연구하고 범위를 지정할 수 있었습니다. 오늘날 Google은 이미지 표현을 더 잘 이해하는 데 도움이 되는 더욱 세분화된 피부색 척도인 Monk Skin Tone (MST) Scale을 출시했습니다.