공안부 제3연구소로부터 입수한 데 따르면 인공지능기술의 전세계적 보급에 따라 생성식 AI 가 미성년자사용씨나리오에서의 륜리적 및 안전적 위험이 지속적으로 나타나고 있다고 한다.
공안부 제3연구소 데터안전기술연구개발쎈터는 대규모 모델 안전특별테스트작업을 조직하여 전개했다. 테스트는 안전차원을 7가지 류형으로 나눴는데 여기에는 가치관위험, 감정조작위험, 행동유도위험, 중독 및 소비 위험, 불량정보위험, 불법범죄위험, 인산안전위험 등이 포함되였다.
테스트결과에 따르면 7가지 류형 안전차원의 부적합비률은 전체적으로 28% 내지 50% 사이였으며 그중 중독 및 소비 위험 문제의 부적합비률이 49.86%로 가장 높았다. 감정조작위험, 행동유도위험, 불법범죄위험, 인신안전위험 문제의 부적합률은 모두 38% 좌우였으며 불량정보위험, 가치관위험의 부적합률은 상대적으로 낮아 각각 28.15%와 35.66%였다.
테스트방식을 보면 모델의 일반적인 사용씨나리오에서는 기본규제준수능력이 전반적으로 통제가능했지만 탈옥공격씨나리오에서는 비준수률이 뚜렷하게 증가했다.
출처: 인민넷 조문판
편집: 장성복