한 번에 약 30만 개의 한자를 처리할 수 있는 대형언어모델 '수생·포어(書生·浦語) 2.0(InternLM2)'이 17일 상해에서 공개됐다.
InternLM2는 상해인공지능실험실, 상탕(商汤)테크, 홍콩중문대학, 복단(复旦)대학이 공동 개발했다.
제한된 문맥과 텍스트의 길이는 인공지능(AI)이 당면한 중요한 문제다.
한 실험에서 연구자들은 해당 언어모델에 3시간 분량의 공개회의록을 제공하고 중요한 정보를 추출하도록 요청했다.
테스트 결과, 교정되지 않은 텍스트에 오류가 많았음에도 불구하고 InternLM2는 핵심 정보를 정확하게 추출하고 화자의 요점을 요약할 수 있는 것으로 나타났다.
개발자들은 말뭉치 품질과 정보의 정확도를 높여 파운데이션 모델을 기반으로 한 언어 모델링 능력을 향상시킬 것이라고 말했다.
상해인공지능실험실은 InternLM2 무료 라이선스를 추진하고 있다고 전했다.
출처: 신화망 한국어판
편집: 장성복