
Photo by Justin Porter on Unsplash
메타, AI 번역 진보를 위한 언어 기술 파트너 프로그램 출시
메타는 오늘 UNESCO와 협력하여 다양한 언어의 오디오와 텍스트를 수집하여 AI 번역 모델을 개선하고 개발하기 위한 언어 기술 파트너 프로그램을 발표했습니다.
시간이 없으신가요? 이건 간단한 요약입니다!
- 메타는 유네스코와 협력하여 AI 번역 모델을 향상시키기 위한 언어 기술 파트너 프로그램을 시작하였습니다.
- 이 프로그램은 소외된 언어에 초점을 맞추고 있으며, 전세계의 조직들이 참여하도록 초대되었습니다.
- 파트너들은 AI 모델을 훈련시키기 위해 10시간 이상의 오디오와 텍스트 전사본, 그리고 해당 언어의 긴 텍스트를 제공할 것으로 기대됩니다.
언어 기술 파트너 프로그램은 UNESCO의 글로벌 이니셔티브인 International Decade of Indigenous Languages를 지원하기 위해 자원이 부족한 언어에 초점을 맞추고 있습니다. 이 프로그램은 전 세계의 원주민 언어에 대한 인식을 높이고 보호하기 위해 만들어졌습니다.
해당 기술 거대기업은 더 많은 사람들과 조직들이 프로그램에 참여하도록 열린 초대장을 공유했습니다. Meta는 새로운 파트너들이 10시간 이상의 음성 녹음과 그에 대한 전사(transcriptions), 그리고 200문장 이상의 대규모 텍스트를 제공하도록 기대하고 있습니다.
“AI 모델에서 소외된 언어에 대한 지원을 확대하기 위해 유네스코와 함께하는 작업은 이 노력의 핵심 부분입니다,”라고 Meta가 공유한 공지에는 이렇게 기재되어 있습니다. “다양한 언어에 대한 문제를 처리할 수 있고, 소외된 언어에서도 작동하는 모델을 개발하는 것은 디지털 세계에서 언어 다양성과 포괄성을 촉진하는 데 뿐만 아니라, 새로운 상황에 적응하고 경험에서 배울 수 있는 지능형 시스템을 만드는 데에도 도움이 됩니다.”
대신에, 프로그램에 참여하는 파트너들은 메타의 연구 팀으로부터 기술 워크샵을 받게 될 것입니다. 누누부트의 캐나다 정부는 이미 이누이트 언어인 이누이투트와 이누인나크툰으로 데이터를 제공하는데 협력하기로 동의했습니다.
메타는 또한 오픈 소스 기계 번역 벤치마크를 발표했습니다. 이를 통해 다른 회사들과 AI 개발자들이 자신들의 번역 모델을 테스트할 수 있습니다.
스페인이 최근에 Alia라는 오픈 소스 AI 모델을 발표했습니다. 이 AI는 스페인에서 공식적으로 사용되는 카스티야어와, 국내에서 공동으로 사용되는 카탈로니아어, 바스크어, 갈리시아어, 밸렌시아어로 학습되었습니다.
댓글 달기
취소