본문 바로가기

IT

AI, 웨일즈는 데이터가 필요하다


웨일스, 데이터의 필요성

웨일스 지역에서 인공지능 (AI) 정확성 향상을 위해 더 많은 웨일스어 데이터가 필요하다는 문제에 대해 다루고 있습니다. 웨일스의 기술 개발자들은 AI가 웨일스어로 더 정확하게 작동하기 위해 지역 내 협력이 강화되어야 한다고 강조하며, 특히 웨일스어로 저작권 보호를 받는 자료들을 AI 소프트웨어를 훈련시키기 위해 이용할 수 있어야 한다고 주장합니다.

하이아의 인공지능 활용

한 기업인 하이아 (Haia)는 이미 웨일스어와 영어로 동시 번역을 제공하기 위해 인공지능을 활용하고 있습니다. 이 회사는 화자들이 웨일스어 또는 영어로 이야기할 때 번역된 자막을 함께 제공하는 동시 번역 소프트웨어를 사용하고 있습니다. 그러나 하이아의 공동 창업자인 톰 버크는 더 많은 웨일스어 데이터가 이용 가능하다면 제품을 더 개선할 수 있다고 밝혔습니다. 웨일스어의 작은 데이터셋으로 인해 번역이나 전사에 부정확함이 발생할 수 있다는 점을 언급하며, 더 많은 웨일스어 데이터를 이용할 경우 정확성을 높일 수 있다고 설명했습니다.

웨일즈어의 언어모델 활용

웨일스어 데이터는 라디오와 텔레비전 프로그램과 같은 매체를 포함하여 다양한 형태로 이용 가능합니다. 톰 버크는 이 데이터를 이용하여 모델을 훈련시키면 웨일스어 모델의 정확성이 높아지며, 이러한 기술을 다른 작은 언어에도 확장시킬 수 있다고 말했습니다.

이외에도 방고르 대학의 Canolfan Bedwyr에서는 웨일스어 챗봇 프로토타입인 Macsen을 개발하여 사용하고 있으며, OpenAI가 개발한 ChatGPT와 함께 연구를 진행하고 있습니다. 웨일스 정부는 AI 기술을 통해 웨일스어 발전을 촉진하는 것을 매우 중요하게 여기며, 현재 진행 중인 Welsh in Technology 전략을 갱신하여 AI와 웨일스어 발전에 대한 방향을 다시 정립할 예정입니다. 이는 웨일스 지역에서 기술 발전을 위한 핵심 과제로 여겨지고 있으며, 웨일스어 데이터의 활용성을 높이기 위한 노력이 계속될 것으로 예상됩니다.

이와같이 점점 더 언어모델이 강화될것이 기대되네요.