OpenAI 인공지능, 유튜브를 교육에 활용하다!

인공지능 모델은 끊임없이 발전하는 기술로 계속해서 주목받고 있습니다. 그러나 이러한 모델을 훈련하는 데 사용되는 데이터는 몇 가지 질문을 제기합니다. 최근 주장 중 하나는 OpenAI와 Google 간의 데이터 사용에 관한 것입니다. The New York Times가 공유한 보고서에 따르면 OpenAI는 인공 지능 모델 GPT-4를 훈련하기 위해 허가 없이 Google 데이터를 사용했습니다. 이 주장은 상당히 주목할 만하다.

YouTube 데이터 사용

백만 시간이 넘는 OpenAI의 음성 인식 도구인 Whisper YouTube 그는 자신의 비디오를 복사하여 GPT-4를 훈련했다고 합니다. 회사는 해당 데이터 활용 시 법적인 문제가 발생할 수 있음을 인지하고 있으나 문제가 발생하지 않을 것으로 판단하고 있다고 밝혔습니다. Times 기사에 따르면 OpenAI는 이전에 다양한 소스에서 데이터를 수집했지만 YouTube 콘텐츠를 사용하기 시작했습니다. 구글의 sözcüsü는 그러한 무단 사용이 금지되어 있으며 Google도 이를 자체 모델 교육에 사용했다고 강조했습니다. YouTube 자신의 데이터를 사용했다고 밝혔습니다.

  • OpenAI는 Google 데이터를 사용하여 GPT-4를 훈련했습니다.
  • YouTube에서 얻은 데이터는 인공지능 모델 개발에 중요한 역할을 했다.
  • 무단 데이터 사용 및 저작권 침해에 대한 우려가 증가했습니다.