소라 (텍스트-비디오 모델)

위키백과, 우리 모두의 백과사전.

소라
개발자OpenAI
플랫폼OpenAI
종류텍스트-비디오 모델
웹사이트openai.com/sora 위키데이터에서 편집하기

소라(Sora)는 미국 인공지능(AI) 연구기관 오픈AI(OpenAI)가 개발한 텍스트-비디오 모델이다. 설명 프롬프트를 기반으로 동영상을 생성할 수 있을 뿐만 아니라 기존 동영상을 시간에 따라 앞이나 뒤로 확장할 수도 있다.[1][2] 2024년 2월 기준 미공개 상태이며 아직 일반에 제공되지 않는다.[3]

역사[편집]

메타의 Make-A-Video, 런웨이의 Gen-2 및 구글의 Lumiere를 포함하여 소라 이전에 여러 다른 텍스트-비디오 생성 모델이 생성되었으며, 이 중 마지막 모델(2024년 2월 기준)도 아직 연구 단계에 있다.[4][5] 소라를 개발한 오픈AI는 2023년 9월 DALL-E 텍스트-이미지 변환 모델 중 세 번째인 DALL·E 3를 출시했다.[6]

소라를 개발한 팀은 "무한한 창의적 잠재력"을 의미하기 위해 하늘을 뜻하는 일본어 단어의 이름을 따서 명명했다.[1] 2024년 2월 15일, 오픈AI는 산길을 운전하는 SUV, 촛불 옆에 있는 '짧고 푹신한 괴물' 애니메이션, 걸어가는 두 사람 등 자신이 만든 고화질 영상의 여러 클립을 공개하여 소라를 처음으로 선보였다.[7] 눈 내리는 도쿄, 캘리포니아 골드 러시를 다룬 가짜 역사 영상을 제작했으며, 최대 1분 길이의 영상을 생성할 수 있다고 밝혔다.[5][4] 그런 다음 회사는 모델 학습에 사용된 방법을 강조하는 기술 보고서를 공유했다.[2][8] 오픈AI CEO인 샘 올트먼은 또한 소라가 생성한 프롬프트 비디오로 트위터 사용자의 프롬프트에 응답하는 일련의 트윗을 게시했다.

오픈AI는 소라를 대중에게 공개할 계획이지만 곧 그렇게 될 것이라고 밝혔다. 언제인지는 확정되지 않았다.[5][3] 회사는 모델에 대한 적대적 테스트를 수행하기 위해 잘못된 정보와 편견 전문가를 포함한 소규모 "레드 팀"에 제한된 액세스를 제공했다.[6] 또한 회사는 소라를 비디오 제작자 및 아티스트를 포함한 소수의 크리에이티브 전문가 그룹과 공유하여 크리에이티브 분야에서의 유용성에 대한 피드백을 구했다.[9]

각주[편집]

  1. Metz, Cade (2024년 2월 15일). “OpenAI Unveils A.I. That Instantly Generates Eye-Popping Videos”. 《The New York Times》. 2024년 2월 15일에 원본 문서에서 보존된 문서. 2024년 2월 15일에 확인함. 
  2. Brooks, Tim; Peebles, Bill; Holmes, Connor; DePue, Will; Guo, Yufei; Jing, Li; Schnurr, David; Taylor, Joe; Luhman, Troy; Luhman, Eric; Ng, Clarence Wing Yin; Wang, Ricky; Ramesh, Aditya (2024년 2월 15일). “Video generation models as world simulators”. 《OpenAI》. 2024년 2월 16일에 원본 문서에서 보존된 문서. 2024년 2월 16일에 확인함. 
  3. Yang, Angela (2024년 2월 15일). “OpenAI teases 'Sora,' its new text-to-video AI model”. 《NBC News》. 2024년 2월 15일에 원본 문서에서 보존된 문서. 2024년 2월 16일에 확인함. 
  4. Shankar Das (2024년 2월 15일). “Sora AI Can Generate Realistic Video based on Text Prompts: OpenAI.”. 《Epi Express》. 2024년 2월 15일에 원본 문서에서 보존된 문서. 2024년 2월 16일에 확인함. 
  5. Levy, Steven (2024년 2월 15일). “OpenAI's Sora Turns AI Prompts Into Photorealistic Videos”. 《Wired》. 2024년 2월 15일에 원본 문서에서 보존된 문서. 2024년 2월 16일에 확인함. 
  6. Lacy, Lisa (2024년 2월 15일). “Meet Sora, OpenAI's Text-to-Video Generator”. 《CNET》. 2024년 2월 16일에 원본 문서에서 보존된 문서. 2024년 2월 16일에 확인함. 
  7. 영상 공개 후, 오디오 생성 AI를 개발하는 기업(가우디오랩, 일레븐랩스)들이 생성 오디오를 붙이기도 했다. 가우디오랩의 영상, 일레븐랩스의 영상
  8. Edwards, Benj (2024년 2월 16일). “OpenAI collapses media reality with Sora, a photorealistic AI video generator”. 《Ars Technica》 (미국 영어). 2024년 2월 17일에 원본 문서에서 보존된 문서. 2024년 2월 17일에 확인함. 
  9. Heaven, Will Douglas (2024년 2월 15일). “OpenAI teases an amazing new generative video model called Sora”. 《MIT Technology Review》. 2024년 2월 15일에 원본 문서에서 보존된 문서. 2024년 2월 15일에 확인함. 

외부 링크[편집]