오픈AI '소라(Sora)' 등장, 이제는 동영상 생성까지

연일 AI 서비스들의 출시 소식, 업데이트된 버전의 출시가 계속되고 있습니다. 그리고 OpenAI나 구글 등에서 나오는 주요 AI 서비스들의 API를 통한 여러 서비스들도 확장되고 있습니다. 이런 와중에 또 하나의 놀라운 서비스가 출시되었습니다.

2월 15일 오픈에이아이(OpenAI)는 텍스트로 프롬프트를 입력하면 고화질 동영상을 자동으로 만들어내는 생성 인공지능 서비스 '소라(Sora)'를 공개했습니다.

(URL : https://openai.com/sora#capabilities)

한계를 넘은 충격적인 동영상 생성 결과

지금까지 텍스트 입력값에 따라 동영상을 생성하거나 이미지를 입력하면 동영상으로 변환하는 인공지능 서비스가 있었지만, 품질이나 생성된 동영상의 시간이 짧은 한계가 있었습니다. 이번에 공개된 Sora는 ChatGPT를 사용하듯 프롬프트를 입력하면, 최대 1분 길이의 고화질 영상을 곧 만들어냅니다. 거기다 오픈에이아이가 게시한 Sora가 생선한 예시 동영상들을 보면, 품질도 꽤나 자연스럽습니다. 충분히 사용자가 원하는 내용을 표현하는 동영상으로 바로 사용할 수 있을 정도의 품질을 보여주고 있습니다.

< 아름다운 도시에서의 서핑 >

프롬프트 : 화려한 장식으로 유명한 문화유산 공간 속에서 거대한 파도가 높이 솟아올랐다가 부서지기 시작합니다. 순간을 포착한 두 명의 서퍼가 능숙하게 파도를 해쳐나갑니다. (OpenAI 제공)

'Sora', 무한한 창의성을 꿈꾸며 '하늘'이라는 뜻 담아

오픈에이아이는 "우리는 인공지능이 움직이는 물리적 세상을 이해하도록 학습시켜왔다"며, 일본어로 '하늘'을 의미하는 'Sora'에 대해 "무한한 창의성을 떠올리게 하기 위해서"라고 밝혔습니다. Sora는 동영상에 등장하는 여러 인물과 특정 동작 형태, 동영상의 장소 배경 및 장면에 대한 묘사 등을 최대 1분 길이의 동영상으로 빠르게 만들어낼 수 있습니다. (다만, 오픈AI가 예시로 홈페이지에 올린 영상 중 가장 긴 시간은 17초)

오픈에이아이는 "Sora는 언어를 깊이 이해하고 있어서 요구사항을 정확하게 해석하고 생생한 감정을 표현하는 매력적인 캐릭터를 생성할 수 있다"고 밝혔습니다.

< Tokyo-walk >

Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.

현재 Sora 서비스는 누구나 사용할 수 없습니다. 오픈에이아이는 Sora를 '레드팀(위험기술)'로 분류해서, 동영상 생성으로 인한 중요한 영역에 대한 피해나 오용의 가능성을 연구하고 있습니다. 다만, Sora의 인공지능 모델을 발전시키기 위해 한정된 시각 예술가, 디자이너 및 영화 제작자에게 엑세스 권한을 부여하고 피드백을 얻고 있습니다.

아직 일반 사용자로서 Sora를 사용할 수 없는 부분은 아쉽지만, 오픈에이아이는 여러 전문가 집단의 피드백을 받아 개선된 Sora의 결과들을 지속적으로 공유할 것을 밝히고 있기 때문에 대중 서비스로 출시될 때까지 기다를 수 있을 것 같습니다.

식은땀 흘릴 애니메이션 업계

현재 Sora가 홈페이지에 공개한 결과물만으로도 애니메이션 또는 동영상 촬영 업계에 출 수 있는 충격은 상당할 것으로 생각이 됩니다. 미국의 정보기술매체 '와이어드'의 보도를 보면 이러한 업계에 대한 전망은 아주 허황된 것만은 아닌 것처럼 보입니다. Sora는 픽사와 비슷한 애니메이션 캐릭터를 생성한 예시 동영상을 게시 했는데, 그 움직임과 캐릭터의 질감이 픽사가 구현한 몬스터 캐릭터와 비슷한 모습을 보여주고 있습니다.

와이어드의 Steven Levy 에디터는 "픽사가 '몬스터주식회사'를 제작할 때 괴물의 털 질감 제작의 매우 복잡한 특성을 생성하기 위해 오랜 시간 공들였다. 오픈AI가 새로이 선보인 텍스트 기반 영상 변환 툴은 픽사도 어려움을 겪었던 작업을 순식간에 해냈다"라고 평하고 있습니다.

이와 관련하여, Sora 프로젝트 연구 과학자 Tim Brooks는 털복숭이 괴물의 털 질감을 표현하기 위한 작업을 이야기하면서 "AI 모델은 3D 기하학과 일관성을 학습했다. 프로젝트팀은 별도로 털의 질감을 구현하는 AI 모델 훈련 및 개발 작업을 하지 않닸다. 모두 다량의 훈련 데이터에서 등장한 듯했다"라고 말했습니다.

< Monster with melting candle >

Prompt: Animated scene features a close-up of a short fluffy monster kneeling beside a melting red candle. The art style is 3D and realistic, with a focus on lighting and texture. The mood of the painting is one of wonder and curiosity, as the monster gazes at the flame with wide eyes and open mouth. Its pose and expression convey a sense of innocence and playfulness, as if it is exploring the world around it for the first time. The use of warm colors and dramatic lighting further enhances the cozy atmosphere of the image.

당연히 Sora가 어느날 모두가 사용할 수 있는 서비스로 출기가 되겠지만, 이를 사용해서 픽사가 만들어내는 훌륭한 영상 작품을 만들어낼 수는 없을 것입니다. 하지만, 가진 비용이 충분하지 않은 영화감독 지망생이나 자신이 가진 스토리나 영감을 동영상으로 빠르고 자유롭게 구현해보고 싶은 모든 사람들에게는 아주 유용한 도구가 될 것임에는 틀림없을 것입니다.

주요 장면은 직접 촬영을 하고, 드론샷이나 여러 물리적이나 경제적 문제로 실제 촬영이 힘든 장면은 Sora와 같은 동영상 생성 AI 서비스를 활용하여 전체 컨텐츠를 완성해 나갈 수 있을 것입니다.

우리를 위한 로그

오픈AI '소라(Sora)' 등장, 이제는 동영상 생성까지

'Sora', 무한한 창의성을 꿈꾸며 '하늘'이라는 뜻 담아

식은땀 흘릴 애니메이션 업계

티스토리툴바