A OpenAI, empresa dona do ChatGPT, lançou o mais novo modelo que gera vídeos realistas a partir de texto, chamado de Sora.
Com o Sora, os usuários podem fazer vídeos de até um minuto de duração e adicionar cenas complexa, além de detalhes precisos desde o sujeito até o plano de fundo.
Agora, o novo modelo é a porta de entrada da OpenAI para competir com gigantes como Google e Meta, que também têm modelos semelhantes.
"O modelo tem um profundo conhecimento da linguagem, o que lhe permite interpretar com precisão as instruções e gerar personagens atraentes que expressam emoções vibrantes. Sora também pode criar várias tomadas em um único vídeo gerado que persistem com precisão os personagens e o estilo visual", descreve a OpenAI.
LIMITAÇÕES DO MODELO
A empresa aponta que o modelo atual tem pontos fracos, como a dificuldade de simular com previsão a física de uma cena complexa e não entender as instâncias específicas de causa e efeito.
Além disso, o modelo também pode confundir detalhes espaciais, misturando informações e dificuldade de interpretar descrições mais precisas de eventos que ocorrem ao longo do tempo.
SORA REPERCUTE NA WEB
Com o lançamento do modelo de difusão, a OpenAI anunciou Sora com diferentes exemplos de vídeos gerados.