Está curioso sobre as últimas novidades no OpenAI Multi-Model GPT 4? Então, poderá estar interessado em conhecer a entrada de imagem GPT-4, uma nova funcionalidade que permite o processamento simultâneo de entradas de imagem e de texto.
A capacidade multimodal do GPT-4 pode processar vários tipos e tamanhos de imagens, incluindo documentos com texto e fotografias, diagramas desenhados à mão e capturas de tela. Com essa funcionalidade, o modelo pode receber entradas tanto de texto quanto visuais, e gerar uma saída tão capaz quanto entradas apenas de texto.
Neste artigo, exploraremos as possibilidades de entrada de imagem do GPT-4, a tecnologia por trás dela e como ela pode ser tornada possível.
Entrada de imagem do GPT 4 e a tecnologia
Então, o que pode o GPT-4 fazer? Bem, você pode introduzir uma imagem única juntamente com um conjunto de instruções claras, perguntas ou opiniões e receber uma resposta estruturada que utiliza ambos conjuntos de dados como entrada. Isto abre uma grande variedade de possibilidades, desde pedir ao GPT-4 para compreender o contexto de uma imagem até analisar dados apresentados num gráfico.
Por exemplo, você pode inserir uma imagem de um padrão de formas e perguntar ao GPT-4 qual forma completa o padrão. A habilidade do GPT-4 de interpretar e entender imagens é um avanço significativo no campo da IA. Durante uma transmissão ao vivo organizada por desenvolvedores da OpenAI, o GPT-4 demonstrou sua capacidade de descrever uma captura de tela de uma janela do Discord com grande detalhe.
O modelo demorou um pouco mais de um minuto para processar a entrada e gerou uma resposta extremamente precisa e descritiva. A resposta capturou quase todos os elementos da tela de entrada, desde o nome do servidor no canto superior esquerdo até os diferentes canais de voz, e até mesmo nomeou todos os membros do Discord online na barra lateral direita.
Num exemplo para mostrar as capacidades de entrada e processamento de imagem do GPT-4, a revisão técnica GPT-4 da OpenAI apresentou um exemplo do popular meme, "Mapa-múndi feito de nuggets de frango". O GPT-4 foi capaz de interpretar a imagem e gerar uma resposta precisa que capturou o humor e a inesperada justaposição do texto e da imagem.
Identificou o meme como uma piada que combinava duas coisas sem relação e explicou que a imagem na verdade era de nuggets de frango dispostos para se assemelharem a um mapa do mundo. A capacidade do GPT-4 de processar entradas visuais e textuais e gerar uma saída estruturada demonstra seu imenso potencial em várias aplicações, desde análise de mídia até monitoramento de mídias sociais e além.
- Pode ver mais acerca do mais recente projeto da OpenAI aqui.
O input de imagens do GPT 4 funciona com o ChatGPT?
Atualmente, o ChatGPT Plus alimentado pelo GPT-4 não permite que os usuários insiram imagens por meio da interface do usuário. À medida que o GPT-4 continua a ser treinado e desenvolvido, espera-se que suas capacidades de processamento de imagem melhorem. Existe a possibilidade de que essa funcionalidade possa ser adicionada no futuro, mas não podemos falar sobre os planos da OpenAI com o serviço. Por enquanto, estamos cientes de que a funcionalidade de entrada de imagem do GPT-4 não está ainda disponível para o público em geral.
A Open AI não está a oferecer o serviço de entrada de imagem para o GPT 4 neste momento, no entanto, esta é uma questão comum. Já houve bastante interesse em torno da entrada de imagem, por isso é possível que uma funcionalidade surja num futuro próximo para satisfazer a procura.
Então, quais são as nossas opções e como inserir uma imagem no ChatGPT? Uma maneira de tentar inserir imagens no ChatGPT é através de prompts.
Como usar a entrada de imagem do GPT 4
No momento da escrita, a entrada de imagens GPT-4 não está disponível ao público em geral. Apesar do ChatGPT Plus ser baseado na estrutura do GPT-4, ainda não possui a capacidade de processar prompts baseados em imagens. O fato de a OpenAI exibir as capacidades multimodais do GPT-4 sugere que eles pretendem tornar essa função disponível no futuro.
Atualmente, a única maneira de acessar as capacidades de processamento de imagem do GPT 4 é através da API do GPT-4, que está disponível apenas para desenvolvedores. Estamos com os dedos cruzados na esperança de que a entrada de imagem esteja disponível para todos em breve!
O ChatGPT cria imagens?
Não, isso não é o que o ChatGPT é. É uma ferramenta simples de geração de texto. Como mencionado, o ChatGPT tem a capacidade de sugerir o prompt perfeito para o que você pode precisar ao usar uma ferramenta como Midjourney ou DALL-E. Faz sentido assumir que haverá uma ferramenta abrangente no futuro que permita uma variedade de entradas e entregue uma variedade de saídas de volta, mas ainda não há menção disso em nenhum lugar.
Pode o ChatGPT criar arte?
Como mencionado anteriormente, se estamos a falar de arte visual, infelizmente o ChatGPT não é adequado para isso. O ChatGPT é atualmente um chatbot inteiramente baseado em texto, o que significa que não pode introduzir imagens nem esperar que o software as crie para si. No entanto, você poderia usar o ChatGPT em conjunto com software de imagens com IA, usando o ChatGPT para criar desafios e, em seguida, introduzi-los em outro programa. O ChatGPT é também um recurso fantástico para ajudar a aprimorar as suas próprias ideias para a arte. Se você está com dificuldades para obter inspiração, poderia pedir ao ChatGPT para lhe dar algumas ideias e, em seguida, continuar a usar o software para aprimorar uma dessas ideias.
Se estivermos a falar de arte no sentido mais amplo do termo, algumas pessoas argumentariam que sim, o ChatGPT é capaz de criar arte. Muitas pessoas têm usado ChatGPT para criar poesia e também para ajudar a escrever música. Se as suas sugestões forem específicas o suficiente, poderá surpreender-se com a habilidade do chatbot de inteligência artificial em escrever versos.
Em que áreas o GPT 4 tem sido usado até agora?
- ChatGPT Plus
- Duolingo
- Miðeind ehf
- Khan Academy
- Be My Eyes
- GitHub Copilot
- Microsoft Bing
- Microsoft 365 Copilot
Pode ler mais sobre as aplicações acima e como o GPT 4 está a ser implementado aqui.
Como aceder ao GPT 4?
O GPT 4 é uma ferramenta de desenvolvimento disponível apenas para aqueles que se inscreveram no ChatGPT Plus. Você precisará entrar em uma lista de espera, que a OpenAI exige que você se inscreva.
O GPT 4 é gratuito?
O GPT 4 requer uma assinatura mensal do ChatGPT Plus para acesso, no entanto, no momento não exige mais nada além disso.