OpenAI apresenta GPT-4, o modelo de linguagem mais secreto e ambicioso até agora.

A OpenAI, empresa de tecnologia por trás do “Chat GPT”, lançou o GPT-4, um novo modelo de linguagem natural de grande porte, que foi cogitado por grande parte do último ano. O GPT-4 é ainda maior e melhor do que o bem-sucedido ChatGPT, lançado pela empresa anteriormente. No entanto, a OpenAI não divulgou informações sobre o tamanho do novo modelo ou os motivos que o tornam melhor.

O GPT-4 é um modelo de linguagem natural multimodal, ou seja, pode responder a perguntas em texto e imagens. Por exemplo, ao fornecer uma imagem dos ingredientes na geladeira, o modelo pode sugerir receitas que usem esses ingredientes. Ele também é excelente em explicar piadas, segundo o cientista-chefe da OpenAI, Ilya Sutskever. No entanto, o acesso ao GPT-4 será limitado e disponível apenas para os usuários que se inscreverem na lista de espera e para assinantes do ChatGPT Plus em capacidade limitada somente em texto.

Embora a empresa tenha sido reservada sobre o tamanho e melhorias do GPT-4, especialistas afirmam que este modelo está em outro patamar e é o novo padrão para avaliar os modelos de linguagem natural de base. Além disso, a combinação de texto e imagens pode ajudar os modelos multimodais a entender melhor o mundo, possivelmente lidando com pontos fracos dos modelos de linguagem natural, como o raciocínio espacial.

O GPT-4 supera o ChatGPT em testes com humanos, como o Uniform Bar Exam, onde o GPT-4 se classifica no percentil 90 e o ChatGPT no percentil 10, e o Biology Olympiad, onde o GPT-4 se classifica no percentil 99 e o ChatGPT no percentil 31. Segundo Thomas Wolf, cofundador da startup de IA Hugging Face, é emocionante que a avaliação esteja sendo realizada nos mesmos benchmarks que os humanos usam para si mesmos, mas é difícil julgar a impressionante melhoria sem ver os detalhes técnicos.

A OpenAI afirma que o GPT-4 é maior e melhor do que seu modelo anterior, o GPT-3.5, devido ao aumento de parâmetros no modelo. No entanto, a empresa optou por não divulgar o tamanho do modelo e os detalhes de sua construção, algo inédito em seus lançamentos anteriores. A empresa afirma que passou seis meses tornando o GPT-4 mais preciso e seguro, usando a mesma abordagem de aprendizagem por reforço por meio de feedback humano que usou para desenvolver o ChatGPT.

Embora o GPT-4 possa ser o melhor modelo multimodal de linguagem natural já construído, não está sozinho nesse campo. Outros modelos multimodais, como o Flamingo da DeepMind, também estão sendo desenvolvidos.

Fonte: MIT