O Google atualiza o Vertex AI para acompanhar o boom da IA ​​generativa

blog

LarLar / blog / O Google atualiza o Vertex AI para acompanhar o boom da IA ​​generativa

Feb 04, 2024

O Google atualiza o Vertex AI para acompanhar o boom da IA ​​generativa

Mais de metade dos CEO a nível mundial estão a experimentar a IA para gerar textos, imagens e outras formas de dados, concluiu um recente inquérito conjunto da Fortune e da Deloitte. Enquanto isso, um terço das organizações está

Mais de metade dos CEO a nível mundial estão a experimentar a IA para gerar textos, imagens e outras formas de dados, concluiu um recente inquérito conjunto da Fortune e da Deloitte. Entretanto, um terço das organizações utiliza IA generativa “regularmente” em pelo menos uma função empresarial, mostra um relatório da McKinsey.

Dado o enorme (e aparentemente crescente) mercado endereçável, não é nenhuma surpresa que o Google Cloud esteja se esforçando – muito – para se manter atualizado.

Durante sua conferência anual Cloud Next, o Google anunciou atualizações para Vertex AI, sua plataforma baseada em nuvem que fornece fluxos de trabalho para construção, treinamento e implantação de modelos de aprendizado de máquina. A Vertex AI agora apresenta modelos de IA atualizados para geração de texto, imagem e código, bem como novos modelos de terceiros de startups, incluindo Anthropic e Meta, e extensões que permitem aos desenvolvedores incorporar dados da empresa e agir em nome do usuário.

“[Com a Vertex] estamos adotando uma abordagem de ecossistema muito aberto, trabalhando com amplos parceiros de ecossistema para fornecer opções e flexibilidade aos nossos clientes”, disse June Yang, vice-presidente de IA em nuvem e soluções industriais do Google, em uma coletiva de imprensa. “Construímos uma abordagem para IA generativa com a prontidão empresarial em sua essência, com um forte foco na governança de dados, segurança responsável de IA e muito mais.”

Do lado do modelo, o Google afirma que atualizou “significativamente” seu modelo de geração de código Codey, proporcionando uma melhoria de qualidade de 25% nas “principais linguagens suportadas” para geração de código. (Infelizmente, o Google não expandiu essa métrica vaga nos materiais fornecidos a este repórter.) Também atualizou o Imagen, seu modelo de geração de imagens, para melhorar a qualidade das imagens geradas e oferecer suporte ao Style Tuning, que permite aos clientes criar imagens “alinhados à sua marca” usando apenas 10 imagens de referência.

Em outros lugares, o modelo de linguagem PaLM 2 do Google compreende novos idiomas (38 em disponibilidade geral e mais de 100 em visualização) e possui uma janela de contexto expandida de 32.000 tokens. A janela de contexto, medida em tokens (ou seja, pedaços brutos de texto), refere-se ao texto que o modelo considera antes de gerar qualquer texto adicional (32.000 tokens equivalem a cerca de 25.000 palavras, ou cerca de 80 páginas de texto, em espaço duplo).

A janela de contexto do PaLM 2 não é a maior que existe. Essa distinção vai para o Claude 2 da Anthropic, que tem uma janela de contexto de 100.000 tokens – mais de três vezes o tamanho do PaLM 2 original e do GPT-4. Mas Nenshad Bardoliwalla, líder de produto da Vertex AI, disse que a decisão de optar por 32.000 tokens foi tomada tendo em mente “flexibilidade” e “custo”.

“Nossos clientes estão se esforçando para equilibrar a flexibilidade da modelagem que são capazes de fazer com modelos grandes e os cenários que podem gerar com o custo da inferência – e com a capacidade de ajuste fino”, disse Bardoliwalla durante o briefing. “Cada um deles tem um certo custo computacional e também custos humanos dependendo de quanto você investe nele. E então sentimos neste momento que, dada a evolução do mercado, os resultados com 32.000 tokens são bastante impressionantes com base nas avaliações que fizemos. Sentimos que atingimos o equilíbrio certo entre novas capacidades e também proporcionamos relações preço-desempenho competitivas no mercado.”

Nem todo cliente concordará. Mas, na tentativa de fazer as duas coisas, o Google adicionou modelos de terceiros, incluindo Claude 2, ao Model Garden da Vertex AI, uma coleção de modelos e ferramentas pré-construídos que podem ser personalizados de acordo com as necessidades de uma empresa. Outros modelos que se juntaram ao Model Garden incluem o recém-lançado Llama 2 da Meta e o Falcon LLM de código aberto do Technology Innovation Institute.

As novas adições de modelos são um tiro certeiro no Amazon Bedrock, o produto AWS lançado recentemente pela Amazon que fornece uma maneira de construir aplicativos generativos alimentados por IA por meio de modelos pré-treinados de startups, incluindo AI21 Labs, Anthropic e Stability AI. Dada a implementação difícil da Bedrock, o Google talvez veja uma oportunidade de estabelecer uma posição segura no mercado nascente de serviços de modelo gerenciado,